40 самых популярных вопросов и ответов на собеседовании по ElasticSearch

Anonim

Вот вопросы для собеседований с эластичным поиском как для более свежих, так и для опытных кандидатов.

1) Что такое Elasticsearch?

Elasticsearch - это база данных NoSQL. Он основан на поисковой системе Lucene и построен на RESTful APIS. Он предлагает простое развертывание, максимальную надежность и легкое управление. Он также предоставляет расширенные запросы для выполнения подробного анализа и централизованно хранит все данные. Это помогает выполнить быстрый поиск документов.

2) Каковы важные особенности Elasticsearch?

Вот важные особенности Elasticsearch:

  • Поисковый сервер с открытым исходным кодом, написанный на Java.
  • Используется для индексации любых разнородных данных
  • Имеет веб-интерфейс REST API с выводом в формате JSON
  • Полнотекстовый поиск
  • Поиск в режиме, близком к реальному времени (NRT)
  • Раздробленное, реплицированное хранилище документов JSON с возможностью поиска.
  • Распределенное хранилище документов на основе REST и JSON без схемы
  • Поддержка нескольких языков и геолокации

3) Что такое кластер?

Кластер - это совокупность узлов, которые вместе содержат данные и предоставляют возможности совместного индексирования и поиска.

4) Объясните указатель

Узел - это экземпляр эластичного поиска. Он создается при запуске экземпляра elasticsearch.

5) Что такое документ в Elastic Search?

В эластичном поиске документ - это базовая единица информации, которую можно проиндексировать. Он выражается в паре JSON (ключ: значение). '{"пользователь": "nullcon"}'. Каждый документ связан с типом и уникальным идентификатором.

6) Определите Term Shard

Каждый индекс можно разделить на несколько сегментов, чтобы иметь возможность распространять данные. Осколок - это атомарная часть индекса, которая может быть распределена по кластеру, если вы хотите добавить больше узлов.

7) Каковы важные преимущества эластичного поиска?

Вот важные преимущества Elasticsearch:

  • Храните данные без схемы, а также создает схему для ваших данных.
  • Управляйте записью данных за записью с помощью многодокументных API
  • Выполняйте фильтрацию и запрашивайте данные для анализа
  • Основан на Apache Lucene и предоставляет RESTful API.
  • Он обеспечивает горизонтальную масштабируемость, надежность и возможность использования нескольких арендаторов для индексирования в реальном времени.
  • Помогает масштабировать по вертикали и горизонтали

8) Что такое стек ELK?

ELK Stack - это набор из трех продуктов с открытым исходным кодом - Elasticsearch, Logstash и Kibana. Все они разрабатываются, управляются и обслуживаются компанией Elastic.

  • E означает ElasticSearch : он используется для хранения журналов.
  • L означает LogStash: он используется как для доставки, так и для обработки и хранения журналов.
  • K означает Kibana: это инструмент визуализации (веб-интерфейс), размещенный на Nginx или Apache.

9) Объясните архитектуру стека ELK

ELK Stack предназначен для того, чтобы пользователи могли получать данные из любого источника в любом формате, а также искать, анализировать и визуализировать эти данные в режиме реального времени.

  • Журналы: идентифицируются журналы сервера, которые необходимо проанализировать.
  • Logstash: собирать журналы и данные о событиях. Он даже анализирует и преобразует данные.
  • ElasticSearch: преобразованные данные из Logstash - это магазин, поиск и индексирование.
  • Kibana: Kibana использует Elasticsearch DB для изучения, визуализации и обмена

10) В чем причина использования стека ELK?

Вот причины для использования стека ELK:

  • ELK работает лучше всего, когда журналы из различных приложений предприятия объединяются в один экземпляр ELK.
  • Он обеспечивает потрясающую аналитическую информацию для этого единственного экземпляра, а также устраняет необходимость входа в сотни различных источников данных журналов.
  • Быстрая установка на месте
  • Легко развернуть Весы вертикально и горизонтально
  • Elastic предлагает множество языковых клиентов, включая Ruby. Python. PHP, Perl, .NET, Java, JavaScript и др.
  • Наличие библиотек для разных языков программирования и скриптов.

11) Объясните Tokenizer в ElasticSearch

Поля разбивки токенизатора, которые содержат значения документа в потоке. Инвертированные индексы создаются и обновляются с использованием этих значений. После этого этот поток значений сохраняется в документе.

12) Что такое реплика в ElasticSearch?

Каждый осколок в ElasticSearch имеет 2 копии, которые называются репликами. Они помогают обеспечить высокую доступность и отказоустойчивость.

13) Какие основные операции вы можете выполнять с документом?

Вот важные операции, выполняемые с документами:

  • Индексирование документа
  • Получение документов
  • Обновление документов
  • Удаление документов

14) Что такое кластер в Elasticsearch?

Кластер - это набор из одного или нескольких узлов, который содержит все ваши данные и предлагает возможности интегрированного индексирования и поиска по всем узлам.

15) Как удалить индекс в эластичном поиске?

Чтобы удалить индекс в Elasticsearch, Вам необходимо написать команду:

 DELETE /index name. 

Например, УДАЛИТЬ / веб-сайт.

16) Объясните метод добавления сопоставления в указатель

Elasticsearch позволяет создавать сопоставление в соответствии с данными, предоставленными пользователем в теле запроса. Его массовая функция может использоваться для добавления более одного объекта JSON в индекс.

Например, сайт POST / _bulk.

17) Какие существуют способы поиска в Elasticsearch?

Ниже приведен способ поиска в Elasticsearch:

Мультииндексный, мультииндексный поиск: вы можете искать API, которые могут применяться по всем множественным индексам, используя систему поддержки мультииндекса.

В эластичном поиске мы можем создавать определенные теги для всех индексов, для всех индексов и всех типов.

  • Поиск URI: поисковый запрос выполняется с использованием URI путем предоставления запрошенных параметров.
  • Поиск тела запроса: поисковый запрос должен выполняться поисковым DSL. Он включает в себя запрос DSL в теле.

18) Какая последняя версия Elasticsearch?

Самая последняя версия Elastic Search за январь 2020 г., это последняя и стабильная версия Elasticsearch.

19) Что такое картографирование?

Сопоставление - это процесс, который помогает вам определить, как документ сопоставляется с поисковой системой. Его характеристики для поиска включены, поля токенизированы, а также доступны для поиска.

20) Где хранится эластичный поиск?

Вы можете хранить Elasticsearch - это распределенный документ, представляющий собой хранилище с различными типами каталогов. Вы также можете получить сложные структуры данных, которые можно сериализовать как документы JSON.

21) Что такое Apache Lucene?

Apache Lucene - это библиотека программного обеспечения для поиска информации с открытым исходным кодом. Первоначально он написан на языке Java.

22) Вот важные инструменты управления конфигурацией, поддерживаемые Elasticsearch:

  • Марионетка - puppet-elasticsearch
  • Повар - поваренная книга-elasticsearch
  • Ansible - эластичный поиск по анзиблю

23) Что такое NRT в Elasticsearch?

NRT - это полная форма платформы (поиска в реальном времени). Это поисковая платформа в режиме, близком к реальному времени. Это означает, что существует небольшая задержка (в основном одна секунда) с момента индексирования документа до тех пор, пока он не станет доступным для поиска.

24) Где вы настраиваете параметры для X-Pack?

Вы можете настроить параметры для X-Pack. Он имеет функции в файлах конфигурации elasticsearch, logstash и kibana.yml (стек ELK).

25) Что такое cat API в Elasticsearch?

Эти команды принимают параметр строки запроса. Это помогает увидеть всю информацию, заголовки и информацию, которую они предоставляют, а также команду / _cat, которая позволяет вам перечислить все доступные команды.

26) Какие различные команды доступны в Elasticsearch cat API?

Команды, использующиеся с cat API:

  • Псевдонимы кошек, распределение кошек, количество кошек, данные поля кошек
  • Здоровье кошки, индексы кошек, хозяин кошек, незавершенные задачи, плагины для кошек, восстановление кошек
  • репозитории кошек, снимки кошек, шаблоны кошек

27) Что такое узел Ingest?

Узел Ingest используется для предварительной обработки документов до того, как произойдет фактическое индексирование документа. Это помогает вам перехватывать массовые и индексные запросы. Он также применяет преобразования, а затем передает документы обратно в массовый API и индекс.

28) Каковы различные способы использования команд X-Pack?

Вот команды X-Pack, которые помогут вам настроить безопасность:

  • Certgen
  • мигрировать
  • syskeygen
  • Certutil
  • самл-метаданные
  • установка-пароли
  • пользователи

29) Что такое API одного документа в Elasticsearch?

  • Получить API
  • Индекс API
  • Удалить API
  • Обновить API

30) Объясните API исследования в Elasticsearch

API-интерфейс Graph explore позволяет извлекать и обобщать информацию о документах.

31) Как создать индекс в Elasticsearch?

Например:

ПОСТАВИТЬ / клиент?

GET / _cat / индексы? V

32) Что такое агрегаты?

Платформа агрегирования помогает предоставлять агрегированные данные на основе поискового запроса. Он основан на простых строительных блоках, известных как агрегаты. Его можно составить для построения сложных сводок данных.

33) Есть ли у Elasticsearch схема?

Сопоставления ElasticSearch, которые можно использовать для принудительного применения схемы к документам.

34) Что такое Query DSL в Elasticsearch?

Elasticsearch предлагает полный DSL запросов (язык, специфичный для домена) на основе JSON для определения запросов.

35) Что такое узел данных Elasticsearch?

Узлы данных содержат сегменты, которые обрабатывают проиндексированные документы. Они помогают выполнять операции CRUD, связанные с данными, операции агрегирования поиска и т. Д. Однако вам необходимо установить node.data = true, чтобы сделать node в качестве узла данных.

36) Что такое документ в ElasticSearch?

Документ очень похож на строку в реляционных базах данных. Каждый документ в индексе имеет разную структуру, но имеет один и тот же тип данных для соответствующих полей.

  • MySQL => Базы данных => Таблицы => Столбцы / Строки
  • ElasticSearch => Индексы => Типы => Документы со свойствами

37) Объясните тип в ElasticSearch

Тип - это логический раздел индекса, семантика которого зависит от пользователя.

38) Какой язык запросов в Elasticsearch?

Язык запросов Apache Lucene, также известный как Query DSL, используется Elasticsearch.

39) Что такое динамическое отображение в Elasticsearch?

Динамическое сопоставление помогает пользователю индексировать документы без нежелательных настроек имени поля. Вместо этого он будет добавлен автоматически через Elasticsearch с некоторыми настраиваемыми правилами.

40) Что такое нечеткий поиск Elasticsearch?

Нечеткий поиск - это процесс, в котором необходимо идентифицировать расположение документов веб-страницы. Это похоже на аргумент поиска. Это также работает, когда аргумент не имеет отношения к поисковому корреспонденту для конкретной информации.