30 самых популярных вопросов на собеседовании Hbase & Ответы

Anonim

Скачать PDF

Ниже приведены часто задаваемые вопросы в интервью для новичков, а также для опытных разработчиков HBase.

1) Объясните, что такое Hbase?

Hbase - это система управления базами данных, ориентированная на столбцы, которая работает поверх HDFS (Hadoop Distribute File System). Hbase не является реляционным хранилищем данных и не поддерживает язык структурированных запросов, такой как SQL.

В Hbase главный узел регулирует серверы кластера и региона для хранения частей таблиц и управляет работой с данными.

2) Объясните, зачем использовать Hbase?

  • Система хранения большой емкости
  • Распределенный дизайн для обслуживания больших столов
  • Колоночные магазины
  • Горизонтально масштабируемый
  • Высокая производительность и доступность
  • Базовая цель Hbase - миллионы столбцов, тысячи версий и миллиарды строк.
  • В отличие от HDFS (распределенная файловая система Hadoop), он поддерживает случайные операции CRUD в реальном времени.

3) Назовите ключевые компоненты Hbase?

  • Zookeeper: координирует работу клиента и Hbase Maser.
  • Hbase Master: Hbase Master контролирует сервер региона
  • RegionServer: RegionServer контролирует регион
  • Регион: он содержится в хранилище данных памяти (MemStore) и Hfile.
  • Таблицы каталога: таблицы каталога состоят из ROOT и META.

4) Объясните, из чего состоит Hbase?

  • Hbase состоит из набора таблиц
  • И каждая таблица содержит строки и столбцы, как в традиционной базе данных.
  • Каждая таблица должна содержать элемент, определенный как первичный ключ.
  • Столбец Hbase обозначает атрибут объекта

5) Назовите сколько рабочих команд в Hbase?

Оперативная команда в Hbases бывает пяти видов.

  • Получать
  • Положить
  • Удалить
  • Сканировать
  • Инкремент

6) Объясните, что такое WAL и Hlog в Hbase?

WAL (Write Ahead Log) аналогичен журналу MySQL BIN; он записывает все изменения, происходящие в данных. Это стандартный файл последовательности от Hadoop, в котором хранятся файлы HLogkey. Эти ключи состоят из порядкового номера, а также фактических данных и используются для воспроизведения еще не сохраненных данных после сбоя сервера. Таким образом, в случае сбоя сервера WAL работает как линия жизни и восстанавливает потерянные данные.

7) Когда следует использовать Hbase?

  • Размер данных огромен: когда у вас есть тонны и миллионы записей для работы
  • Полная переработка: когда вы переносите СУБД на Hbase, вы рассматриваете это как полную переработку, а не просто изменение портов.
  • Команды без SQL: у вас есть несколько функций, таких как транзакции; внутренние соединения, типизированные столбцы и т. д.
  • Инвестиции в инфраструктуру: вам нужно иметь достаточно кластера, чтобы Hbase был действительно полезным

8) Что такое семейства столбцов в Hbase?

Семейства столбцов составляют базовую единицу физической памяти в Hbase, к которой применяются такие функции, как сжатие.

9) Объясните, что такое ключ строки?

Ключ строки определяется приложением. Поскольку комбинированный ключ предварительно фиксируется клавишей строки, он позволяет приложению определять желаемый порядок сортировки. Это также позволяет логически группировать ячейки и следить за тем, чтобы все ячейки с одним и тем же ключом строки находились на одном сервере.

10) Объясните удаление в Hbase? Упомяните, какие три типа маркеров надгробий в Hbase?

Когда вы удаляете ячейку в Hbase, данные фактически не удаляются, но устанавливается маркер захоронения, что делает удаленные ячейки невидимыми. Удаленные Hbase фактически удаляются во время уплотнения.

Существуют три типа маркеров надгробий:

  • Маркер удаления версии: для удаления он отмечает одну версию столбца.
  • Маркер удаления столбца: для удаления он отмечает все версии столбца.
  • Маркер удаления семейства: для удаления он отмечает все столбцы для семейства столбцов.

11) Объясните, как Hbase действительно удаляет строку?

В Hbase все, что вы пишете, будет сохранено из ОЗУ на диск, эти записи на диск являются неизменными, запрещая сжатие. Во время процесса удаления в Hbase основной процесс уплотнения удаляет маркер, а второстепенный - нет. При обычном удалении это приводит к появлению маркера удаления-захоронения - эти данные удаления, которые они представляют, удаляются во время уплотнения.

Кроме того, если вы удалите данные и добавите больше данных, но с более ранней меткой времени, чем метка времени захоронения, дальнейшие Gets могут быть замаскированы маркером удаления / захоронения, и, следовательно, вы не получите вставленное значение до тех пор, пока не будет выполнено основное уплотнение.

12) Объясните, что произойдет, если вы измените размер блока семейства столбцов в уже занятой базе данных?

Когда вы изменяете размер блока семейства столбцов, новые данные занимают новый размер блока, а старые данные остаются в пределах старого размера блока. Во время сжатия данных старые данные будут принимать новый размер блока. Новые файлы по мере их очистки имеют новый размер блока, тогда как существующие данные будут по-прежнему считываться правильно. Все данные должны быть преобразованы в новый размер блока после следующего крупного сжатия.

13) Укажите разницу между Hbase и реляционной базой данных?

Hbase Реляционная база данных
  • Без схемы
  • Это хранилище данных, ориентированное на столбцы
  • Он используется для хранения ненормализованных данных
  • Он содержит редко заполненные таблицы
  • Автоматическое разбиение на разделы сделано в Hbase
  • Это база данных на основе схемы
  • Это хранилище данных, ориентированное на строки
  • Он используется для хранения нормализованных данных
  • Он содержит тонкие таблицы
  • Нет такой возможности или встроенной поддержки для разбиения на разделы.

14) Что такое класс HBaseFsck?

В HBase есть инструмент, который называется обратно и реализуется классом HBaseFsck. Он предлагает несколько переключателей командной строки, которые влияют на его поведение.

15) Каковы основные ключевые структуры HBase?

Ключ строки и ключ столбца - две наиболее важные ключевые структуры, используемые в HBase.

16) Обсудите, как можно использовать фильтры в Apache HBase.

Фильтры в оболочке HBase. Он был представлен в Apache HBase 0.92, который помогает выполнять фильтрацию на стороне сервера для доступа к HBase через оболочку HBase или экономию.

17) Синтаксическая структура поддержки HBase, такая как SQL да или нет?

Нет, к сожалению, поддержка SQL для HBase в настоящее время недоступна. Однако, используя Apache Phoenix, мы можем получать данные из HBase с помощью SQL-запросов.

18) Что означает уплотнение в HBase?

Во время интенсивной входящей записи невозможно достичь оптимальной производительности, имея один файл на хранилище. HBase помогает объединить все эти H-файлы, чтобы уменьшить количество начальных значений диска при каждом чтении. Этот процесс известен как уплотнение в HBase.

19) Как вы будете реализовывать объединения в HBase?

HBase не поддерживает соединения напрямую, но использует задания MapReduce. Запросы на соединение могут быть реализованы путем извлечения данных с помощью различных таблиц HBase.

20) Объясните JMX относительно HBSE

Java Management Extensions или JMX - статус экспорта Java-приложений является для них стандартом.

21) Какая польза от MasterServer?

Мастер-сервер также помогает назначить регион региональному серверу. Это также поможет вам справиться с балансировкой нагрузки, которую мы используем MasterServer.

22) Определите термин сберегательный

Apache Thrift написан на C ++. Он предоставляет компиляторы схем для различных языков программирования, таких как C ++, Perl, PHP, Python, Ruby и других.

23) Зачем использовать класс HColumnDescriptor?

Подробные сведения о семействе столбцов, такие как настройки сжатия и количество версий, хранятся в HColumnDescriptor.

24) Что такое клетка в HBase?

Ячейка в HBase - это наименьшая единица таблицы Hbase. Это помогает вам хранить часть данных в виде кортежа {строка, столбец, версия}

25) Что такое фильтр Блума?

HBase поддерживает фильтр Блума, который помогает повысить общую пропускную способность кластера. Фильтр цветения HBase - это компактный механизм для проверки того, содержит ли HFile определенную строку или ячейку строки-столбца.

26) Расскажите о типах операций HBase?

Ответ Два типа операций HBase:

  • Читать операцию
  • Запись Операция

27) Какая польза от HBase HMaster?

Основные обязанности мастера:

  1. Координация серверов региона
  2. Функции администратора

28) Какую технику можно использовать в HBase для прямого доступа к HFile без помощи HBase?

Для прямого доступа к HFile без использования HBase мы используем метод HFile.main ().

29) Может региональный сервер будет располагаться на всех DataNodes?

Да, серверы регионов работают на тех же серверах, что и узлы данных.

30) Назовите фильтр, который принимает размер страницы в качестве параметра в HBase.

Фильтр с именем PageFilter принимает размер страницы в качестве параметра.

Этот документ был составлен с помощью инструментов мгновенного преобразования HTML.