В HBase мы можем создавать операции с таблицами двумя способами.
- Команда оболочки
- JAVA API
Мы научимся использовать и то, и другое для создания таблиц.
- HBase Создать таблицу с Java API
- HBase Создать таблицу с помощью Shell
HBase создать таблицу с Java API
В этом разделе мы собираемся выполнить некоторые операции, используя Java-кодирование через Java API.
Через Java API мы можем создавать таблицы в HBase, а также загружать данные в таблицы, используя кодирование Java.
- Установление соединения с HBase через Java API
- Использование Eclipse для программирования, отладки и тестирования Java
Установление соединения через Java API:
Следующие шаги помогут нам разработать код Java для подключения HBase через Java API.
Шаг 1) На этом шаге мы собираемся создать проект Java в eclipse для подключения HBase.
Создание нового имени проекта «HbaseConnection» в eclipse.
Для проекта, связанного с Java, установка или создание программы
Если мы посмотрим на скриншот выше.
- Укажите название проекта в этом поле. В нашем случае у нас есть название проекта «HbaseConnection».
- Установите этот флажок, чтобы сохранить местоположение по умолчанию. В этом / home / hduser / work / HbaseConnection находится путь
- Установите здесь флажок для среды Java. В этом JavaSE-1.7 - это версия Java
- Выберите свой вариант, где вы хотите сохранить файл. В нашем случае мы выбрали второй вариант «Создать отдельную папку для исходников и файлов классов».
- Нажмите на кнопку «Готово».
- Когда вы нажимаете кнопку «Готово», в eclipse создается проект «HbaseConnection».
- Он сразу перейдет на домашнюю страницу eclipse после нажатия кнопки завершения.
Шаг 2) На домашней странице eclipse выполните следующие действия.
Right click on project -> Select Build Path -> Configure build path
Сверху снимок экрана
- Щелкните правой кнопкой мыши проект
- Выберите путь сборки
- Выберите настроить путь сборки
После нажатия кнопки «Настроить путь сборки» откроется другое окно, как показано на снимке экрана ниже.
На этом этапе мы добавим соответствующие jar-файлы HBase в java-проект, как показано на снимке экрана.
- Важные jar-файлы, которые нужно добавить hbase-0.94.8.jar, hadoop-core-1.1.2.jar
- Нажмите на кнопку "Готово"
- Приходите в библиотеки
- Опция для прессы - Добавить внешние банки
- Выберите необходимые важные банки
- Нажмите кнопку «Готово», чтобы добавить эти файлы в «src» проекта Java в библиотеках.
После добавления этих jar-файлов он будет отображаться в папке проекта "src". Все файлы Jar, подпадающие под проект, теперь готовы к использованию с экосистемой Hadoop.
Шаг 3) На этом шаге с использованием HBaseConnection.java соединение HBase будет установлено с помощью Java Coding.
- В верхнем меню Eclipse выполните java-программу, как показано ниже.
Выполнить -> Запуск от имени -> Приложение Java
- Выберите Выполнить
- Выберите Запуск от имени Java-приложения.
- Этот код установит соединение с HBase через Java API.
- После запуска этого кода в HBase будет создана таблица 'guru99' с двумя семействами столбцов с именами «образование» и «проекты». В настоящее время пустая схема создается только в HBase.
На скриншоте выше мы выполняем следующие функции.
- Используя HTableDescriptor, мы можем создать таблицу "guru99" в HBase.
- Используя метод addFamily, мы добавим «education» и «projects» в качестве имен столбцов в таблицу «guru99».
Приведенная ниже кодировка будет
- Установите соединение с HBase и
- Создайте таблицу "guru99" с двумя столбцами
Код помещен в документ HBaseConnection_Java
// Place this code inside Hbase connectionimport java.io.IOException;import org.apache.hadoop.conf.Configuration;import org.apache.hadoop.hbase.HBaseConfiguration;import org.apache.hadoop.hbase.HColumnDescriptor;import org.apache.hadoop.hbase.HTableDescriptor;Import org.apache.hadoop.hbase.client.HBaseAdmin;public class HBaseConnection{public static void main(String[] args) throws IOException{HBaseConfigurationhc = new HBaseConfiguration(new Configuration());HTableDescriptorht = new HTableDescriptor("guru99");ht.addFamily( new HColumnDescriptor("education"));ht.addFamily( new HColumnDescriptor("projects"));System.out.println( "connecting" );HBaseAdminhba = new HBaseAdmin( hc );System.out.println( "Creating Table" );hba.createTable( ht );System.out.println("Done… ");}}
Это обязательный код, который вы должны поместить в HBaseConnection.java и запустить Java-программу.
После запуска этой программы она установит соединение с HBase и, в свою очередь, создаст таблицу с именами столбцов.
- Имя таблицы - "guru99".
- Названия столбцов - «образование» и «проекты».
Шаг 4) Мы можем проверить, создана ли таблица «guru99» с двумя столбцами в HBase или нет, используя режим оболочки HBase с командой «list».
Команда «list» предоставляет информацию обо всех таблицах, созданных в HBase.
На этом экране мы собираемся сделать
- Проверка кода в оболочке HBase с помощью команды «list».
- Если мы запустим команду «list», она отобразит таблицу, созданную в HBase, как показано ниже. В нашем случае мы видим, что таблица "guru99" создана.
HBase Создать таблицу с помощью Shell
Синтаксис для создания таблицы:
Syntax: create,
Пример:-
hbase(main):001:0> create 'education' ,'guru99'0 rows(s) in 0.312 seconds=>Hbase::Table - education
В приведенном выше примере объясняется, как создать таблицу в HBase с указанным именем, указанным в соответствии со словарем или спецификациями в соответствии с семейством столбцов. В дополнение к этому, мы также можем передать в него некоторые атрибуты области видимости таблицы.
create 'guru99', {NAME=>'Edu', VERSIONS=>213423443}
Резюме:
HBase - это база данных NoSQL с ориентацией на столбцы для хранения большого количества данных поверх экосистемы Hadoop. Обработка таблиц в HBase - очень важная вещь, потому что все важные функции, такие как операции с данными, улучшения данных и моделирование данных, мы можем выполнять только с помощью таблиц в HBase. Таблицы выполняют следующие функции 1) Создание таблиц с именами столбцов и строк 2) Вставка значений в таблицы 3) Получение значений из таблиц