50 самых популярных вопросов для собеседований по Teradata Ответы

Anonim

Скачать PDF

1) Как вы определяете Терадата? Приведите некоторые из основных характеристик того же самого.

Teradata - это в основном RDMS, которая используется для управления Datamart, Datawarehouse, OLAP, OLTP, а также устройствами DSS компании. Некоторые из основных характеристик Teradata приведены ниже.

  • Может работать как на одиночных, так и на множественных узлах.
  • Параллелизм встроен в систему.
  • Очень хорошо совместим со стандартами ANSI.
  • Действует так же, как сервер.
  • Это открытая система, которая в основном работает для UNIX MR-RAS, Suse Linux ETC, WIN2K и т. Д.

2) Каковы новые функции Teradata?

Некоторые из недавно разработанных функций Teradata:

  • Автоматическая темпоральная аналитика
  • Расширение возможностей сжатия, которое позволяет гибко сжимать данные примерно в 20 раз больше, чем в предыдущей версии.
  • Инновации, связанные с клиентами, например, точка зрения тетраданных.

3) Выделите несколько важных компонентов Teradata.

Некоторые из важных компонентов Teradata:

  • Байнет
  • Процессор модуля доступа (AMP)
  • Механизм синтаксического анализа (PE)
  • Виртуальный диск (vDisk)
  • Виртуальная система хранения (VSS)

4) Упомяните процедуру, с помощью которой мы можем запускать задания Teradata в среде UNIX.

Все, что вам нужно сделать, это выполнить выполнение в UNIX указанным ниже способом.

$ Sh> BTEQ <[Путь к сценарию]> [Путь к файлу журнала]

или же

$ Sh> BTEQ <[Путь к сценарию] TEE [Путь к файлу журнала]

5) Как мы создаем последовательность в Teradata?

В Teradata мы генерируем последовательность, используя столбец идентификаторов.

6) Во время отображения, как последовательность генерируется Teradata?

Все, что вам нужно сделать, это использовать CSUM.

7) На стол накладывается определенная нагрузка, причем каждый час. Движение утром относительно невелико, а ночью очень интенсивно. В соответствии с этой ситуацией, какая утилита является наиболее рекомендуемой и как эта утилита должна быть загружена?

Самая внушаемая здесь утилита - это Tpump. Используя уменьшение или увеличение размера пакета, можно легко обрабатывать трафик.

8) Если сценарий быстрой загрузки не работает и вам доступны только таблицы ошибок, то как вы перезапустите?

В этом случае есть два основных способа перезапуска.

  • Запуск старого файла - Убедитесь, что вы не удалили полностью таблицы ошибок. Вместо этого попробуйте исправить ошибки, присутствующие в сценарии или файле, а затем выполните еще раз.
  • Запуск нового файла - в этом процессе сценарий выполняется просто с использованием операторов конца загрузки и начала. Это поможет снять блокировку, установленную для целевой таблицы, а также может удалить данную запись из таблицы быстрого журнала. Как только это будет сделано, вы можете снова запустить весь скрипт.

9) Назовите несколько инструментов ETL, которые входят в Teradata.

Некоторые из инструментов ETL, которые обычно используются в Teradata, - это DataStage, Informatica, SSIS и т. Д.

10) Выделите несколько преимуществ инструментов ETL перед TD.

Некоторые из преимуществ инструментов ETL перед TD:

  • Можно управлять несколькими разнородными адресатами, а также источниками.
  • Процесс отладки значительно упрощается с помощью инструментов ETL благодаря полноценной поддержке графического интерфейса.
  • Компоненты инструментов ETL можно легко использовать повторно, и в результате при обновлении основного сервера все соответствующие приложения, подключенные к серверу, обновляются автоматически.
  • Де-поворота и поворота можно легко выполнить с помощью инструментов ETL.

11) Что означает кеширование в Teradata?

Кеширование рассматривается как дополнительное преимущество использования Teradata, поскольку оно в первую очередь работает с источником, который остается в том же порядке, то есть не меняется часто. Иногда кэш обычно разделяется между приложениями.

12) Как мы можем проверить версию Teradata, которую мы используем в настоящее время?

Просто дайте команду .SHOW VERSION.

13) Укажите обоснованную причину, по которой Multi-load поддерживает NUSI вместо USI.

Строка подтаблицы индекса оказывается на том же усилителе, что и строка данных в NUSI. Таким образом, каждый усилитель работает отдельно и параллельно.

14) Как перезапускается клиентская система MLOAD после выполнения?

Сценарий должен быть отправлен вручную, чтобы он мог легко загрузить данные из контрольной точки, которая идет последней.

15) Как перезапускается сервер MLOAD Teradata после выполнения?

Процесс в основном выполняется с последней известной контрольной точки, и после обработки данных после выполнения сценария MLOAD сервер перезапускается.

16) Что подразумевается под узлом?

Узел в основном называется набором компонентов аппаратного и программного обеспечения. Обычно сервер называется узлом.

17) Допустим, есть файл, состоящий из 100 записей, из которых нам нужно пропустить первую и последние 20 записей. Что даст фрагмент кода?

Нам нужно использовать BTEQ Utility для выполнения этой задачи. В скрипте будут использоваться Skip 20, а также Repeat 60.

18) Объясните PDE.

PDE в основном означает расширение параллельных данных. PDE, по сути, представляет собой интерфейсный уровень программного обеспечения, присутствующий над операционной системой, и дает базе данных возможность работать в параллельной среде.

19) Что такое TPD?

TPD в основном означает надежную параллельную базу данных и в основном работает под управлением PDE. Teradata - это база данных, которая в основном работает под управлением PDE. По этой причине Teradata обычно называют надежной параллельной или чистой параллельной базой данных.

20) Что подразумевается под драйвером канала?

Драйвер канала - это программное обеспечение, которое действует как средство связи между PE и всеми приложениями, работающими на каналах, подключенных к клиентам.

21) Что подразумевается под Teradata Gateway?

Как и драйвер канала, Teradata Gateway действует как средство связи между Parse Engine и приложениями, подключенными к сетевым клиентам. Каждому узлу назначается только один шлюз.

22) Что подразумевается под виртуальным диском?

Виртуальный диск в основном представляет собой совокупность целого массива цилиндров, которые являются физическими дисками. Иногда его называют дисковым массивом.

23) Объясните смысл усилка?

Amp в основном означает процессор модуля доступа и является процессором, работающим виртуально, и в основном используется для управления одной частью базы данных. Эта конкретная часть базы данных не может использоваться другими усилителями. Таким образом, эту форму архитектуры обычно называют архитектурой без совместного использования ресурсов.

24) Что содержит Amp и какие все операции он выполняет?

Amp в основном состоит из подсистемы диспетчера баз данных и может выполнять операции, указанные ниже.

  • Выполнение DML
  • Выполнение DDL
  • Реализация агрегатов и объединений.
  • Снятие и установка замков и т. Д.

25) Что подразумевается под механизмом синтаксического анализа?

PE оказывается разновидностью Vproc. Его основная функция - принимать запросы SQL и доставлять ответы на них. Он состоит из широкого набора программных компонентов, которые используются для разбиения SQL на различные этапы, а затем для отправки этих этапов в AMP.

26) Что вы имеете в виду под синтаксическим анализом?

Синтаксический анализ - это процесс, связанный с анализом символов строки, которые либо на компьютерном языке, либо на естественном языке.

27) Каковы функции парсера?

Парсер: -

  • Проверяет семантические ошибки
  • Проверяет синтаксические ошибки
  • Проверяет наличие объекта

28) Что подразумевается под диспетчером?

Диспетчер принимает целую коллекцию запросов и затем хранит их в очереди. Одна и та же очередь сохраняется на протяжении всего процесса, чтобы доставить несколько наборов ответов.

29) Сколько сеансов MAX может обрабатывать PE в конкретный момент времени?

PE может обрабатывать в общей сложности 120 сеансов в определенный момент времени.

30) Объясните BYNET.

BYNET в основном служит средством связи между компонентами. Он в первую очередь отвечает за отправку сообщений, а также за выполнение операций слияния и сортировки.

31) Что подразумевается под кликой?

В основном известно, что клика представляет собой набор узлов, которые используются общими дисками. Наличие Clique чрезвычайно важно, поскольку помогает избежать сбоев узлов.

32) Что происходит, когда узел терпит крах?

Всякий раз, когда уровень производительности узла падает, все соответствующие Vproc немедленно мигрируют на новый узел с отказавшего узла, чтобы вернуть все данные с общих дисков.

33) Перечислите все формы ЗАМКОВ, которые доступны в Teradata.

В основном под Teradata попадают четыре типа ЗАМКОВ. Это: -

  • Чтение блокировки
  • Блокировка доступа
  • Эксклюзивный замок
  • Блокировка записи

34) Каков конкретный назначенный уровень, на котором LOCK может применяться в Teradata?

  • Уровень таблицы - все строки, которые присутствуют в таблице, обязательно будут заблокированы.
  • Блокировка уровня базы данных - все объекты, которые присутствуют в базе данных, будут заблокированы.
  • Блокировка уровня хэша строки - будут заблокированы только те строки, которые соответствуют конкретной строке.

35) Какова оценка активно задействованных AMP в первичном индексе?

Только один AMP активно участвует в первичном индексе.

36) Какое значение имеет команда UPSERT в Teradata?

UPSERT в основном означает "Обновить вставку другого". Эта опция доступна только в Teradata.

37) Выделите преимущества PPI (Partition Primary Index).

PPI в основном используется для хранения данных на основе диапазона или категории. Когда дело доходит до запросов диапазона, нет необходимости в использовании полного сканирования таблицы, так как он сразу переходит к следующему разделу, пропуская все остальные разделы.

38) Укажите размеры SMALLINT, BYTEINT и INTEGER.

SMALLINT - 2 байта - 16 бит -> от -32768 до 32767

BYTEINT - 1 байт - 8 бит -> от -128 до 127

ЦЕЛОЕ - 4 байта - 32 бита -> от -2 147 483 648 до 2 147 483 647

39) Что подразумевается под планом с наименьшими затратами?

План наименьшей стоимости обычно выполняется за меньшее время по кратчайшему пути.

40) Выделите точки различий между базой данных и пользователем в Teradata.

  • База данных в основном пассивна, тогда как пользователь активен.
  • База данных в первую очередь хранит все объекты базы данных, тогда как пользователь может хранить любой объект, будь то макрос, таблица, представление и т. Д.
  • База данных не имеет пароля, в то время как пользователь должен ввести пароль.

41) Выделите различия между первичным ключом и первичным индексом.

  • Первичный индекс является обязательным, тогда как первичный ключ - необязательным.
  • Первичный индекс имеет ограничение в 64 таблицы / столбца, тогда как у первичного ключа нет ограничений.
  • Первичный индекс допускает дублирование и нулевые значения, тогда как первичный ключ - нет.
  • Первичный индекс - это физический механизм, а первичный ключ - это чисто логический механизм.

42) Объясните, как используется место для катушки.

Пространство буфера в Teradata в основном используется для выполнения запросов. Из общего пространства, доступного в Teradata, 20% пространства в основном выделяется для буферизации.

43) Выделите необходимость настройки производительности.

Настройка производительности в Teradata в основном выполняется для выявления всех узких мест и их устранения.

44) Прокомментируйте, является ли узкое место ошибкой.

Технически узкое место не является формой ошибки, но, безусловно, вызывает определенную задержку в системе.

45) Как можно определить узкие места?

Существует четыре основных способа определения узкого места. Это: -

  • Teradata Visual Explain
  • Модификатор запроса объяснения
  • Терадата менеджер
  • Монитор производительности

46) Что подразумевается под планом с самой высокой стоимостью?

Согласно плану с наибольшими затратами время, необходимое для выполнения процесса, больше, и он занимает самый длинный доступный путь.

47) Выделите все режимы, которые присутствуют в разделе «Уровень уверенности».

Низкий, Нет, Высокий и Присоединиться - четыре режима, которые присутствуют в Уровне уверенности.

48) Назовите пять этапов, относящихся к MultiLoad Utility.

Предварительная фаза, фаза DML, фаза сбора данных, фаза приложения и конечная фаза.

49) Выделите ограничения TPUMP Utility.

Ниже приведены ограничения утилиты TPUMP: -

  • Мы не можем использовать оператор SELECT.
  • Файлы данных не могут быть объединены.
  • Агрегатные и экспоненциальные операторы не поддерживаются.
  • Арифметические функции не поддерживаются.

50) Как в BTEQ настраиваются параметры сеансового режима?

.set сеансовая транзакция BTET -> Режим транзакции Teradata

.set транзакция сеанса ANSI -> режим ANSI

Эти команды будут работать, только если они будут введены до входа в сеанс.