Что такое OLAP? Cube, Operations & Типы в хранилище данных

Содержание:

Anonim

Что такое OLAP?

Онлайн-аналитическая обработка (OLAP) - это категория программного обеспечения, которое позволяет пользователям одновременно анализировать информацию из нескольких систем баз данных. Это технология, которая позволяет аналитикам извлекать и просматривать бизнес-данные с разных точек зрения.

Аналитикам часто требуется группировать, агрегировать и объединять данные. Эти операции в реляционных базах данных требуют значительных ресурсов. С помощью OLAP данные могут быть предварительно рассчитаны и агрегированы, что ускоряет анализ.

Базы данных OLAP разделены на один или несколько кубов. Кубы спроектированы таким образом, что создавать и просматривать отчеты стало проще. OLAP расшифровывается как онлайн-аналитическая обработка.

В этом руководстве вы узнаете:

  • Куб OLAP
  • Основные аналитические операции OLAP
  • Типы OLAP-систем
  • ROLAP
  • MOLAP
  • Гибридный OLAP
  • Преимущества OLAP
  • Недостатки OLAP

Куб OLAP:

В основе концепции OLAP лежит куб OLAP. Куб OLAP - это структура данных, оптимизированная для очень быстрого анализа данных.

Куб OLAP состоит из числовых фактов, называемых мерами, которые классифицируются по измерениям. Куб OLAP также называют гиперкубом .

Обычно операции с данными и анализ выполняются с использованием простой электронной таблицы, где значения данных расположены в формате строк и столбцов. Это идеально подходит для двумерных данных. Однако OLAP содержит многомерные данные, которые обычно получаются из другого и несвязанного источника. Использование электронной таблицы - не лучший вариант. Куб может хранить и анализировать многомерные данные логическим и упорядоченным образом.

Как это работает?

Хранилище данных будет извлекать информацию из нескольких источников данных и форматов, таких как текстовые файлы, таблицы Excel, мультимедийные файлы и т. Д.

Извлеченные данные очищаются и преобразуются. Данные загружаются на сервер OLAP (или куб OLAP), где информация предварительно рассчитывается для дальнейшего анализа.

Основные аналитические операции OLAP

Четыре типа аналитических операций в OLAP:

  1. Свернуть
  2. Детализация
  3. Нарезать и нарезать
  4. Повернуть (повернуть)

1) Свертывание:

Свертывание также известно как «консолидация» или «агрегирование». Операцию Roll-up можно выполнить двумя способами.

  1. Уменьшение габаритов
  2. Восхождение по иерархии понятий. Иерархия понятий - это система группирования вещей на основе их порядка или уровня.

Рассмотрим следующую диаграмму

  • В этом примере города Нью-Джерси и Затерянные Углы и свернутые в страну США.
  • Объем продаж в Нью-Джерси и Лос-Анджелесе составляет 440 и 1560 соответственно. Они становятся 2000 после сворачивания
  • В этом процессе агрегации данные представляют собой иерархию местоположения, которая перемещается вверх от города к стране.
  • В процессе свертывания необходимо удалить по крайней мере один или несколько размеров. В этом примере размер Quater удален.

2) Детализация

При детализации данные фрагментированы на более мелкие части. Это противоположно процессу объединения. Это можно сделать через

  • Спуск по иерархии понятий
  • Увеличение размера

Рассмотрим диаграмму выше

  • Квартальный Q1 разбивается на январь, февраль и март. Соответствующие продажи также являются регистрами.
  • В этом примере добавлены месяцы измерения.

3) Срез:

Здесь выбирается одно измерение и создается новый субкуб.

Следующая диаграмма объясняет, как выполняется операция среза:

  • Время измерения разделено с фильтром Q1.
  • Совершенно новый куб создается.

Игральная кость:

Эта операция похожа на срез. Разница в играх в кости заключается в том, что вы выбираете 2 или более измерения, которые приводят к созданию субкуба.

4) Поворот

В Pivot вы вращаете оси данных, чтобы обеспечить замену представления данных.

В следующем примере поворот основан на типах элементов.

Типы OLAP-систем

Иерархическая структура OLAP

Тип OLAP Объяснение
Реляционный OLAP (ROLAP): ROLAP - это расширенная СУБД с многомерным отображением данных для выполнения стандартной реляционной операции.
Многомерный OLAP (MOLAP) MOLAP Реализует работу с многомерными данными.
Гибридная онлайн-аналитическая обработка (HOLAP) В подходе HOLAP агрегированные итоги хранятся в многомерной базе данных, а подробные данные - в реляционной базе данных. Это обеспечивает как эффективность данных модели ROLAP, так и производительность модели MOLAP.
Настольный OLAP (DOLAP) В Desktop OLAP пользователь загружает часть данных из базы данных локально или на свой рабочий стол и анализирует ее. DOLAP относительно дешевле в развертывании, поскольку он предлагает очень мало функций по сравнению с другими системами OLAP.
Веб-OLAP (WOLAP) Web OLAP, которая представляет собой систему OLAP, доступную через веб-браузер. WOLAP - это трехуровневая архитектура. Он состоит из трех компонентов: клиента, промежуточного программного обеспечения и сервера базы данных.
Мобильный OLAP: Mobile OLAP помогает пользователям получать доступ к данным OLAP и анализировать их с помощью своих мобильных устройств.
Пространственный OLAP: SOLAP создан для облегчения управления как пространственными, так и непространственными данными в географической информационной системе (ГИС).

ROLAP

ROLAP работает с данными, которые существуют в реляционной базе данных. Таблицы фактов и измерений хранятся в виде реляционных таблиц. Он также позволяет проводить многомерный анализ данных и является самым быстрорастущим OLAP.

Преимущества модели ROLAP:

  • Высокая эффективность обработки данных. Он предлагает высокую эффективность обработки данных, поскольку производительность запросов и язык доступа оптимизированы, в частности, для многомерного анализа данных.
  • Масштабируемость. Этот тип системы OLAP предлагает масштабируемость для управления большими объемами данных, даже когда объем данных постоянно увеличивается.

Недостатки модели ROLAP:

  • Спрос на более высокие ресурсы: ROLAP требует высокого использования человеческих, программных и аппаратных ресурсов.
  • Ограничения совокупных данных. Инструменты ROLAP используют SQL для всех вычислений агрегированных данных. Однако нет установленных ограничений для обработки вычислений.
  • Низкая производительность запросов. Производительность запросов в этой модели низкая по сравнению с MOLAP.

MOLAP

MOLAP использует многомерные механизмы хранения на основе массивов для отображения многомерных представлений данных. В основном они используют куб OLAP.

Узнайте больше об OLAP здесь

Гибридный OLAP

Гибридный OLAP представляет собой смесь ROLAP и MOLAP. Он предлагает быстрое вычисление MOLAP и более высокую масштабируемость ROLAP. HOLAP использует две базы данных.

  1. Агрегированные или вычисленные данные хранятся в многомерном кубе OLAP.
  2. Подробная информация хранится в реляционной базе данных.

Преимущества гибридного OLAP:

  • Такой тип OLAP помогает сэкономить дисковое пространство, а также остается компактным, что помогает избежать проблем, связанных со скоростью и удобством доступа.
  • Гибридный HOLAP использует технологию куба, которая обеспечивает более высокую производительность для всех типов данных.
  • ROLAP мгновенно обновляются, и пользователи HOLAP имеют доступ к этим мгновенно обновляемым данным в реальном времени. MOLAP обеспечивает очистку и преобразование данных, тем самым повышая актуальность данных. Это объединяет лучшее из обоих миров.

Недостатки гибридного OLAP:

  • Повышенный уровень сложности : основным недостатком систем HOLAP является то, что они поддерживают инструменты и приложения как ROLAP, так и MOLAP. Таким образом, это очень сложно.
  • Возможное совпадение : выше вероятность совпадения, особенно в отношении их функций.

Преимущества OLAP

  • OLAP - это платформа для всех видов бизнеса, включая планирование, составление бюджета, отчетность и анализ.
  • Информация и вычисления согласованы в кубе OLAP. Это важное преимущество.
  • Быстро создавайте и анализируйте сценарии "Что, если"
  • Простой поиск в базе данных OLAP общих или конкретных терминов.
  • OLAP предоставляет строительные блоки для инструментов бизнес-моделирования, инструментов интеллектуального анализа данных и отчетов о производительности.
  • Позволяет пользователям выполнять срезы и кубики данных по различным измерениям, мерам и фильтрам.
  • Это хорошо для анализа временных рядов.
  • С OLAP легко найти некоторые кластеры и выбросы.
  • Это мощная система онлайн-аналитики для визуализации, которая обеспечивает более быстрое время отклика.

Недостатки OLAP

  • OLAP требует организации данных по схеме «звезда» или «снежинка». Эти схемы сложно реализовать и администрировать.
  • В одном кубе OLAP не может быть большого количества измерений
  • Доступ к транзакционным данным через систему OLAP невозможен.
  • Любая модификация куба OLAP требует полного обновления куба. Это трудоемкий процесс

Резюме:

  • OLAP - это технология, которая позволяет аналитикам извлекать и просматривать бизнес-данные с разных точек зрения.
  • В основе концепции OLAP лежит куб OLAP.
  • Различные бизнес-приложения и другие операции с данными требуют использования куба OLAP.
  • В OLAP существует пять основных типов аналитических операций: 1) свертывание 2) детализация 3) фрагмент 4) игра в кости и 5) сводная таблица.
  • Три типа широко используемых систем OLAP - это MOLAP, ROLAP и гибридный OLAP.
  • Настольный OLAP, веб-OLAP и мобильный OLAP - это некоторые другие типы систем OLAP.