Что такое OLAP?
Онлайн-аналитическая обработка (OLAP) - это категория программного обеспечения, которое позволяет пользователям одновременно анализировать информацию из нескольких систем баз данных. Это технология, которая позволяет аналитикам извлекать и просматривать бизнес-данные с разных точек зрения.
Аналитикам часто требуется группировать, агрегировать и объединять данные. Эти операции в реляционных базах данных требуют значительных ресурсов. С помощью OLAP данные могут быть предварительно рассчитаны и агрегированы, что ускоряет анализ.
Базы данных OLAP разделены на один или несколько кубов. Кубы спроектированы таким образом, что создавать и просматривать отчеты стало проще. OLAP расшифровывается как онлайн-аналитическая обработка.
В этом руководстве вы узнаете:
- Куб OLAP
- Основные аналитические операции OLAP
- Типы OLAP-систем
- ROLAP
- MOLAP
- Гибридный OLAP
- Преимущества OLAP
- Недостатки OLAP
Куб OLAP:
В основе концепции OLAP лежит куб OLAP. Куб OLAP - это структура данных, оптимизированная для очень быстрого анализа данных.
Куб OLAP состоит из числовых фактов, называемых мерами, которые классифицируются по измерениям. Куб OLAP также называют гиперкубом .
Обычно операции с данными и анализ выполняются с использованием простой электронной таблицы, где значения данных расположены в формате строк и столбцов. Это идеально подходит для двумерных данных. Однако OLAP содержит многомерные данные, которые обычно получаются из другого и несвязанного источника. Использование электронной таблицы - не лучший вариант. Куб может хранить и анализировать многомерные данные логическим и упорядоченным образом.
Как это работает?
Хранилище данных будет извлекать информацию из нескольких источников данных и форматов, таких как текстовые файлы, таблицы Excel, мультимедийные файлы и т. Д.
Извлеченные данные очищаются и преобразуются. Данные загружаются на сервер OLAP (или куб OLAP), где информация предварительно рассчитывается для дальнейшего анализа.
Основные аналитические операции OLAP
Четыре типа аналитических операций в OLAP:
- Свернуть
- Детализация
- Нарезать и нарезать
- Повернуть (повернуть)
1) Свертывание:
Свертывание также известно как «консолидация» или «агрегирование». Операцию Roll-up можно выполнить двумя способами.
- Уменьшение габаритов
- Восхождение по иерархии понятий. Иерархия понятий - это система группирования вещей на основе их порядка или уровня.
Рассмотрим следующую диаграмму
- В этом примере города Нью-Джерси и Затерянные Углы и свернутые в страну США.
- Объем продаж в Нью-Джерси и Лос-Анджелесе составляет 440 и 1560 соответственно. Они становятся 2000 после сворачивания
- В этом процессе агрегации данные представляют собой иерархию местоположения, которая перемещается вверх от города к стране.
- В процессе свертывания необходимо удалить по крайней мере один или несколько размеров. В этом примере размер Quater удален.
2) Детализация
При детализации данные фрагментированы на более мелкие части. Это противоположно процессу объединения. Это можно сделать через
- Спуск по иерархии понятий
- Увеличение размера
Рассмотрим диаграмму выше
- Квартальный Q1 разбивается на январь, февраль и март. Соответствующие продажи также являются регистрами.
- В этом примере добавлены месяцы измерения.
3) Срез:
Здесь выбирается одно измерение и создается новый субкуб.
Следующая диаграмма объясняет, как выполняется операция среза:
- Время измерения разделено с фильтром Q1.
- Совершенно новый куб создается.
Игральная кость:
Эта операция похожа на срез. Разница в играх в кости заключается в том, что вы выбираете 2 или более измерения, которые приводят к созданию субкуба.
4) Поворот
В Pivot вы вращаете оси данных, чтобы обеспечить замену представления данных.
В следующем примере поворот основан на типах элементов.
Типы OLAP-систем
Иерархическая структура OLAP
Тип OLAP | Объяснение |
Реляционный OLAP (ROLAP): | ROLAP - это расширенная СУБД с многомерным отображением данных для выполнения стандартной реляционной операции. |
Многомерный OLAP (MOLAP) | MOLAP Реализует работу с многомерными данными. |
Гибридная онлайн-аналитическая обработка (HOLAP) | В подходе HOLAP агрегированные итоги хранятся в многомерной базе данных, а подробные данные - в реляционной базе данных. Это обеспечивает как эффективность данных модели ROLAP, так и производительность модели MOLAP. |
Настольный OLAP (DOLAP) | В Desktop OLAP пользователь загружает часть данных из базы данных локально или на свой рабочий стол и анализирует ее. DOLAP относительно дешевле в развертывании, поскольку он предлагает очень мало функций по сравнению с другими системами OLAP. |
Веб-OLAP (WOLAP) | Web OLAP, которая представляет собой систему OLAP, доступную через веб-браузер. WOLAP - это трехуровневая архитектура. Он состоит из трех компонентов: клиента, промежуточного программного обеспечения и сервера базы данных. |
Мобильный OLAP: | Mobile OLAP помогает пользователям получать доступ к данным OLAP и анализировать их с помощью своих мобильных устройств. |
Пространственный OLAP: | SOLAP создан для облегчения управления как пространственными, так и непространственными данными в географической информационной системе (ГИС). |
ROLAP
ROLAP работает с данными, которые существуют в реляционной базе данных. Таблицы фактов и измерений хранятся в виде реляционных таблиц. Он также позволяет проводить многомерный анализ данных и является самым быстрорастущим OLAP.
Преимущества модели ROLAP:
- Высокая эффективность обработки данных. Он предлагает высокую эффективность обработки данных, поскольку производительность запросов и язык доступа оптимизированы, в частности, для многомерного анализа данных.
- Масштабируемость. Этот тип системы OLAP предлагает масштабируемость для управления большими объемами данных, даже когда объем данных постоянно увеличивается.
Недостатки модели ROLAP:
- Спрос на более высокие ресурсы: ROLAP требует высокого использования человеческих, программных и аппаратных ресурсов.
- Ограничения совокупных данных. Инструменты ROLAP используют SQL для всех вычислений агрегированных данных. Однако нет установленных ограничений для обработки вычислений.
- Низкая производительность запросов. Производительность запросов в этой модели низкая по сравнению с MOLAP.
MOLAP
MOLAP использует многомерные механизмы хранения на основе массивов для отображения многомерных представлений данных. В основном они используют куб OLAP.
Узнайте больше об OLAP здесь
Гибридный OLAP
Гибридный OLAP представляет собой смесь ROLAP и MOLAP. Он предлагает быстрое вычисление MOLAP и более высокую масштабируемость ROLAP. HOLAP использует две базы данных.
- Агрегированные или вычисленные данные хранятся в многомерном кубе OLAP.
- Подробная информация хранится в реляционной базе данных.
Преимущества гибридного OLAP:
- Такой тип OLAP помогает сэкономить дисковое пространство, а также остается компактным, что помогает избежать проблем, связанных со скоростью и удобством доступа.
- Гибридный HOLAP использует технологию куба, которая обеспечивает более высокую производительность для всех типов данных.
- ROLAP мгновенно обновляются, и пользователи HOLAP имеют доступ к этим мгновенно обновляемым данным в реальном времени. MOLAP обеспечивает очистку и преобразование данных, тем самым повышая актуальность данных. Это объединяет лучшее из обоих миров.
Недостатки гибридного OLAP:
- Повышенный уровень сложности : основным недостатком систем HOLAP является то, что они поддерживают инструменты и приложения как ROLAP, так и MOLAP. Таким образом, это очень сложно.
- Возможное совпадение : выше вероятность совпадения, особенно в отношении их функций.
Преимущества OLAP
- OLAP - это платформа для всех видов бизнеса, включая планирование, составление бюджета, отчетность и анализ.
- Информация и вычисления согласованы в кубе OLAP. Это важное преимущество.
- Быстро создавайте и анализируйте сценарии "Что, если"
- Простой поиск в базе данных OLAP общих или конкретных терминов.
- OLAP предоставляет строительные блоки для инструментов бизнес-моделирования, инструментов интеллектуального анализа данных и отчетов о производительности.
- Позволяет пользователям выполнять срезы и кубики данных по различным измерениям, мерам и фильтрам.
- Это хорошо для анализа временных рядов.
- С OLAP легко найти некоторые кластеры и выбросы.
- Это мощная система онлайн-аналитики для визуализации, которая обеспечивает более быстрое время отклика.
Недостатки OLAP
- OLAP требует организации данных по схеме «звезда» или «снежинка». Эти схемы сложно реализовать и администрировать.
- В одном кубе OLAP не может быть большого количества измерений
- Доступ к транзакционным данным через систему OLAP невозможен.
- Любая модификация куба OLAP требует полного обновления куба. Это трудоемкий процесс
Резюме:
- OLAP - это технология, которая позволяет аналитикам извлекать и просматривать бизнес-данные с разных точек зрения.
- В основе концепции OLAP лежит куб OLAP.
- Различные бизнес-приложения и другие операции с данными требуют использования куба OLAP.
- В OLAP существует пять основных типов аналитических операций: 1) свертывание 2) детализация 3) фрагмент 4) игра в кости и 5) сводная таблица.
- Три типа широко используемых систем OLAP - это MOLAP, ROLAP и гибридный OLAP.
- Настольный OLAP, веб-OLAP и мобильный OLAP - это некоторые другие типы систем OLAP.