Что такое многомерная схема?
Многомерная схема специально разработана для моделирования систем хранилищ данных. Схемы предназначены для удовлетворения уникальных потребностей очень больших баз данных, предназначенных для аналитических целей (OLAP).
Типы схемы хранилища данных:
Ниже приведены 3 основных типа многомерных схем, каждый из которых имеет свои уникальные преимущества.
- Схема звезды
- Схема снежинки
- Схема галактики
В этом руководстве вы узнаете больше о-
- Что такое звездная схема?
- Что такое схема снежинки?
- Схема звезды против схемы снежинки: ключевые различия
- Что такое схема Galaxy?
- Что такое схема звездного кластера?
Что такое звездная схема?
Схема "звезда" в хранилище данных, в которой в центре звезды может быть одна таблица фактов и несколько связанных таблиц измерений. Она известна как звездная схема, так как ее структура напоминает звезду. Модель данных Star Schema - это простейший тип схемы Data Warehouse. Она также известна как схема соединения типа «звезда» и оптимизирована для запросов к большим наборам данных.
В следующем примере звездообразной схемы таблица фактов находится в центре, которая содержит ключи к каждой таблице измерений, такой как Dealer_ID, Model ID, Date_ID, Product_ID, Branch_ID и другие атрибуты, такие как проданные единицы и доход.
Характеристики схемы звезды:
- Каждое измерение в звездообразной схеме представлено единственной одномерной таблицей.
- Таблица размеров должна содержать набор атрибутов.
- Таблица измерений присоединяется к таблице фактов с помощью внешнего ключа.
- Таблицы размеров не стыкуются друг с другом
- Таблица фактов будет содержать ключ и меру
- Схема Star проста для понимания и обеспечивает оптимальное использование диска.
- Таблицы размеров не нормализованы. Например, на приведенном выше рисунке Country_ID не имеет таблицы поиска страны, как это было бы в проекте OLTP.
- Схема широко поддерживается BI Tools.
Что такое схема снежинки?
Схема «снежинка» в хранилище данных - это логическая организация таблиц в многомерной базе данных, при которой ER-диаграмма напоминает форму снежинки. Схема «Снежинка» является расширением схемы «звезда» и добавляет дополнительные измерения. Таблицы измерений нормализованы, что позволяет разбить данные на дополнительные таблицы.
В следующем примере схемы Snowflake Country дополнительно нормализуется в отдельную таблицу.
Характеристики схемы снежинки:
- Основное преимущество схемы «снежинка» - использование меньшего дискового пространства.
- Проще реализовать измерение, добавленное в схему
- Из-за нескольких таблиц производительность запросов снижается
- Основная проблема, с которой вы столкнетесь при использовании схемы снежинки, заключается в том, что вам нужно выполнять больше усилий по обслуживанию из-за большего количества таблиц поиска.
Схема звезды против схемы снежинки: ключевые различия
Ниже приводится ключевое различие между схемой звезды и схемой снежинки:
Схема звезды | Схема снежинки |
---|---|
Иерархии для измерений хранятся в размерной таблице. | Иерархии разделены на отдельные таблицы. |
Он содержит таблицу фактов, окруженную таблицами измерений. | Одна таблица фактов, окруженная таблицей измерений, которые, в свою очередь, окружены таблицей измерений |
В звездообразной схеме только одно соединение создает связь между таблицей фактов и любыми таблицами измерений. | Схема «снежинка» требует много объединений для получения данных. |
Простой дизайн БД. | Очень сложный дизайн БД. |
Денормализованная структура данных и запросы также выполняются быстрее. | Нормализованная структура данных. |
Высокий уровень избыточности данных | Избыточность данных очень низкого уровня |
Таблица Single Dimension содержит агрегированные данные. | Данные разделены на разные таблицы измерений. |
Обработка куба происходит быстрее. | Обработка куба может быть медленной из-за сложного соединения. |
Предлагает более эффективные запросы с помощью оптимизации запросов Star Join. Таблицы могут быть соединены с несколькими измерениями. | Схема Snowflake представлена централизованной таблицей фактов, которая вряд ли связана с несколькими измерениями. |
Что такое схема галактики?
Galaxy Схема содержит два таблицы фактов , что таблицы измерений доли между ними. Это также называется схемой созвездия фактов. Схема рассматривается как набор звезд, отсюда и название «Схема галактики».
Как вы можете видеть в приведенном выше примере, есть две таблицы фактов
- Доход
- Товар.
В схеме Galaxy общие измерения называются согласованными измерениями.
Характеристики схемы галактики:
- Измерения в этой схеме разделены на отдельные измерения на основе различных уровней иерархии.
- Например, если география имеет четыре уровня иерархии, таких как регион, страна, штат и город, тогда схема Galaxy должна иметь четыре измерения.
- Более того, можно построить схему этого типа, разделив схему с одной звездой на несколько схем со звездочкой.
- В этой схеме большие размеры, которые необходимо строить на основе уровней иерархии.
- Эта схема полезна для агрегирования таблиц фактов для лучшего понимания.
Что такое схема звездного кластера?
Схема снежинки содержит полностью развернутые иерархии. Однако это может усложнить схему и потребовать дополнительных соединений. С другой стороны, звездная схема содержит полностью свернутые иерархии, что может привести к избыточности. Таким образом, лучшим решением может быть баланс между этими двумя схемами, что и является дизайном схемы звездного кластера.
Перекрывающиеся измерения можно найти в виде развилок в иерархиях. Разветвление происходит, когда объект выступает в качестве родительского элемента в двух разных иерархиях измерений. Затем объекты-вилки идентифицируются как классификация с отношениями «один ко многим».
Резюме:
- Многомерная схема специально разработана для моделирования систем хранилищ данных.
- Схема "звезда" - это простейший тип схемы хранилища данных. Она известна как звездная схема, поскольку ее структура напоминает звезду.
- Схема «Снежинка» является расширением схемы «звезда» и добавляет дополнительные измерения. Его называют снежинкой, потому что его диаграмма напоминает снежинку.
- В звездообразной схеме только одно соединение определяет связь между таблицей фактов и любыми таблицами измерений.
- Схема "звезда" содержит таблицу фактов, окруженную таблицами измерений.
- Схема снежинки окружена таблицей измерений, которая, в свою очередь, окружена таблицей измерений.
- Схема «снежинка» требует много объединений для получения данных.
- Схема Galaxy содержит две таблицы фактов, которые имеют общие таблицы измерений. Это также называется схемой созвездия фактов.
- Схема звездообразного кластера содержит атрибуты схемы "звезда" и "снежинка".