Хранилище данных - это система, предназначенная для хранения и организации данных в центральных хранилищах, включая данные из других источников. Это основная концепция бизнес-аналитики в моделях реляционных баз данных, в которой используются аналитические методы для интеграции бизнес-данных в центральную базу данных..
В хранилищах данных используются две общие архитектурные модели:
Обе модели представляют собой распространенные модели многомерных баз данных, используемые для удовлетворения потребностей больших баз данных в аналитических целях в реальных хранилищах данных..
Мы представляем объективное сравнение между ними, чтобы лучше понять, какой из них лучше другого.
Это наиболее распространенная и общепринятая архитектурная модель, используемая для разработки хранилищ данных и витрин данных, в которых данные упорядочены по фактам и измерениям. Это простейшая архитектурная модель, в которой одна таблица фактов используется для ссылки на несколько таблиц измерений, имитирующих образец звезды.
Как следует из названия, диаграмма напоминает звезду с таблицей фактов в центре и множественными таблицами измерений, исходящими из нее, создавая звездообразный рисунок.
Она также известна как схема объединения звезд, и она хранит все атрибуты измерения в одной денормализованной таблице фактов для быстрой навигации по большим многомерным наборам данных, что объясняет быстрое время отклика на запрос..
Это расширение звездной схемы с дополнительными функциями. В отличие от схемы «звезда», таблицы измерений в схеме «снежинка» нормализуются в несколько связанных таблиц.
Архитектурная модель представляет собой логическое расположение таблиц в иерархии отношений «многие к одному», где несколько таблиц измерений нормализуются в таблицы подмерений, напоминающие шаблон в виде снежинки, отсюда и название.
Это более сложная версия звездообразной схемы с большим количеством соединений между таблицами измерений, что объясняет медленное время обработки для извлечения данных, что означает медленное время ответа на запрос. Это минимизирует избыточность данных, что, в свою очередь, повышает производительность запросов.
В реляционных базах данных звездообразная схема - это простейшая архитектурная модель, используемая для разработки хранилищ данных и многомерных витрин данных. Как следует из названия, модель напоминает звезду с точками, исходящими из центра, что означает, что таблица фактов является центром, а точки являются таблицами измерений. Как и другие модели измерений, он состоит из данных в форме фактов и измерений. Схема «снежинка», с другой стороны, является более сложной архитектурной моделью, которая относится к многомерной базе данных с логическим расположением таблиц в форме снежинки..
Схема снежинки очень похожа на схему типа «звезда», за исключением того, что она может иметь более одной таблицы измерений, которые в дальнейшем нормализуются в несколько связанных таблиц, называемых таблицами субразмера. Он представляет несколько уровней отношений, которые разветвляются в виде снежинки. Однако звездная схема хранит все связанные атрибуты измерения в одной денормализованной таблице измерений, что облегчает понимание и обработку более простых запросов..
Таблица измерений не может содержать повторяющиеся строки в моделях реляционных баз данных по той простой причине, что она может создавать неоднозначности при извлечении. Каждая таблица должна иметь столбец или комбинацию столбцов, называемых первичным ключом, который однозначно идентифицирует все записи таблицы. Внешний ключ - это столбец или группа столбцов, которые обеспечивают связь между двумя таблицами. В звездообразной схеме каждая таблица измерений имеет первичный ключ, который связан с внешним ключом в таблице фактов. Бизнес-иерархия в схеме снежинки представлена отношением первичный ключ / внешний ключ между таблицами измерений.
Основное различие между двумя моделями реляционных баз данных - нормализация. Таблицы измерений в звездообразной схеме не нормализованы, что означает, что бизнес-модель будет использовать относительно больше места для хранения таблиц измерений, а больше места - больше избыточных записей, что в конечном итоге приведет к несогласованности. Схема «снежинка», с другой стороны, минимизирует избыточность данных, потому что нормализованы таблицы измерений, что объясняет гораздо меньшие избыточные записи. Бизнес-иерархия и ее измерения сохраняются посредством ссылочной целостности, что означает, что отношения могут обновляться независимо в хранилищах данных.
Схема типа «звезда» имеет меньше соединений между таблицей измерений и таблицей фактов по сравнению со схемой со снежинкой, которая имеет несколько соединений, что объясняет меньшую сложность запросов. Поскольку измерения в звездообразной схеме связаны через центральную таблицу фактов, она имеет четкие пути соединения, что означает быстрое время ответа на запрос, а быстрое время ответа означает лучшую производительность. В схеме «снежинка» используется большее число объединений, поэтому время ответа на запрос увеличивается, что приводит к усложнению запросов, что в конечном итоге снижает производительность.
Обе являются наиболее распространенными и широко применяемыми архитектурными моделями, используемыми для разработки хранилищ баз данных и витрин данных. Тем не менее, каждая бизнес-модель имеет свою долю плюсов и минусов. Хотя звездообразная схема является простейшей многомерной моделью, используемой для организации данных в факты и измерения, она идеально подходит для разработки витрин данных, в которых используются менее сложные взаимосвязи. Схема «снежинка» - это логическое представление таблиц в многомерной базе данных, в которой измерения хранятся в таблицах подизмерений. Основное различие между ними заключается в нормализации. Таблицы измерений в схеме «снежинка» полностью нормализованы в несколько справочных таблиц, тогда как в схеме «звезда» таблицы измерений денормализованы в одну центральную таблицу фактов..