Что собой представляет таблица фактов

Таблица фактов – это ключевой элемент в структуре многомерных баз данных, играющий важную роль в анализе и хранении данных. Эта таблица содержит числовые данные, отражающие фактические события или явления в бизнесе, такие как продажи, транзакции или другие ключевые показатели.

Она служит основой для проведения аналитических исследований, формирования отчетов и принятия стратегических решений, предоставляя структурированный набор данных для анализа и интерпретации. Таким образом, таблица фактов является ключевым инструментом для бизнес-аналитики, обеспечивая основу для понимания производственных процессов, трендов рынка и эффективности бизнес-стратегий.

Что собой представляет таблица фактов

Таблицы фактов

Таблицы фактов представляют собой наборы данных, где каждая запись является неизменяемым «фактом», таким как журналы обслуживания или данные измерений. Эти записи добавляются постепенно через потоковую передачу или крупными блоками и остаются в таблице до удаления из-за устаревания или сокращения затрат.

В отличие от этого, данные о сущностях, которые изменяются медленно, иногда хранятся в таблицах фактов, например, информация о физических объектах, таких как офисное оборудование, которое редко перемещается.

Поскольку данные в таких таблицах не подлежат изменению, обычно они содержат два основных столбца: столбец идентификатора (строка), который определяет сущность, и столбец метки времени последнего изменения (дата и время).

Затем для каждой сущности извлекается только последняя запись.

Что собой представляет таблица фактов

Таблицы измерений

Таблица измерений, также известная как dimension table, это часть многомерной базы данных, где хранятся атрибуты, связанные с событиями, которые записаны в таблице фактов. Атрибуты обычно представляют собой текстовые описания или другие характеристики, которые объединены в логически связанные группы. Например, в таблице измерений клиентов может храниться информация о имени клиента, в то время как таблица измерений продуктов может содержать наименование товара. Сумма транзакции, с другой стороны, является аддитивной величиной, и ее значения обычно хранятся в таблице фактов.

Таблицы измерений выполняют две основные функции:

  1. Они служат для хранения ссылочных данных, например, таблиц подстановки, которые соотносят идентификатор сущности с её свойствами.
  2. Они также используются для хранения данных снимков, где содержимое изменяется целиком в рамках одной транзакции. В отличие от таблиц фактов, данные в таблицах измерений не обновляются постоянно с появлением новых записей; вместо этого все данные в таблице обновляются одновременно при выполнении операций, таких как .set-or-replace, .move extents или .rename tables.

Что собой представляет таблица фактов

Иногда таблицы измерений создаются как производные от таблиц фактов. Для этого можно использовать материализованное представление таблицы фактов, которое собирает данные из таблицы, оставляя только последние записи для каждой сущности.

Различения таблиц фактов и измерений

ПараметрТаблица фактовТаблица измерений
ОпределениеСодержит данные о событиях или фактах в бизнес-процессе.Эта таблица содержит дополнительные атрибуты, которые описывают факты и могут быть использованы для ограничения запросов.
ХарактеристикаРасполагается в центре схемы данных и окружается измерениями.Связана с таблицей фактов и находится на краях схемы данных.
ПроектОпределяется наиболее детализированным уровнем данных.Должна быть полной, описательной и обладать высоким качеством.
Сложность задачиИспользуется для анализа и составления отчетов на основе собранных данных.Содержит информацию, необходимую для понимания бизнеса.
Тип данныхСодержит фактические данные, например, продажи, связанные с определенными измерениями, такими как продукт или дата.Содержит атрибуты, которые описывают измерения. Например, аналитики могут включать идентификатор продукта, категорию продукта и т. д.
ОсновныеПервичный ключ таблицы фактов становится внешним ключом в таблицах измерений.Идентификация каждого измерения осуществляется через столбцы первичных ключей.
ХранилищеХранит метаданные и фильтры для отчетов.Загружает детальные данные в структуры измерений для дальнейшего анализа.
ИерархияНе включает иерархические связи между данными.Может содержать иерархическую структуру для более глубокого анализа. Например, местоположение может включать в себя страну, почтовый индекс, штат и город.

Создание таблиц фактов и таблиц измерений на основе одной таблицы или представления

В некоторых исходных таблицах содержатся как факты, так и измерения. Для таких таблиц доступен инструмент в построителе моделей данных, который позволяет разделять столбцы фактов и измерений на соответствующие таблицы.

Давайте представим, что у нас есть исходный файл с атрибутами продукта, атрибутами клиента и показателями дохода.

С помощью инструмента Data Modele в Oracle Analytics Cloud можно создать соответствующие таблицы для фактов и измерений.

  1. Заблокируйте модель для редактирования в построителе моделей данных.
  2. В меню «База данных» на левой панели щелкните правой кнопкой мыши на исходной таблице, содержащей данные фактов и измерений. Выберите «Добавить в модель», затем выберите «Как таблицы фактов и измерений».Что собой представляет таблица фактов
  3. Если вы хотите видеть рекомендации построителя моделей данных, выберите «Отображать рекомендации построителя моделей данных» и нажмите «OK». Рекомендации будут доступны на шаге 4.
  4. Если вы хотите создать таблицы фактов и измерений самостоятельно:
    • Снимите флажок «Отображать рекомендации построителя моделей данных» и нажмите «OK».
    • Переместите показатели из исходной таблицы в таблицу фактов. Можно также нажать значок «+» в области заголовка столбца и выбрать столбец для включения в таблицу фактов.
    • Введите имя таблицы фактов, например, «Затраты» или «Показатели».
    • Добавьте таблицу измерений для каждой группы связанных атрибутов и введите значимое имя, например «Продукты». Переместите связанные столбцы из исходной таблицы в соответствующую таблицу измерений.
    • Для добавления дополнительных таблиц измерений нажмите «Добавить» и повторите предыдущий шаг.
    • Укажите столбцы соединения для каждой таблицы измерений, установив флажок рядом с нужными столбцами.Что собой представляет таблица фактов
  5. Проверьте созданные таблицы фактов, таблицы измерений и столбцы соединений. Переименуйте, добавьте или удалите объекты по необходимости.Что собой представляет таблица фактов
  6. Нажмите «Создать», а затем «Готово».

Теперь новые таблицы фактов, таблицы измерений и соединения будут отображаться в построителе моделей данных.

Создание отдельных таблиц фактов

Вы можете добавить отдельные исходные таблицы с фактическими данными в вашу семантическую модель.

Если у вас есть разные исходные таблицы с фактическими данными, например, такие как источники «звезда», их можно поочередно добавлять в семантическую модель. Например, если у вас есть исходная таблица, содержащая только показатели дохода, вы можете создать соответствующую таблицу фактов.

Альтернативный вариант: иногда фактическая информация может быть разделена между несколькими таблицами, например, в нормализованных транзакционных источниках. В таком случае сначала создайте исходные представления, чтобы объединить таблицы, подобно модели «звезда». Для дальнейшей информации об этом смотрите раздел «Планирование семантической модели».

После того как вы добавите исходную таблицу или представление в модель, вы сможете редактировать таблицу фактов.

Создание отдельных таблиц измерений

Вы можете добавить отдельные исходные таблицы с данными измерений в вашу семантическую модель.

Если у вас есть отдельные исходные таблицы с данными измерений, например, из источника «звезда», вы можете добавить их по отдельности в семантическую модель. Например, если у вас есть исходная таблица только с атрибутами клиента, вы можете использовать этот метод для создания соответствующей таблицы измерений.

Как альтернативу, для источников типа «снежинка» или нормализованных (транзакционных) источников можно создать исходные представления для объединения объектов источника, подобно звездообразной модели. Создание таблицы измерений на основе таких представлений обеспечивает большую гибкость, чем непосредственное использование исходных таблиц.

Чтобы добавить отдельные таблицы измерений в модель, выполните следующие действия после блокировки модели:

  1. Перетащите таблицу или представление из меню «База данных» на левой панели в область «Таблицы измерений» семантической модели.
  2. Или щелкните правой кнопкой мыши на таблице или представлении в меню «База данных» на левой панели, затем выберите «Добавить в модель» и «Добавить как таблицу измерений».
  3. Или выберите «Действия с таблицей» или «Действия с представлением» в меню «База данных», затем выберите «Добавить в модель» и «Добавить как таблицу измерений».
  4. Или нажмите «Добавить» в области «Таблицы измерений», выберите нужные таблицы базы данных из списка и нажмите «ОК».
  5. Или в редакторе таблиц или представлений базы данных выберите исходную таблицу или представление, затем нажмите «Добавить в модель» и «Добавить как таблицу измерений».

После добавления таблицы или представления в модель вы можете редактировать таблицу измерений.

Редактирование таблиц фактов и измерений

Вы можете настроить свойства таблиц фактов и измерений в вашей семантической модели и предварительно просматривать исходные данные.

Для этого следует выполнить такие действия:

  1. Заблокируйте модель для редактирования.
  2. Выберите таблицу фактов или измерений, которую нужно изменить.
  3. Измените настройки на вкладке «Обзор», включая измерение времени для таблиц измерений и свойства иерархий.
  4. Настройте агрегирование для столбцов таблиц фактов, выбрав тип агрегирования из предложенного списка.
  5. Можно также отметить столбцы как «Доступные» или «Недоступные» для отображения в анализе.
  6. Добавляйте, редактируйте или удаляйте столбцы по мере необходимости.
  7. Просмотрите предварительный просмотр исходных данных и настройте фильтры данных на вкладке «Исходные данные» и «Фильтры данных» соответственно.
  8. После завершения настроек нажмите «Готово», чтобы сохранить изменения и вернуться к семантической модели.

Что собой представляет таблица фактов

Добавление дополнительных столбцов в таблицы фактов и измерений

Добавление новых столбцов в таблицы фактов и измерений в вашей модели можно осуществить несколькими способами.

Если вы добавили новые столбцы в исходную таблицу и хотите включить их в таблицы фактов или измерений в модели, вам необходимо синхронизировать эти таблицы с базой данных. При этом все обнаруженные новые столбцы будут автоматически добавлены в соответствующие таблицы фактов или измерений. Процесс синхронизации позволяет обновлять исходные объекты и объекты семантической модели, подробнее о котором можно узнать в разделе «Обновление и синхронизация исходных объектов и объектов семантической модели».

Также таблицы измерений могут объединять столбцы из нескольких источников данных. Подробно, как это сделать, мы рассмотрим дальше.

Добавление столбцов в таблицу измерений из другого источника

Вы можете расширить существующую таблицу измерений, добавляя в нее столбцы из другой таблицы или представления. Например, вы можете решить включить атрибуты из таблицы «Категория продукта» в вашу таблицу измерений «Продукты».

Чтобы выполнить это действие:

  1. Заблокируйте модель для редактирования в построителе моделей данных.
  2. Выберите таблицу измерений, которую нужно изменить, чтобы открыть вкладку «Обзор».
  3. Перетащите исходную таблицу или представление с нужными столбцами с панели «База данных» в область столбцов вашей таблицы измерений.
  4. Альтернативно, щелкните правой кнопкой мыши на таблице измерений, выберите «Добавить столбцы», а затем добавьте исходную таблицу или представление с необходимыми столбцами.
  5. Выберите соответствующие столбцы соединения и нажмите кнопку «OK».

Что собой представляет таблица фактов

После этого вам станут доступны дополнительные столбцы в вашей таблице измерений. Свойство «Источник» указывает, что таблица измерений была создана на основе нового представления базы данных. При добавлении столбцов из другого источника всегда создается новое представление базы данных.

Выводы

В заключение, таблицы фактов и измерений играют ключевую роль в организации и анализе данных в многомерных базах данных. Таблицы фактов содержат фактические числовые данные о событиях или транзакциях, в то время как таблицы измерений содержат атрибуты, описывающие контекст этих данных. Создание и редактирование этих таблиц требует внимательного планирования и структурирования данных, чтобы обеспечить их точность и полноту.

Важно помнить, что таблицы фактов и измерений должны быть хорошо спроектированы с учетом потребностей бизнеса и требований аналитики. Они должны быть четко структурированы и управляемы, чтобы обеспечить правильное функционирование системы анализа данных. Кроме того, регулярное обновление и оптимизация таблиц позволяют поддерживать актуальность и эффективность аналитического процесса.

В целом, понимание того, как работать с таблицами фактов и измерений, является ключом к успешному анализу данных и принятию обоснованных бизнес-решений. Эти таблицы обеспечивают основу для выявления тенденций, анализа производственных процессов и выявления ключевых моментов, необходимых для достижения успеха в современном бизнесе.

Оцените статью
( Пока оценок нет )
Поделиться с друзьями
IaaS SaaS PaaS
Добавить комментарий

Больше новостей — на нашем Telegram-канале