Data Mining vs Data Warehousing
Процесс интеллектуального анализа данных относится к разделу информатики, который занимается извлечением шаблонов из больших наборов данных. Эти наборы затем объединяются с использованием статистических методов и искусственного интеллекта. Интеллектуальный анализ данных в современном бизнесе отвечает за преобразование необработанных данных в источники искусственного интеллекта. Данные манипулируют и, таким образом, могут давать надежные решения, которые могут быть использованы при принятии решений. Это дает предприятиям преимущество перед конкурентами в том, что у них есть наборы данных, на которые можно опираться при предоставлении информации. Интеллектуальный анализ данных также используется организациями в методах профилирования, включая маркетинг, наблюдение за научными открытиями и обнаружение мошенничества..
Существуют и другие общие термины, которые могут быть связаны с извлечением данных, например, поиск данных, выемка данных или даже отслеживание данных. Все это указывает на различные варианты интеллектуального анализа данных, которые используются при выборке небольших наборов данных, которые могут быть слишком малы для получения статистических выводов. Тем не менее, они имеют решающее значение для определения достоверности используемых данных и могут быть использованы при создании гипотезы, когда ожидают достижения данной совокупности данных..
С другой стороны, хранилище данных - это термин, который описывает систему в организации, которая используется для сбора данных. Эти данные, собранные хранилищем данных, - это то, что предоставляется транзакционными системами, такими как счета, записи о закупках или даже записи о ссуде. Записи данных берутся из отдельных точек создания и объединяются под одной крышей, которая является хранилищем данных. Затем эти данные передаются, и отчеты составляются агрегированным образом, чтобы помочь пользователям деловой информации принимать правильные решения. Хранилище данных для эффективной работы требует источника данных, базы данных и инструмента отчетности..
Следовательно, можно сказать, что хранилище данных - это база данных, которая используется для конкретных целей отчетности по анализированным данным. Эти данные поступают из разных систем, которые были представлены для отчетности.
Для выполнения своих функций хранилище данных поддерживает функции на трех отдельных уровнях. К ним относятся постановка, интеграция и доступ. В процессе подготовки исходные данные хранятся разработчиками с единственной целью анализа и поддержки. Уровень интеграции используется для интеграции данных и для получения уровня абстракции от пользователей данных. Наконец, уровень доступа важен для получения данных от разных пользователей данных..
Как интеллектуальный анализ данных, так и хранилище данных могут называться инструментами, которые используются для сбора бизнес-аналитики. Основное различие между ними заключается в том, как собирается бизнес-аналитика. Таким образом, можно сказать, что данные, которые хорошо хранились в хранилище, довольно легко добывать и, следовательно, использовать. Таким образом, хранилище данных отвечает за облегчение работы по интеллектуальному анализу данных, поскольку в нем размещаются все соответствующие данные, которые необходимо добывать в центральном местоположении, а не когда интеллектуальный анализ данных должен продолжать искать данные в разных местах. Это помогает сэкономить время, затрачиваемое на интеллектуальный анализ данных, и ресурсы, используемые при майнинге..
Резюме
Data Mining - это процесс извлечения данных из больших наборов данных..
Хранилище данных - это процесс объединения всех соответствующих данных.
Как сбор данных, так и хранение данных являются инструментами сбора бизнес-аналитики..
Интеллектуальный анализ данных специфичен для сбора данных.
Хранилище данных - это инструмент, позволяющий сэкономить время и повысить эффективность за счет объединения данных из разных мест из разных областей организации..
Хранилище данных имеет три уровня: подготовка, интеграция и доступ.