Вход
Регистрация

Качество данных

Назначение

Качество данных является одной из самых больших проблем бизнес-аналитики. Аналитические решения, полученные на основе некачественных данных, могут:

  • могут оказаться далекими от действительности;
  • исказить истинную картину исследуемых бизнес-процессов;
  • показать ложные закономерности, тенденции и связи между объектами бизнеса.

Следствием этого может стать выработка неверных управленческих решений, которые нанесут ущерб бизнесу. Именно поэтому мониторингу качества данных, а также их преобразованию с целью исключения факторов, снижающих качество данных, должно уделяться особое внимание.

Обработчик Качество данных позволяет производить комплексную оценку качества наборов данных на основе количества обнаруженных пропусков, выбросов и экстремальных значений, а также настроить параметры их дальнейшей обработки узлами Редактирование выбросов и аномальных значений и Заполнение пропущенных данных.

Алгоритм обработки

В настройках обработчика задаются критерии, по которым в данных определяются выбросы, экстремальные значения, значимость количества пропусков. По заданным полям собирается статистика, полученные значения проверяются по критериям и выдаются рекомендации о пригодности данных и необходимых действий по дальнейшей предобработке.