Название/Синоним Описание
Дашборд (Dashboard) Дашбоард, Цифровая информационная панель Средство визуализации данных, схожее с приборной панелью автомобиля. Эффективно как интерфейс для оценки результатов бизнес-аналитики. Удобно для одновременного отслеживания нескольких информационных потоков.
Деградация модели (Model degradation) Model performance deterioration, AI aging, Ухудшение характеристик модели, Старение искусственного интеллекта Процесс постепенного снижения качества моделей машинного обучения в ходе их промышленной эксплуатации, относительно качества, которое модель показала по результатам обучения.
Дедупликация (Deduplication) Дедубликация, Устранение дубликатов Процесс исключения из наборов данных идентичных записей, называемых дубликатами. Неотъемлемая часть процесса предобработки и очистки данных. Инструменты дедупликации входят в состав большинства аналитических платформ.
Дезагрегирование (Data disaggregation) Детализация В анализе данных — операция над многомерным кубом, обратная агрегированию. В результате строится новый куб путем замены значений некоторых измерений соответствующими наборами значений более низких уровней иерархии.
Дельта-правило (Delta rule) В теории нейронных сетей — метод обучения перцептрона на основе градиентного спуска. Развитие дельта-правила привело к созданию алгоритма обратного распространения ошибки.
Демократизация данных (Data Democratization) Процесс повышения доступности данных для более широкого круга лиц внутри организации, разрушение барьеров, мешающих людям получать доступ к данным, эффективно анализировать и использовать их.
Дендрограмма (Dendrogram) В анализе данных — визуализатор для представления результатов иерархической кластеризации. Показывает степень близости отдельных объектов и кластеров, а также демонстрирует последовательность их объединения или разделения.
Дерево решений (Decision Trees) Дерево классификаций, Classification Tree Один из наиболее популярных инструментов классификации в интеллектуальном анализе данных и бизнес-аналитике. Строится на основе решающих правил вида «если, то», упорядоченных в древовидную иерархическую структуру.
Детерминированная составляющая (Deterministic component) Закономерная составляющая Числовая последовательность элементов временного ряда, значения которых могут быть вычислены по определенному правилу как функция времени.
Детерминистский метод обучения (Deterministic approach) Детерминистское обучение, Deterministic Learning В машинном обучении — подход, когда изменения параметров обучаемой модели на каждой итерации определяются только ее текущим состоянием, значениями входов и выходов и некоторым правилом. Характерен для обучения нейронных сетей.
Диаграмма Парето (Pareto chart) Кривая Парето Графическое представление закона Парето. Представляет собой столбчатую диаграмму и используется для наглядного отображения анализируемых факторов в порядке уменьшения их значимости.
Диаграмма рассеяния (Scatter diagram) Метод визуализации для оценки точности работы регрессионных моделей. График, на котором по горизонтальной оси откладываются фактически наблюдаемые значения обучающих примеров, а по вертикальной — значения, оцененные моделью.
Динамическая система (Dynamic system) Математическая модель, описывающая поведение объекта, процесса или явления как последовательность переходов из одного состояния в другое. В анализе данных используется для исследования поведения реальных объектов и процессов.
Директ мэйл (Direct mail) Прямая почтовая рассылка, Адресная рассылка Направление маркетинга, использующее прямую почтовую рассылку рекламной информации. Для определения целевой аудитории рассылки и формирования адресных предложений широко используются методы интеллектуального анализа данных.
Директ-маркетинг (Direct marketing) Прямой маркетинг, Маркетинг с прямым откликом Маркетинговая коммуникация, при которой компании взаимодействуют непосредственно с предварительно выбранными клиентами. Интеллектуальный анализ данных позволяет сегментировать клиентов и составить для них адресные торговые предложения.
Дискретное и непрерывное время (Discrete and continuous time) Альтернативные способы моделирования динамических процессов, переменные в которых изменяются с течением времени.
Дискретные данные (Discrete Data) Данные, множество значений которых конечно или счетно. Дискретными являются значения признака, общее число которых конечно либо бесконечно, но может быть подсчитано при помощи натуральных чисел от одного до бесконечности.
Дискриминантный линейный анализ (Linear discriminant analysis) Методы статистики и машинного обучения для нахождения линейных комбинаций признаков, наилучшим образом разделяющих классы объектов или событий. Позволяет изучать различия между группами объектов по нескольким признакам одновременно.
Дискриминационный порог (Discrimination Threshold) Порог отсечки, Уровень отсечки В статистике и машинном обучении — значение дискриминирующей функции в задачах бинарной классификации, которое позволяет разделять классы. Настраивается так, чтобы минимизировать число ошибок классификации.
Дисперсионный анализ (Analysis of variance) ANOVA Статистический метод для определения влияния различных факторов на исследуемую переменную. Применяется для выбора наиболее важных факторов и оценки их влияния.
Дисперсия (Variance) В статистике — величина, которая характеризует меру разброса значений случайной величины относительно ее математического ожидания. Является одним из параметров нормального закона распределения.
Добыча данных (Data Mining) Разработка данных, Интеллектуальный анализ данных, DM Методология и процесс обнаружения в больших массивах данных ранее неизвестных, нетривиальных знаний, практически полезных для принятия решений. Включает элементы математической статистики, искусственного интеллекта, машинного обучения и т.д.
Доверительный интервал (Confidence interval) В математической статистике — интервал, в пределах которого с заданной вероятностью лежат выборочные оценки статистических характеристик генеральной совокупности.
Достоверность (Reliability) Несомненная верность чего-либо. В анализе данных говорят о достоверности информации, необходимой для принятия решений. Она должна обладать свойствами полноты, актуальности, точности, непротиворечивости и т.д.
Достоверность ассоциативного правила (Association Rule Confidence) Доверие Показатель уверенности в том, что ассоциация A к B является ассоциативным правилом — то есть предположение, что появление события A влечёт за собой появление события B, является достаточно достоверным.
Дубликат (Dublicate) Копия В анализе данных — две или более записи одного набора данных, которые содержат идентичные наборы значений всех признаков. Обычно дубликаты являются негативным фактором, и в процессе очистки данных от них стремятся избавиться.