Пакетная аналитика (Batch analytics) |
Направление в бизнес-аналитике, при котором данные анализируются после того, как они были собраны в пакеты, сохраненные на постоянных носителях. |
Пакетный режим (Batch processing) Пакетная обработка |
Режим работы компьютера, реализующий многозадачность, когда система обрабатывает заранее сформированный пакет заданий пользователя без вмешательства последнего. Эффективен при загрузке и обновлении больших объемов информации в базах данных. |
Парсер (Parser) Cинтаксический анализатор |
Программа или сервис для сбора и анализа большого объёма данных в автоматическом режиме. |
Переобучение (Overtraining) |
В машинном обучении — явление, когда модель хорошо распознает примеры из обучающего множества, но не распознает или плохо распознает любые другие примеры, не участвовавшие в процессе обучения. |
Персонализация (Personalization) Кастомизация, Customization |
Процесс адаптации продукции и услуг компании к узкой целевой аудитории. Предсказательная персонализация определяет особенности потребительского поведения. Для этих целей используются технологии анализа данных. |
Платформа клиентских данных (Customer Data Platform) CDP |
Совокупность программных средств для сбора данных о клиентах из различных источников, их обработки, консолидации, хранения и использования для профилирования, сегментации, улучшения таргетинга и повышения эффективности маркетинговых кампаний. |
Платформа управления данными (Data management platform) ПУД, DMP |
Программная платформа для сбора, хранения, анализа и использования данных. В бизнес-аналитике используется для управления клиентскими данными с целью формирования целевых сегментов и повышения эффективности маркетинговых кампаний. |
Площадь под ROC-кривой (Area Under The ROC Curve) AUC, Область под ROC-кривой |
Часть координатной плоскости под графиком ROC-кривой. В математической статистике и машинном обучении является мерой качества модели бинарной классификации. В идеальной модели площадь под ROC-кривой максимальна и равна 1. |
Поведенческая аналитика (Behavioral analytics) |
Анализ потребительского поведения пользователей платформ электронной коммерции, мобильных и веб-приложений, он-лайн игр и других сетевых ресурсов. Позволяет обнаруживать шаблоны потребительского поведения. |
Поведенческий скоринг (Behavioral scoring) |
Метод количественной оценки состояния кредитоспособности заемщика, основанный на данных об истории операций по его счетам (график погашения задолженности, запросы новых кредитов, оборот по текущим счетам и т.п.). |
Поддержка ассоциативного правила (Association Rule Support) |
Показатель, характеризующий качество ассоциативного правила. Является мерой надежности, с которой ассоциативное правило выражает связь между условием и следствием. |
Подход, управляемый данными (Data Driven approach) Принятие решений на основе данных, Data driven decision making, DDDM |
Подход к управлению, в основе которого лежит использование данных, собираемых компанией, и результатов их анализа в процессах принятия управленческих решений. |
Пожизненная ценность клиента (Customer Lifetime Value) Customer lifetime value, CLV, CLTV, Lifetime customer value, LCV |
Ожидаемая чистая прибыль, которая может быть получена в течение всего цикла отношений с клиентом. Точные модели для оценки пожизненной ценности строятся с использованием сложных методов прогнозной аналитики. |
Показатели оценки инвестиций (Investment appraisal indicators) |
Набор финансовых показателей, которые позволяют оценить ожидаемую прибыльность инвестиций с различных точек зрения, а также определить насколько тот или иной инвестиционный проект соответствует интересам участников и их бизнес-целям. |
Показатель аддитивный (Additive measure) Аддитивная мера, Аддитивный факт, Агрегируемый показатель, Additive fact, Additive index, Aggregate index |
Показатель (факт), в многомерном хранилище данных, который можно агрегировать по всем связанным с ним измерениям. |
Показатель оттока (Churn Rate) Attrition rate, Коэффициент оттока, Показатель истощения |
Показатель, характеризующий интенсивность оттока клиентов компании в течение определённого периода времени. |
Понижение размерности (Data reduction) Сокращение размерности, Снижение размерности |
В аналитических технологиях — процесс преобразования избыточных данных в форму, удобную для анализа. Обычно достигается уменьшением их объема, сокращением количества используемых признаков и разнообразия их значений. |
Популярный набор (Frequent Itemset) Частый предметный набор, Часто встречающееся множество |
Набор предметов (например, товаров, приобретаемых вместе), имеющий поддержку (частоту появления) выше некоторого порога. В аналитике данных термин относят к ассоциативным правилам и задаче анализа рыночной корзины. |
Последовательный шаблон (Sequence pattern) |
Последовательные шаблоны — одно из направлений Data Mining, в котором решается задача обнаружения значимых связей между событиями, происходящими последовательно. |
Потоковая аналитика (Streaming analytics) |
Направление в бизнес-аналитике, при котором данные собираются и обрабатываются в реальном времени по мере их создания, что позволяет принимать своевременные и упреждающие решения. |
Правила Кодда (Codd's rules) |
13 правил, которым должна удовлетворять каждая система управления реляционными базами данных. Позволили четко определить требования к реляционным СУБД и помешать продавать старые решения под видом реляционных систем. |
Правило трех сигм (3-sigma rule) |
Правило утверждает, что вероятность отклонения случайной величины от своего математического ожидания более чем на три среднеквадратических отклонения практически равна нулю. |
Предметная область (Object domain) |
Множество понятий и объектов, рассматриваемых в пределах отдельного рассуждения, исследования или теории. В анализе данных предметной областью может являться компания, внешнее окружение, сегмент рынка и т.д. |
Предобработка данных (Data Preprocessing) |
Приведение данных в соответствие с требованиями, которые определяются спецификой решаемой задачи. Выполняется на протяжении всего процесса Data Mining — при выгрузке из источников и OLTP-систем, в хранилище данных и в аналитической платформе. |
Преобразование Фурье (Fourier transform) |
Интегральное преобразование, которое преобразует функцию с временной области в частотную. Является основой методов спектрального анализа, позволяющего упростить некоторые задачи анализа данных. |
Принцип максимальной энтропии (Maximum entropy method) |
В теории вероятности — утверждение, что распределение вероятностей, которое наилучшим образом отражает текущее состояние данных — это распределение с наибольшей информационной энтропией. |
Принятие решения в реальном времени (Real Time Decisions) RTD |
В управлении и маркетинге — технология поддержки принятия управленческих решений в режиме реального времени. Решения, принимаемые в реальном времени, основываются на специальных аналитических моделях Data Mining. |
Проверка соответствия (Conformance Checking) |
Проверка соответствия (Conformance Checking) — сопоставление существующей модели процесса с журналом событий этого же процесса и оценка полученной модели. |
Прогноз (Forecast) |
Обоснованное суждение о возможном состоянии исследуемого процесса или объекта в будущем. Прогнозирование является одной из важнейших задач аналитических технологий Data Mining. |
Прогноз агрегированный (Aggregating forecast) Прогноз комбинированный, Прогноз обобщенный |
Методика, когда сначала строятся отдельные прогнозы для составных частей системы, а затем они агрегируются в прогноз для всей системы. Например, прогнозы по отдельным магазинам комбинируются в прогноз для всей сети. |
Прогноз нормативный (Normative projection) |
Прогноз, направленный на определение путей и сроков достижения состояний бизнес-процесса, принимаемых в качестве цели. Позволяет разработать меры воздействия на объект прогнозирования для достижения желаемых показателей. |
Прогнозирование (Forecasting) |
Предсказание будущих событий, явлений, состояний различных объектов и процессов. Является одной из задач Data Mining и одним из ключевых моментов при принятии решений. |
Прогнозирование спроса (Demand forecasting) |
Область предсказательной аналитики, задачей которой является предсказание спроса на продукты и услуги. Использует методы скользящего среднего, ARIMA, аддитивные модели на основе самообучающихся алгоритмов и машинного обучения. |
Программный интерфейс ODBC (Open Database Connectivity) |
Программный интерфейс (API) доступа к базам данных, разработанный Microsoft. Позволяет использовать один интерфейс доступа к данным, не беспокоясь о тонкостях взаимодействия с несколькими источниками. |
Производственный запас (Manufacturing stock) Производственные резервы, Productive reserves |
Резервы, формируемые на предприятиях, предназначенные для обеспечения бесперебойного непрерывного производственного процесса. |
Противоречие (Contradiction) |
В анализе данных — ситуация, когда в двух записях множества данных одному и тому же набору значений входных атрибутов соответствуют различные наборы значений выходных. |
Профайлинг данных (Data Profiling) Профилирование данных |
Метод проверки качества данных. Заключается в проверке полей источника данных на соответствие заданным ограничениям, а также их исправлении. Например, приведение к единому формату разделителей целой и дробной частей числа. |
Профайлинг конкурентов (Competitor profiling) |
Систематический анализ конкурентов с целью изучения их опасности, возможных потерь, системы отношений с клиентами. Мощным средством анализа конкурентов являются технологии Data Mining. |
Профиль клиента (Customer profile) |
Совокупность характеристик, присущих определенной группе потребителей продуктов и услуг. Успешно строить профили клиентов позволяют методы Data Mining, такие как классификация и кластеризация. |
Процесс ELT (ELT-process) ELT, Extract-Load-Transform, Извлечение-загрузка-преобразование |
Процесс перемещения данных из различных источников в хранилище, альтернативный процессу ETL. Отличие заключается в том, что данные не преобразуются к единому формату и не подвергаются очистке, а загружаются в хранилище в сыром виде, «как есть». При этом предполагается, что преобразование данных с целью сделать их пригодными к анализу, будет производить в процессе выполнения аналитических запросов к хранилищу, т.е. по вызову («на лету»). |
Процесс ETL (ETL-process) ETL, Extract-Transform-Load, Извлечение-преобразование-загрузка |
Комплекс операций по переносу первичных данных из различных источников в аналитическое приложение или поддерживающее его хранилище данных. Составная часть этапа консолидации при анализе данных. |
Процесс-майнинг (Process mining) Извлечение процессов, Глубинный анализ процессов, Процессная аналитика |
Семейство методов в области управления процессами, поддерживающих анализ бизнес-процессов на основе журналов событий. Алгоритмы анализа данных позволяют обнаруживать в процессах скрытые зависимости. |
Прямая реклама (Direct Advertising) Above-the-line, ATL |
Реклама для широкой аудитории с обезличенным рекламным сообщением. Размещается посредством традиционных каналов — СМИ, наружная (outdoor) и внутренняя (indoor) реклама. Синоним — ATL, above-the-line. |
Путь процесса (Process Path) |
Путь процесса (Process Path) — это конкретная последовательность событий, которая хотя бы раз встречалась в ходе процесса. |