Название/Синоним Описание
Пакетная аналитика (Batch analytics) Направление в бизнес-аналитике, при котором данные анализируются после того, как они были собраны в пакеты, сохраненные на постоянных носителях.
Пакетный режим (Batch processing) Пакетная обработка Режим работы компьютера, реализующий многозадачность, когда система обрабатывает заранее сформированный пакет заданий пользователя без вмешательства последнего. Эффективен при загрузке и обновлении больших объемов информации в базах данных.
Парсер (Parser) Cинтаксический анализатор Программа или сервис для сбора и анализа большого объёма данных в автоматическом режиме.
Переобучение (Overtraining) В машинном обучении — явление, когда модель хорошо распознает примеры из обучающего множества, но не распознает или плохо распознает любые другие примеры, не участвовавшие в процессе обучения.
Персонализация (Personalization) Кастомизация, Customization Процесс адаптации продукции и услуг компании к узкой целевой аудитории. Предсказательная персонализация определяет особенности потребительского поведения. Для этих целей используются технологии анализа данных.
Платформа клиентских данных (Customer Data Platform) CDP Совокупность программных средств для сбора данных о клиентах из различных источников, их обработки, консолидации, хранения и использования для профилирования, сегментации, улучшения таргетинга и повышения эффективности маркетинговых кампаний.
Платформа управления данными (Data management platform) ПУД, DMP Программная платформа для сбора, хранения, анализа и использования данных. В бизнес-аналитике используется для управления клиентскими данными с целью формирования целевых сегментов и повышения эффективности маркетинговых кампаний.
Площадь под ROC-кривой (Area Under The ROC Curve) AUC, Область под ROC-кривой Часть координатной плоскости под графиком ROC-кривой. В математической статистике и машинном обучении является мерой качества модели бинарной классификации. В идеальной модели площадь под ROC-кривой максимальна и равна 1.
Поведенческая аналитика (Behavioral analytics) Анализ потребительского поведения пользователей платформ электронной коммерции, мобильных и веб-приложений, он-лайн игр и других сетевых ресурсов. Позволяет обнаруживать шаблоны потребительского поведения.
Поведенческий скоринг (Behavioral scoring) Метод количественной оценки состояния кредитоспособности заемщика, основанный на данных об истории операций по его счетам (график погашения задолженности, запросы новых кредитов, оборот по текущим счетам и т.п.).
Поддержка ассоциативного правила (Association Rule Support) Показатель, характеризующий качество ассоциативного правила. Является мерой надежности, с которой ассоциативное правило выражает связь между условием и следствием.
Подход, управляемый данными (Data Driven approach) Принятие решений на основе данных, Data driven decision making, DDDM Подход к управлению, в основе которого лежит использование данных, собираемых компанией, и результатов их анализа в процессах принятия управленческих решений.
Пожизненная ценность клиента (Customer Lifetime Value) Customer lifetime value, CLV, CLTV, Lifetime customer value, LCV Ожидаемая чистая прибыль, которая может быть получена в течение всего цикла отношений с клиентом. Точные модели для оценки пожизненной ценности строятся с использованием сложных методов прогнозной аналитики.
Показатели оценки инвестиций (Investment appraisal indicators) Набор финансовых показателей, которые позволяют оценить ожидаемую прибыльность инвестиций с различных точек зрения, а также определить насколько тот или иной инвестиционный проект соответствует интересам участников и их бизнес-целям.
Показатель аддитивный (Additive measure) Аддитивная мера, Аддитивный факт, Агрегируемый показатель, Additive fact, Additive index, Aggregate index Показатель (факт), в многомерном хранилище данных, который можно агрегировать по всем связанным с ним измерениям.
Показатель оттока (Churn Rate) Attrition rate, Коэффициент оттока, Показатель истощения Показатель, характеризующий интенсивность оттока клиентов компании в течение определённого периода времени.
Понижение размерности (Data reduction) Сокращение размерности, Снижение размерности В аналитических технологиях — процесс преобразования избыточных данных в форму, удобную для анализа. Обычно достигается уменьшением их объема, сокращением количества используемых признаков и разнообразия их значений.
Популярный набор (Frequent Itemset) Частый предметный набор, Часто встречающееся множество Набор предметов (например, товаров, приобретаемых вместе), имеющий поддержку (частоту появления) выше некоторого порога. В аналитике данных термин относят к ассоциативным правилам и задаче анализа рыночной корзины.
Последовательный шаблон (Sequence pattern) Последовательные шаблоны — одно из направлений Data Mining, в котором решается задача обнаружения значимых связей между событиями, происходящими последовательно.
Потоковая аналитика (Streaming analytics) Направление в бизнес-аналитике, при котором данные собираются и обрабатываются в реальном времени по мере их создания, что позволяет принимать своевременные и упреждающие решения.
Правила Кодда (Codd's rules) 13 правил, которым должна удовлетворять каждая система управления реляционными базами данных. Позволили четко определить требования к реляционным СУБД и помешать продавать старые решения под видом реляционных систем.
Правило трех сигм (3-sigma rule) Правило утверждает, что вероятность отклонения случайной величины от своего математического ожидания более чем на три среднеквадратических отклонения практически равна нулю.
Предметная область (Object domain) Множество понятий и объектов, рассматриваемых в пределах отдельного рассуждения, исследования или теории. В анализе данных предметной областью может являться компания, внешнее окружение, сегмент рынка и т.д.
Предобработка данных (Data Preprocessing) Приведение данных в соответствие с требованиями, которые определяются спецификой решаемой задачи. Выполняется на протяжении всего процесса Data Mining — при выгрузке из источников и OLTP-систем, в хранилище данных и в аналитической платформе.
Преобразование Фурье (Fourier transform) Интегральное преобразование, которое преобразует функцию с временной области в частотную. Является основой методов спектрального анализа, позволяющего упростить некоторые задачи анализа данных.
Принцип максимальной энтропии (Maximum entropy method) В теории вероятности — утверждение, что распределение вероятностей, которое наилучшим образом отражает текущее состояние данных — это распределение с наибольшей информационной энтропией.
Принятие решения в реальном времени (Real Time Decisions) RTD В управлении и маркетинге — технология поддержки принятия управленческих решений в режиме реального времени. Решения, принимаемые в реальном времени, основываются на специальных аналитических моделях Data Mining.
Проверка соответствия (Conformance Checking) Проверка соответствия (Conformance Checking) — сопоставление существующей модели процесса с журналом событий этого же процесса и оценка полученной модели.
Прогноз (Forecast) Обоснованное суждение о возможном состоянии исследуемого процесса или объекта в будущем. Прогнозирование является одной из важнейших задач аналитических технологий Data Mining.
Прогноз агрегированный (Aggregating forecast) Прогноз комбинированный, Прогноз обобщенный Методика, когда сначала строятся отдельные прогнозы для составных частей системы, а затем они агрегируются в прогноз для всей системы. Например, прогнозы по отдельным магазинам комбинируются в прогноз для всей сети.
Прогноз нормативный (Normative projection) Прогноз, направленный на определение путей и сроков достижения состояний бизнес-процесса, принимаемых в качестве цели. Позволяет разработать меры воздействия на объект прогнозирования для достижения желаемых показателей.
Прогнозирование (Forecasting) Предсказание будущих событий, явлений, состояний различных объектов и процессов. Является одной из задач Data Mining и одним из ключевых моментов при принятии решений.
Прогнозирование спроса (Demand forecasting) Область предсказательной аналитики, задачей которой является предсказание спроса на продукты и услуги. Использует методы скользящего среднего, ARIMA, аддитивные модели на основе самообучающихся алгоритмов и машинного обучения.
Программный интерфейс ODBC (Open Database Connectivity) Программный интерфейс (API) доступа к базам данных, разработанный Microsoft. Позволяет использовать один интерфейс доступа к данным, не беспокоясь о тонкостях взаимодействия с несколькими источниками.
Производственный запас (Manufacturing stock) Производственные резервы, Productive reserves Резервы, формируемые на предприятиях, предназначенные для обеспечения бесперебойного непрерывного производственного процесса.
Противоречие (Contradiction) В анализе данных — ситуация, когда в двух записях множества данных одному и тому же набору значений входных атрибутов соответствуют различные наборы значений выходных.
Профайлинг данных (Data Profiling) Профилирование данных Метод проверки качества данных. Заключается в проверке полей источника данных на соответствие заданным ограничениям, а также их исправлении. Например, приведение к единому формату разделителей целой и дробной частей числа.
Профайлинг конкурентов (Competitor profiling) Систематический анализ конкурентов с целью изучения их опасности, возможных потерь, системы отношений с клиентами. Мощным средством анализа конкурентов являются технологии Data Mining.
Профиль клиента (Customer profile) Совокупность характеристик, присущих определенной группе потребителей продуктов и услуг. Успешно строить профили клиентов позволяют методы Data Mining, такие как классификация и кластеризация.
Процесс ELT (ELT-process) ELT, Extract-Load-Transform, Извлечение-загрузка-преобразование Процесс перемещения данных из различных источников в хранилище, альтернативный процессу ETL. Отличие заключается в том, что данные не преобразуются к единому формату и не подвергаются очистке, а загружаются в хранилище в сыром виде, «как есть». При этом предполагается, что преобразование данных с целью сделать их пригодными к анализу, будет производить в процессе выполнения аналитических запросов к хранилищу, т.е. по вызову («на лету»).
Процесс ETL (ETL-process) ETL, Extract-Transform-Load, Извлечение-преобразование-загрузка Комплекс операций по переносу первичных данных из различных источников в аналитическое приложение или поддерживающее его хранилище данных. Составная часть этапа консолидации при анализе данных.
Процесс-майнинг (Process mining) Извлечение процессов, Глубинный анализ процессов, Процессная аналитика Семейство методов в области управления процессами, поддерживающих анализ бизнес-процессов на основе журналов событий. Алгоритмы анализа данных позволяют обнаруживать в процессах скрытые зависимости.
Прямая реклама (Direct Advertising) Above-the-line, ATL Реклама для широкой аудитории с обезличенным рекламным сообщением. Размещается посредством традиционных каналов — СМИ, наружная (outdoor) и внутренняя (indoor) реклама. Синоним — ATL, above-the-line.
Путь процесса (Process Path) Путь процесса (Process Path) — это конкретная последовательность событий, которая хотя бы раз встречалась в ходе процесса.