Название/Синоним Описание
Самоорганизующаяся карта (Self Organizing map) Карта Кохонена, SOM, Kohonen map Разновидность сети Кохонена, которая позволяет не только производить кластеризацию объектов, но и выполнять многомерную визуализацию ее результатов. Количество выходных нейронов соответствует количеству сегментов карты.
Сбалансированная система показателей (Balanced Scorecard) СПП, BSC Стратегия управления эффективностью деятельности компании, основанная на ее декомпозиции на уровни операционного управления и контроля на основе ключевых показателей эффективности (KPI).
Сегментация клиентов (Customer segmentation) Группировки клиентов на основе некоторых общих характеристик, которые являются важными с точки зрения задач маркетинга. Позволяет разделить потребительский рынок на сегменты, чтобы определить, на каком из них следует сосредоточить усилия по продвижению товаров и услуг.
Сегментация рынка (Market segmentation) Разделение рынка на группы покупателей, обладающих схожими характеристиками, для изучения их реакции на предложение того или иного товара или услуги. Технологии Data Mining предоставляют различные методы сегментации.
Сезонная составляющая (Seasonal component) Сезонность, Сезонный компонент Составляющая временного ряда, которая описывает регулярные изменения его значений в пределах некоторого периода и представляющая собой последовательность почти повторяющихся циклов.
Сеть Байеса (Bayesian Network) Вероятностная сеть Направленный ациклический граф, представляющий совместное распределение случайных переменных. Позволяет ослабить требование к условной независимости признаков и применить простой классификатор Байеса.
Сеть Кохонена (Kohonen network) Специальный тип нейронной сети для решения задачи кластеризации. Состоит из двух слоев — входного (распределительного) и выходного, который также называют слоем Кохонена.
Силуэт кластера (Cluster silhouette) Диаграмма силуэта, Silhouette diagram Способ визуализации структуры, полученной в процессе кластеризации, позволяющий оценить согласованность с данными на основе анализа внутрикластерных и междукластерных расстояний.
Система CRM (Customer Relationship Management) Управление взаимоотношениями с клиентами, CRM Система управления отношениями с клиентами и партнерами. Включает средства для сбора, обработки, контроля, анализа и представления информации о клиентах. Наиболее эффективна при комбинации с системами бизнес-аналитики.
Система ERP (Enterprise Resource Planning) Система планирования и управления ресурсами предприятия, ERP Интегрированная среда управления бизнес-процессами с использованием информационных технологий и специального программного обеспечения. Состоит из приложений для сбора, хранения, управления и анализа данных.
Система поддержки принятия решений (Decision support system) СППР, DSS Информационная система, которая обеспечивает руководителя знаниями и информацией для принятия обоснованных и правильных управленческих решений. СППР, основанные на технологиях искусственного интеллекта, называются интеллектуальными СППР.
Сквозная аналитика (End-to-end analytics) Направление в бизнес-аналитике, ориентированное на оптимизацию маркетинговой стратегии за счет сбора и анализа данных о клиентах на всех этапах их взаимоотношений с компанией.
Скользящее среднее (Moving Average) Метод скользящего среднего, Moving average method, Rolling average, Running average Метод сглаживания временных рядов с целью исключения влияния случайной составляющей. Заключается в замене фактических значений членов ряда средним арифметическим значений нескольких ближайших к нему членов.
Скоринг (Scoring) Метод, использующий математические или статистические модели, которые на основе кредитной истории прошлых клиентов банка пытаются предсказать вероятность возврата кредита новым заёмщиком.
Скоринг отклика (Response scoring) Технология оценки вероятность отклика клиента на маркетинговые предложения. Позволяет оптимизировать бюджет маркетинговых кампаний, концентрируя усилия по продвижению продуктов на сегменте клиентов, которые в нём наиболее заинтересованы.
Скоринговая карта (Scorecard) Набор характеристик потенциального заемщика и присваиваемых им весовых коэффициентов. Использование скоринговых карт — часть методики оценки кредитоспособности заёмщиков, называемой скоринговым моделированием.
Скоринговая модель (Scoring model) Модель скоринга Главный инструмент кредитного скоринга. Связывает параметры клиента с суммой, которую можно выдать ему, или степенью кредитного риска в конкретных условиях через систему скоринговых баллов.
Скоринговая система (Scoring system) Разновидность систем поддержки принятия решений, в которой решения в отношении какого-либо процесса или объекта принимается в зависимости от начисленных для них балльных оценок (score), которые вычисляются скоринговой моделью на основе набора признаков в определённо шкале.
Скорректированный коэффициент детерминации (Adjusted coefficient of determination) Показатель, выражающий долю дисперсии зависимой переменной, объясняемую регрессионной моделью, скорректированный с помощью штрафа, накладываемого на модель при увеличении числа переменных.
Слово процесса (Process word) Символьное обозначение процесса в Process Mining-е для анализа и автоматизированной обработки.
Случайная составляющая временного ряда (Time-series random component) Стохастическая составляющая временного ряда Последовательность значений, которая является результатом воздействия на описываемый временным рядом процесс непредвиденных и не поддающихся учету факторов.
Случайный лес (Random Forest) Случайный лес — алгоритм машинного обучения заключающийся в использовании ансамбля решающих деревьев, дающий необходимый результат за счет количества деревьев
Случайный процесс (Random process) Множество случайных функций x по параметру t (обычно по времени), называемых возможными реализациями процесса. Теория случайных процессов может использоваться в аналитических технологиях для анализа временных рядов.
Событие (Event) Шаг процесса, Этап процесса, Действие, Activity Событие (Event) — это зафиксированное в журнале событий процессное действие в виде наименования или кода (ID) события. Последовательность событий в рамках одного экземпляра процесса является путем процесса.
Событие случайное (Random event) В теории вероятностей — событие, которое в результате эксперимента может произойти, а может и не произойти. Методы теории вероятностей позволяют определить вероятность наступления того или иного события.
Спектральный анализ (Spectral analysis) Фурье-анализ, Гармонический анализ, Frequency analysis Класс методов обработки данных, в основе которых лежит их частотное представление, или спектр. Один из наиболее эффективных и хорошо разработанных методов обработки данных.
Специфичность (Specificity) True Negative Rate, TNR Показатель, отражающий точность работы модели бинарной классификации. Определяется как отношение числа истинно-отрицательных классификаций к общему числу отрицательных классификаций.
Справочные данные (Reference data) Нормативно-справочная информация, НСИ Медленно меняющиеся данные, содержащие заранее определенный набор значений или категорий, которые могут быть стандартизированы в рамках организации и обеспечивают контекст для основных данных.
Спрос (Demand) В экономике — количество товара (объем услуг), которое покупатели желают купить по данной цене. Полным спросом на товар является совокупность спросов на него по различным ценам.
Среднее значение из наиболее вероятного интервала (Mean most likely interval) Значение, используемое как альтернатива среднему значению и медиане, устойчивое к выбросам и аномальным значениям.
Среднеквадратическая регрессия (Mean square regression) Least Mean Square Regression, LMS В анализе данных — разновидность регрессии, где при определении параметров модели используется метод наименьших средних квадратов. Применяется при обучении нейронных сетей с помощью алгоритма обратного распространения ошибки.
Среднеквадратическое отклонение (Mean square deviation) Среднее квадратическое отклонение, Среднеквадратичное отклонение, Квадратичное отклонение, Стандартное отклонение, Standard deviation Статистическая характеристика распределения случайной величины, показывающая среднюю степень разброса ее значений относительно математического ожидания. В анализе данных используется как мера изменчивости значений признаков.
Средняя абсолютная ошибка (Mean Absolute Error) Средняя абсолютная погрешность, MAE В статистике и машинном обучении используется в качестве меры оценки точности аналитических моделей, а также для их сравнения. Определяется как среднее абсолютных разностей между оценкой, которую на даном примере выдала модель и целевым значением.
Средняя относительная ошибка (Mean Relational Error) Средняя относительная ошибка в процентах, Mean Relational Percentage Error, MRPE, Mean absolute percent error, MAPE, MRE В статистике и машинном обучении используется в качестве относительной меры оценки точности аналитических моделей, а также для их сравнения. Определяется как среднее абсолютных разностей между оценкой, которую на данном примере выдала модель и целевым значением, отнесённых к величине целевого значения.
Стандартизация данных (Data standardization) Разновидность предобработки данных с целью приведения их к определённому формату и представлению, которые обеспечивают их корректное применение в многомерном анализе, совместных исследованиях, сложных технологиях аналитической обработки.
Стандартная ошибка оценивания (Standard estimation error) Величина, равная квадратному корню среднеквадратической ошибки регрессии. Позволяет увидеть степень отклонения полученных значений с фактическими и таким образом оценить точность модели.
Статистическая значимость (Statistical significance) Оцененная мера уверенности в том, что полученный результат не является случайным. Результатом могут быть различие распределения двух выборок, степень отличия некоторого статистического распределения от нормального и т.д.
Статистическая мощность (Statistical power) Мощность проверки бинарной гипотезы, Power of a test В математической статистике вероятность того, что в результате статистического теста нулевая гипотеза будет правильно отклонена при условии, что альтернативная гипотеза истинна.
Статистическая проверка гипотез (Hypotesis testing) Процедура обоснованного сопоставления высказанной гипотезы о природе или величине неизвестных статистических параметров анализируемого явления с имеющимися в распоряжении исследователя выборочными данными (выборкой).
Стационарный процесс (Stationary process) Стационарный случайный процесс, Стохастический процесс, Stochastic process Случайный процесс, вероятностные характеристики (среднее и дисперсия) которого не зависят от времени. Стационарный процесс имеет вид непрерывных случайных колебаний вокруг некоторого среднего значения.
Стемминг (Stemming) Стемминг позволяет выделить основу для заданного слова. Это даёт возможность проанализировать все словоформы одного слова как единый элемент, что значительно повышает качество анализа. Стемминг может осуществляться поиском по заданному словарю, удаление приставок, суффиксов и окончаний или комбинацией нескольких вариантов.
Страховой запас (Security stock) Запас сырья, материалов или топлива, предназначенный для бесперебойного снабжения производства и потребления в случае возникновения непредвиденных обстоятельств.
Структурированные данные (Structured data) Данные, отражающие факты предметной области и упорядоченные с целью обеспечения возможности применения к ним различных методов обработки. Большинство алгоритмов анализа данных работают со структурированными данными.
Суррогатная модель (Surrogate model) Метамодель, Эмулятор, Подменная модель, Замещающая модель, Апроксимирующая модель, Metamodel, Emulator Упрощенные и недорогие имитационные моделей, использующихся для замещения более дорогих и точных моделей с целью удешевления и сокращения времени процессов конструирования технических объектов и моделирования сложных бизнес-процессов.
Схема Звезда (Star scheme) Логическая модель данных, используемая в многомерном хранилище данных. В ней используется таблица фактов, расположенная в центре, и несколько таблиц измерений, образующих лучи.
Схема Снежинка (Snowflake scheme) Вид логической структуры реляционного хранилища данных, которая использует единственную таблицу фактов и несколько таблиц измерений. Основная особенность схемы — возможность хранения иерархических измерений.
Сходимость алгоритма (Convergence of algorithm) Свойство итерационного алгоритма достигать оптимума целевой функции или подходить близко к нему за конечное число шагов. Скорость сходимости алгоритмов — один из важнейших показателей качества аналитических обучаемых моделей.
Сценарий (Scenario) Сезонность, Сезонный компонент В прогнозировании — описание возможных вариантов развития процесса. В анализе данных — специально разработанная последовательность действий над данными, которая приводит к желаемым результатам анализа.
Сценарный анализ (Scenario analysis) Разновидность анализа данных, где используется набор подробных описаний последовательности действий, которые с прогнозируемой вероятностью могут привести к желаемому или планируемому конечному результату.
Счастливый путь (Happy path) Основной путь, Счастливый поток, Золотой путь, Golden path, Happy flow Счастливый путь (Happy path) — упорядоченный и корректный перечень событий, наиболее часто встречающийся в бизнес-процессе.
Сэмплинг (Sampling) Отбор Процесс отбора из исходного набора данных выборки наблюдений, представляющей интерес для анализа. При реализации сэмплинга используются специальные методы отбора, которые должны обеспечить репрезентативность выборки.