Название/Синоним Описание
Малокодовая разработка (Low-code) Разработка с минимальным кодированием Концепция в области разработки прикладного программного обеспечения с помощью графических интерфейсов с минимальным (low-code) использованием ручного написания кода, или вообще без него (no-code).
Маркетинг, управляемый данными (Data driven marketing) Маркетинг, основанный на данных Бизнес-стратегия, направленная на совершенствование маркетинговой деятельности компании за счёт знаний, полученных с использованием анализа данных о клиентах.
Мастер-данные (Master data) Основные данные, Справочная информация, Нормативно-справочная информация, НСИ, Reference data Корпоративные данные, которые носят информационно-справочный характер. Содержат информацию о бизнес-объектах организации — клиентах, сотрудниках, поставщиках, материалах, оборудовании и т.д. Создают контекст для бизнес-операций
Масштабируемый алгоритм (Scalable Algorithm) Алгоритм, вычислительные затраты которого прямо пропорциональны объему обрабатываемых данных. Особенно важно свойство масштабируемости для алгоритмов, используемых при анализе больших данных и в машинном обучении.
Математическая статистика (Mathematical statistics) Наука о математических методах анализа данных, полученных на основе большого числа наблюдений (измерений, опытов). Методы математической статистики являются основной построения большинства аналитических моделей Data Mining.
Математическое ожидание (Expectation value) Ожидаемое значение, Expected value Среднее значение случайной величины, полученное при бесконечном числе испытаний или по выборке бесконечного размера. Одно из важнейших понятий теории вероятности, поскольку может служить усредненной оценкой случайной величины.
Матрица BCG (Boston Consulting Group Matrix) Product portfolio matrix, Boston Box, BCG-matrix, Boston matrix, Boston Consulting Group analysis Инструмент для анализа продуктовых линеек, который делит продукты на четыре категории в зависимости от доли рынка и динамики продаж. Применяется для стратегического анализа, прогнозирования продаж, формирования продуктовых линеек. Синоним — Бостонская матрица.
Матрица издержек классификации (Cost-matrix) В статистике — разновидность таблицы сопряженности, в которой для каждого типа ошибок указываются издержки классификации в денежном, количественном выражении или в виде весов. Используется для оптимизации аналитических моделей.
Матрица миграции (Migration matrix) Матрица переходов Маркова, Матрица вероятностей переходов, Стохастическая матрица, Probability matrix, Transition matrix, Markov matrix, Stochastic matrix Инструмент для оценивания кредитных рисков на основе вероятностей перехода (миграции) кредита из одной категории качества в другую. Матрица миграции состоит из вероятностей таких переходов.
Матрица ошибок (Error matrix) Матрица неточностей, Confusion matrix Способ визуализации результатов работы классификатора для оценки его качества.
Машинное обучение (Machine learning) Направление искусственного интеллекта, связанное с разработкой аналитических моделей, которые автоматически обнаруживают в данных скрытые закономерности и самостоятельно приобретают свойства, необходимые для распознавания этих закономерностей.
Машины опорных векторов (Support vector machines) Метод опорных векторов, SVM В машинном обучении — семейство алгоритмов бинарной классификации, основанных на обучении с учителем, использующих линейное разделение пространства признаков с помощью гиперплоскости.
Медиана (Median) Медиана статистическая, Непараметрическая средняя В статистике и теории вероятности — величина, такая что половина значений выборки больше неё, а другая половина — меньше. Иными словами, медиана представляет собой срединное значение упорядоченного по возрастанию (или убыванию) числового ряда. Используется как альтернатива среднему, устойчивая к выбросам и аномалиям в данных.
Медленно меняющиеся измерения (Slowly changing dimensions) SCDs В теории баз данных — измерения, значения которых со временем могут изменяться, но не часто. При этом изменяются неключевые атрибуты измерения.
Мера (Measure) Показатель, Факт, Fact Качественная или количественная характеристика состояния некоторого объекта или процесса. В анализе данных и многомерном моделировании является синонимом факта.
Метаданные (Metadata) Данные о данных Метаданные — это специальный вид данных, которые описывают структуру и свойства других данных.
Метка класса (Class Label) Переменная класса Выходная переменная классификационной модели. Всегда является дискретной и принимает значения из некоторого ограниченного набора категорий — наименований классов. Синоним — переменная класса.
Метод k-ближайших соседей (K-nearest neighbor) Используется для решения задачи классификации. Относит объекты к классу, которому принадлежит большинство из k его ближайших соседей в многомерном пространстве признаков. Один из простейших алгоритмов обучения классификационных моделей.
Метод k-средних (K-means) Используется для кластеризации данных на основе алгоритма разбиения векторного пространства на заранее определенное число кластеров. Преимущества метода — скорость и простота реализации.
Метод главных компонент (Principal component analysis) Преобразование Хоттелинга, PCA Технология многомерного статистического анализа для сокращения размерности пространства признаков с минимальной потерей полезной информации. Широко используется в аналитике данных на этапе предобработки.
Метод Дельфи (Delphi technique) Estimate-Talk-Estimate, ETE, Метод структурированной коммуникации Метод интерактивного прогнозирования, основанный на оценках группы экспертов. Участники отвечают на вопросы в несколько раундов, после каждого из которых получают анонимные ответы других экспертов и могут уточнить свои суждения.
Метод имитации отжига (Simulated annealing) Метод модельной закалки, Алгоритм имитации отжига Вероятностный метод глобальной оптимизации функций. В анализе данных известен как популярный метод обучения нейронных сетей. Название метода происходит из металлургии, а именно технологии отжига металла.
Метод максимального правдоподобия (Maximum likelihood estimation) MLE, Метод наибольшего правдоподобия Статистический метод оценки параметров вероятностных распределений с помощью максимизации функции правдоподобия.
Метод Монте-Карло (Monte-Carlo technique) Метод статистических испытаний Класс вычислительных алгоритмов, моделирующих исследуемый процесс путем многократных повторений его случайных реализаций. Используются при решении задач оптимизации, численного интегрирования, анализа рисков в бизнесе и других.
Метод муравьиной колонии (Ant colony optimization) Муравьиный алгоритм Алгоритм для нахождения приближенных решений задач оптимизации на графах, таких как задача коммивояжера, транспортная задача и аналогичных. Используется во многих приложениях анализа.
Метод наименьших квадратов (Least-Squares method) МНК, Least squares Математический подход для оценки параметров моделей (например, регрессионной) на основании экспериментальных данных, содержащих случайные ошибки. Важнейшим применением метода в анализе данных является линейная регрессия.
Метод Ньютона (Newton method) Метод касательных, Алгоритм Ньютона Алгоритм для экспериментального поиска экстремума функции. Используется в анализе данных для решения задач оптимизации, где требуется определить нуль первой производной либо градиента в случае многомерного пространства.
Метод рулетки (Roulette wheel parent selection) Выбор родителей по правилу рулетки В генетических алгоритмах используется для определения, какие решения задачи (члены популяции) выбираются для размножения. Популяция представляется колесом рулетки, где сектор каждой особи пропорционален значению её показателя приспособленности.
Метод скользящего окна (Windowing method) Метод кадрирования В анализе данных — алгоритм трансформации, позволяющий сформировать из членов временного ряда набор данных, который может служить обучающим множеством для построения модели прогнозирования.
Метод фокус-групп (Focus group method) Технология маркетингового исследования, состоящая в проведении групповой дискуссии под руководством модератора. Позволяет на основе небольшой группы потребителей выявить мнение о компании, продукте и т.д. широкой целевой аудитории.
Методология CRISP-DM (Cross-Industry Standard Process for Data Mining) Открытый стандарт моделирования процессов, описывающий общие подходы, используемые в интеллектуальном анализе данных. Де-факто является стандартом для разработки проектов Data Analytics и Data Mining.
Метрика (Metric) Метрическое пространство В анализе данных — функция для определения расстояния между многомерными векторами в пространстве признаков. Понятие метрики важно для понимания работы моделей анализа данных, использующих операции с многомерными векторами.
Метрика TF-IDF (Term frequency–inverse document frequency) TF-IDF — статистический показатель, применяемый для оценки важности слова для категории, документа или коллекции. Используется при анализе текстовых данных и рассчитывается для каждого слова.
Мешок слов (Bag of words) Мешок слов — представление текста в виде массива, состоящего из отдельных слов и количества их использования. Применяется при анализе естественного языка и в составе алгоритмов компьютерного зрения. Является подготовительной стадией для подсчёта метрики «tf-idf».
Микромаркетинг (Micromarketing) Маркетинговая стратегия, ориентированная на достаточно узкую группу или даже отдельных клиентов, выявленных в результате микросегментации потребительской аудитории.
Микросегментация (Microsegmentation) Разновидность сегментации клиентов, когда каждый сегмент образуется очень небольшим числом потребителей. Микросегменты могут стать основой маркетинговых кампаний с высоким уровнем персонализации.
Многомасштабный анализ (Multiresolutional analysis) Кратномасштабный анализ, Multiscale approximation, Multiscale analysis, MRA, MSA Технология проектирования дискретных вейвлет-преобразований и алгоритма быстрого вейвлет-преобразования. Можно рассматривать как исследование графика какого-либо процесса с помощью набора луп с разным увеличением.
Многомерная база данных (Multi-dimensional Database) СУМБД, Многомерное хранилище данных, СУБД с изменяемой размерностью База данных, в которой данные организованы в виде упорядоченных многомерных массивов. В многомерных СУБД информация является логически целостной. Многомерные СУБД интенсивно внедряются с развитием OLAP-технологий.
Многомерность (Multidimensional) В анализе данных — механизм, с помощью которого реализуется оперативный анализ данных (OLAP). Включает многомерное хранение, многомерное представление и многомерную обработку данных.
Многослойная нейронная сеть (Multilayer neural net) Multilayer neural network, Multilayer Artificial Neural Network, Плоскослоистая нейронная сеть Нейронная сеть, в которой нейроны сгруппированы в слои. При этом каждый нейрон предыдущего слоя связан со всеми нейронами следующего слоя, а внутри слоёв связи между нейронами отсутствуют.
Многослойный персептрон (Multilayered perceptron) MLP, Многослойный персептрон Румельхарта Класс искусственных нейронных сетей прямого распространения, состоящих как минимум из трех слоёв — входного, скрытого и выходного. Являются популярными инструментом анализа данных.
Множественная линейная регрессия (Multiple Linear Regression) Многофакторная линейная регрессия Линейная регрессия, в модели которой число независимых переменных две или более. Несколько входных переменных позволяет увеличить долю объяснённой дисперсии выходной переменной.
Множество валидационное (Validation set) В машинном обучении — подмножество примеров обучающего набора данных, формирующееся независимо от обучающего и тестового множеств и использующееся для проверки предсказательной способности модели.
Множество обучающее (Training set) Выборка обучающая, Множество тренировочное В машинном обучении — набор структурированных данных, используемый для обучения аналитических моделей — нейронных сетей, деревьев решений, карт Кохонена и др.
Множество тестовое (Test set) Выборка тестовая В машинном обучении — подмножество обучающего набора данных, содержащее тестовые примеры, т.е. примеры для проверки результатов обучения. Ошибка модели, полученная на тестовом множестве, называется ошибкой обобщения.
Мода распределения (Mode) В статистике — значение, которое случайная величина на заданном множестве наблюдений принимает наиболее часто. С точки зрения анализа данных, мода несёт информацию о типичных значениях признака.
Моделирование (Modelling) Построение и изучение моделей объектов, процессов и явлений с целью обнаружения закономерностей их развития и прогнозирования их состояния в будущем. Играет ключевую роль в аналитических технологиях Data Mining.
Моделирование данных (Data Modelling) Определение и анализ требований к данным, необходимым для поддержки бизнес-процессов. Позволяет создать единую информационную модель компании, интегрировать ресурсы в информационную систему, проектировать базы данных.
Моделирование на основе аналогий (Look-alike modeling) LAM В маркетинге, технология анализа данных, позволяющая обнаруживать новые целевые аудитории на основе аналогий с профилями клиентов из существующих аудиторий.
Модель GARCH (GARCH-model) Обобщенная авторегрессионная модель гетероскедастичности, Generalized Autoregressive Conditional Heteroscedastic model Модель, используемая для прогнозирования ситуации на финансовых рынках в условиях нестабильности (волатильности). В таких условиях обычные линейные регрессионные модели оказываются слишком грубыми.
Модель MapReduce (MapReduce model) Разработанная Google программная модель и комплекс процедур генерирования и обработки больших массивов данных с помощью распределенных вычислений на большом числе узлов. Применима в широкой области задач, в т.ч. в машинном обучении.
Модель авторегрессии скользящего среднего (ARIMA) Модель Бокса-Дженкинса, АРИСС, Методология Бокса-Дженкинса, Autoregressive Integrated Moving Average, Box-Jenkins model Модель авторегрессии скользящего среднего, наиболее полно и компактно описывающая автокорреляционные свойства стационарного временного ряда. Широко применяется при прогнозировании временных рядов.
Модель временного ряда многомерная (Time-series multidimensional model) Модель, в которой значения членов ряда зависят не только от предшествующих значений этого же ряда, но и от значений нескольких других рядов.
Модель временного ряда одномерная (Time-series one-dimensional model) Модель, в которой значение каждого члена ряда рассматривается как взвешенная сумма некоторого числа значений предшествующих членов этого же временного ряда.
Модель нейронной сети (Network model) Модель нейронной сети описывает её архитектуру и конфигурацию, а также используемые алгоритмы обучения. Каждая архитектура сети предназначения для решения определённого класса задач анализа данных.
Модель скользящего среднего (Model of moving average) Moving-average model, MA-model Распространенный подход для моделирования одномерных временных рядов. Концептуально представляет собой линейную регрессию прогнозируемого значения ряда относительно текущего и ранее наблюдаемых случайных компонентов.
Модель Хольта (Holt's model) Модель прогнозирования, представляющая динамику временного ряда как линейную зависимость с постоянно изменяющимися параметрами.
Модель экспоненциального сглаживания (Exponential smoothing model) Модель Брауна, Brown model Один из простейших и распространенных приемов выравнивания временного ряда. Может отображать развитие в виде линейной тенденции, в виде случайного процесса, не имеющего тенденции, а также в виде изменяющейся параболической тенденции.
Мониторинг (Monitoring) Отслеживание Постоянное наблюдение за каким-либо явлением или процессом, отслеживание состояния конкретного объекта с целью оценки и анализа его поведения или ситуации в целом.
Мошенничество (Fraud) В анализе данных — обманные действия в области кредитования, банковских карт, телекоммуникациях и других сферах, где они могут быть выявлены с помощью аналитических методов.
Мультиколлинеарность (Multicollinearity) В статистическом моделировании ситуация, когда две или более независимых переменных модели коррелированны. Мультиколлинеарность приводит к неустойчивости оценок параметров статистических моделей, когда даже небольшие изменения в исходных данных приводят к значительным изменениям в модели.
Мягкие вычисления (Soft computing) Методология использования неточных и математически строго не обоснованных методов и алгоритмов при решении задач, для которых не существует строгих подходов. Включает технологии машинного обучения.