Малокодовая разработка (Low-code) Разработка с минимальным кодированием |
Концепция в области разработки прикладного программного обеспечения с помощью графических интерфейсов с минимальным (low-code) использованием ручного написания кода, или вообще без него (no-code). |
Маркетинг, управляемый данными (Data driven marketing) Маркетинг, основанный на данных |
Бизнес-стратегия, направленная на совершенствование маркетинговой деятельности компании за счёт знаний, полученных с использованием анализа данных о клиентах. |
Мастер-данные (Master data) Основные данные, Справочная информация, Нормативно-справочная информация, НСИ, Reference data |
Корпоративные данные, которые носят информационно-справочный характер. Содержат информацию о бизнес-объектах организации — клиентах, сотрудниках, поставщиках, материалах, оборудовании и т.д. Создают контекст для бизнес-операций |
Масштабируемый алгоритм (Scalable Algorithm) |
Алгоритм, вычислительные затраты которого прямо пропорциональны объему обрабатываемых данных. Особенно важно свойство масштабируемости для алгоритмов, используемых при анализе больших данных и в машинном обучении. |
Математическая статистика (Mathematical statistics) |
Наука о математических методах анализа данных, полученных на основе большого числа наблюдений (измерений, опытов). Методы математической статистики являются основной построения большинства аналитических моделей Data Mining. |
Математическое ожидание (Expectation value) Ожидаемое значение, Expected value |
Среднее значение случайной величины, полученное при бесконечном числе испытаний или по выборке бесконечного размера. Одно из важнейших понятий теории вероятности, поскольку может служить усредненной оценкой случайной величины. |
Матрица BCG (Boston Consulting Group Matrix) Product portfolio matrix, Boston Box, BCG-matrix, Boston matrix, Boston Consulting Group analysis |
Инструмент для анализа продуктовых линеек, который делит продукты на четыре категории в зависимости от доли рынка и динамики продаж. Применяется для стратегического анализа, прогнозирования продаж, формирования продуктовых линеек. Синоним — Бостонская матрица. |
Матрица издержек классификации (Cost-matrix) |
В статистике — разновидность таблицы сопряженности, в которой для каждого типа ошибок указываются издержки классификации в денежном, количественном выражении или в виде весов. Используется для оптимизации аналитических моделей. |
Матрица миграции (Migration matrix) Матрица переходов Маркова, Матрица вероятностей переходов, Стохастическая матрица, Probability matrix, Transition matrix, Markov matrix, Stochastic matrix |
Инструмент для оценивания кредитных рисков на основе вероятностей перехода (миграции) кредита из одной категории качества в другую. Матрица миграции состоит из вероятностей таких переходов. |
Матрица ошибок (Error matrix) Матрица неточностей, Confusion matrix |
Способ визуализации результатов работы классификатора для оценки его качества. |
Машинное обучение (Machine learning) |
Направление искусственного интеллекта, связанное с разработкой аналитических моделей, которые автоматически обнаруживают в данных скрытые закономерности и самостоятельно приобретают свойства, необходимые для распознавания этих закономерностей. |
Машины опорных векторов (Support vector machines) Метод опорных векторов, SVM |
В машинном обучении — семейство алгоритмов бинарной классификации, основанных на обучении с учителем, использующих линейное разделение пространства признаков с помощью гиперплоскости. |
Медиана (Median) Медиана статистическая, Непараметрическая средняя |
В статистике и теории вероятности — величина, такая что половина значений выборки больше неё, а другая половина — меньше. Иными словами, медиана представляет собой срединное значение упорядоченного по возрастанию (или убыванию) числового ряда. Используется как альтернатива среднему, устойчивая к выбросам и аномалиям в данных. |
Медленно меняющиеся измерения (Slowly changing dimensions) SCDs |
В теории баз данных — измерения, значения которых со временем могут изменяться, но не часто. При этом изменяются неключевые атрибуты измерения. |
Мера (Measure) Показатель, Факт, Fact |
Качественная или количественная характеристика состояния некоторого объекта или процесса. В анализе данных и многомерном моделировании является синонимом факта. |
Метаданные (Metadata) Данные о данных |
Метаданные — это специальный вид данных, которые описывают структуру и свойства других данных. |
Метка класса (Class Label) Переменная класса |
Выходная переменная классификационной модели. Всегда является дискретной и принимает значения из некоторого ограниченного набора категорий — наименований классов. Синоним — переменная класса. |
Метод k-ближайших соседей (K-nearest neighbor) |
Используется для решения задачи классификации. Относит объекты к классу, которому принадлежит большинство из k его ближайших соседей в многомерном пространстве признаков. Один из простейших алгоритмов обучения классификационных моделей. |
Метод k-средних (K-means) |
Используется для кластеризации данных на основе алгоритма разбиения векторного пространства на заранее определенное число кластеров. Преимущества метода — скорость и простота реализации. |
Метод главных компонент (Principal component analysis) Преобразование Хоттелинга, PCA |
Технология многомерного статистического анализа для сокращения размерности пространства признаков с минимальной потерей полезной информации. Широко используется в аналитике данных на этапе предобработки. |
Метод Дельфи (Delphi technique) Estimate-Talk-Estimate, ETE, Метод структурированной коммуникации |
Метод интерактивного прогнозирования, основанный на оценках группы экспертов. Участники отвечают на вопросы в несколько раундов, после каждого из которых получают анонимные ответы других экспертов и могут уточнить свои суждения. |
Метод имитации отжига (Simulated annealing) Метод модельной закалки, Алгоритм имитации отжига |
Вероятностный метод глобальной оптимизации функций. В анализе данных известен как популярный метод обучения нейронных сетей. Название метода происходит из металлургии, а именно технологии отжига металла. |
Метод максимального правдоподобия (Maximum likelihood estimation) MLE, Метод наибольшего правдоподобия |
Статистический метод оценки параметров вероятностных распределений с помощью максимизации функции правдоподобия. |
Метод Монте-Карло (Monte-Carlo technique) Метод статистических испытаний |
Класс вычислительных алгоритмов, моделирующих исследуемый процесс путем многократных повторений его случайных реализаций. Используются при решении задач оптимизации, численного интегрирования, анализа рисков в бизнесе и других. |
Метод муравьиной колонии (Ant colony optimization) Муравьиный алгоритм |
Алгоритм для нахождения приближенных решений задач оптимизации на графах, таких как задача коммивояжера, транспортная задача и аналогичных. Используется во многих приложениях анализа. |
Метод наименьших квадратов (Least-Squares method) МНК, Least squares |
Математический подход для оценки параметров моделей (например, регрессионной) на основании экспериментальных данных, содержащих случайные ошибки. Важнейшим применением метода в анализе данных является линейная регрессия. |
Метод Ньютона (Newton method) Метод касательных, Алгоритм Ньютона |
Алгоритм для экспериментального поиска экстремума функции. Используется в анализе данных для решения задач оптимизации, где требуется определить нуль первой производной либо градиента в случае многомерного пространства. |
Метод рулетки (Roulette wheel parent selection) Выбор родителей по правилу рулетки |
В генетических алгоритмах используется для определения, какие решения задачи (члены популяции) выбираются для размножения. Популяция представляется колесом рулетки, где сектор каждой особи пропорционален значению её показателя приспособленности. |
Метод скользящего окна (Windowing method) Метод кадрирования |
В анализе данных — алгоритм трансформации, позволяющий сформировать из членов временного ряда набор данных, который может служить обучающим множеством для построения модели прогнозирования. |
Метод фокус-групп (Focus group method) |
Технология маркетингового исследования, состоящая в проведении групповой дискуссии под руководством модератора. Позволяет на основе небольшой группы потребителей выявить мнение о компании, продукте и т.д. широкой целевой аудитории. |
Методология CRISP-DM (Cross-Industry Standard Process for Data Mining) |
Открытый стандарт моделирования процессов, описывающий общие подходы, используемые в интеллектуальном анализе данных. Де-факто является стандартом для разработки проектов Data Analytics и Data Mining. |
Метрика (Metric) Метрическое пространство |
В анализе данных — функция для определения расстояния между многомерными векторами в пространстве признаков. Понятие метрики важно для понимания работы моделей анализа данных, использующих операции с многомерными векторами. |
Метрика TF-IDF (Term frequency–inverse document frequency) |
TF-IDF — статистический показатель, применяемый для оценки важности слова для категории, документа или коллекции. Используется при анализе текстовых данных и рассчитывается для каждого слова. |
Мешок слов (Bag of words) |
Мешок слов — представление текста в виде массива, состоящего из отдельных слов и количества их использования. Применяется при анализе естественного языка и в составе алгоритмов компьютерного зрения. Является подготовительной стадией для подсчёта метрики «tf-idf». |
Микромаркетинг (Micromarketing) |
Маркетинговая стратегия, ориентированная на достаточно узкую группу или даже отдельных клиентов, выявленных в результате микросегментации потребительской аудитории. |
Микросегментация (Microsegmentation) |
Разновидность сегментации клиентов, когда каждый сегмент образуется очень небольшим числом потребителей. Микросегменты могут стать основой маркетинговых кампаний с высоким уровнем персонализации. |
Многомасштабный анализ (Multiresolutional analysis) Кратномасштабный анализ, Multiscale approximation, Multiscale analysis, MRA, MSA |
Технология проектирования дискретных вейвлет-преобразований и алгоритма быстрого вейвлет-преобразования. Можно рассматривать как исследование графика какого-либо процесса с помощью набора луп с разным увеличением. |
Многомерная база данных (Multi-dimensional Database) СУМБД, Многомерное хранилище данных, СУБД с изменяемой размерностью |
База данных, в которой данные организованы в виде упорядоченных многомерных массивов. В многомерных СУБД информация является логически целостной. Многомерные СУБД интенсивно внедряются с развитием OLAP-технологий. |
Многомерность (Multidimensional) |
В анализе данных — механизм, с помощью которого реализуется оперативный анализ данных (OLAP). Включает многомерное хранение, многомерное представление и многомерную обработку данных. |
Многослойная нейронная сеть (Multilayer neural net) Multilayer neural network, Multilayer Artificial Neural Network, Плоскослоистая нейронная сеть |
Нейронная сеть, в которой нейроны сгруппированы в слои. При этом каждый нейрон предыдущего слоя связан со всеми нейронами следующего слоя, а внутри слоёв связи между нейронами отсутствуют. |
Многослойный персептрон (Multilayered perceptron) MLP, Многослойный персептрон Румельхарта |
Класс искусственных нейронных сетей прямого распространения, состоящих как минимум из трех слоёв — входного, скрытого и выходного. Являются популярными инструментом анализа данных. |
Множественная линейная регрессия (Multiple Linear Regression) Многофакторная линейная регрессия |
Линейная регрессия, в модели которой число независимых переменных две или более. Несколько входных переменных позволяет увеличить долю объяснённой дисперсии выходной переменной. |
Множество валидационное (Validation set) |
В машинном обучении — подмножество примеров обучающего набора данных, формирующееся независимо от обучающего и тестового множеств и использующееся для проверки предсказательной способности модели. |
Множество обучающее (Training set) Выборка обучающая, Множество тренировочное |
В машинном обучении — набор структурированных данных, используемый для обучения аналитических моделей — нейронных сетей, деревьев решений, карт Кохонена и др. |
Множество тестовое (Test set) Выборка тестовая |
В машинном обучении — подмножество обучающего набора данных, содержащее тестовые примеры, т.е. примеры для проверки результатов обучения. Ошибка модели, полученная на тестовом множестве, называется ошибкой обобщения. |
Мода распределения (Mode) |
В статистике — значение, которое случайная величина на заданном множестве наблюдений принимает наиболее часто. С точки зрения анализа данных, мода несёт информацию о типичных значениях признака. |
Моделирование (Modelling) |
Построение и изучение моделей объектов, процессов и явлений с целью обнаружения закономерностей их развития и прогнозирования их состояния в будущем. Играет ключевую роль в аналитических технологиях Data Mining. |
Моделирование данных (Data Modelling) |
Определение и анализ требований к данным, необходимым для поддержки бизнес-процессов. Позволяет создать единую информационную модель компании, интегрировать ресурсы в информационную систему, проектировать базы данных. |
Моделирование на основе аналогий (Look-alike modeling) LAM |
В маркетинге, технология анализа данных, позволяющая обнаруживать новые целевые аудитории на основе аналогий с профилями клиентов из существующих аудиторий. |
Модель GARCH (GARCH-model) Обобщенная авторегрессионная модель гетероскедастичности, Generalized Autoregressive Conditional Heteroscedastic model |
Модель, используемая для прогнозирования ситуации на финансовых рынках в условиях нестабильности (волатильности). В таких условиях обычные линейные регрессионные модели оказываются слишком грубыми. |
Модель MapReduce (MapReduce model) |
Разработанная Google программная модель и комплекс процедур генерирования и обработки больших массивов данных с помощью распределенных вычислений на большом числе узлов. Применима в широкой области задач, в т.ч. в машинном обучении. |
Модель авторегрессии скользящего среднего (ARIMA) Модель Бокса-Дженкинса, АРИСС, Методология Бокса-Дженкинса, Autoregressive Integrated Moving Average, Box-Jenkins model |
Модель авторегрессии скользящего среднего, наиболее полно и компактно описывающая автокорреляционные свойства стационарного временного ряда. Широко применяется при прогнозировании временных рядов. |
Модель временного ряда многомерная (Time-series multidimensional model) |
Модель, в которой значения членов ряда зависят не только от предшествующих значений этого же ряда, но и от значений нескольких других рядов. |
Модель временного ряда одномерная (Time-series one-dimensional model) |
Модель, в которой значение каждого члена ряда рассматривается как взвешенная сумма некоторого числа значений предшествующих членов этого же временного ряда. |
Модель нейронной сети (Network model) |
Модель нейронной сети описывает её архитектуру и конфигурацию, а также используемые алгоритмы обучения. Каждая архитектура сети предназначения для решения определённого класса задач анализа данных. |
Модель скользящего среднего (Model of moving average) Moving-average model, MA-model |
Распространенный подход для моделирования одномерных временных рядов. Концептуально представляет собой линейную регрессию прогнозируемого значения ряда относительно текущего и ранее наблюдаемых случайных компонентов. |
Модель Хольта (Holt's model) |
Модель прогнозирования, представляющая динамику временного ряда как линейную зависимость с постоянно изменяющимися параметрами. |
Модель экспоненциального сглаживания (Exponential smoothing model) Модель Брауна, Brown model |
Один из простейших и распространенных приемов выравнивания временного ряда. Может отображать развитие в виде линейной тенденции, в виде случайного процесса, не имеющего тенденции, а также в виде изменяющейся параболической тенденции. |
Мониторинг (Monitoring) Отслеживание |
Постоянное наблюдение за каким-либо явлением или процессом, отслеживание состояния конкретного объекта с целью оценки и анализа его поведения или ситуации в целом. |
Мошенничество (Fraud) |
В анализе данных — обманные действия в области кредитования, банковских карт, телекоммуникациях и других сферах, где они могут быть выявлены с помощью аналитических методов. |
Мультиколлинеарность (Multicollinearity) |
В статистическом моделировании ситуация, когда две или более независимых переменных модели коррелированны. Мультиколлинеарность приводит к неустойчивости оценок параметров статистических моделей, когда даже небольшие изменения в исходных данных приводят к значительным изменениям в модели. |
Мягкие вычисления (Soft computing) |
Методология использования неточных и математически строго не обоснованных методов и алгоритмов при решении задач, для которых не существует строгих подходов. Включает технологии машинного обучения. |