Обмен данными (Data sharing) Совместное использование данных |
Процесс предоставления организацией данных сторонним пользователям или компаниям для обеспечения ее коллективного использования. |
Обнаружение знаний в базах данных (Knowledge Discovery in Databases) Извлечение знаний из баз данных, KDD |
Нетривиальный процесс обнаружения корректных, новых, потенциально полезных и интерпретируемых шаблонов в больших массивах данных. Междисциплинарное направление на стыке машинного обучения, искусственного интеллекта и других дисциплин. |
Обобщающая способность (Generalization ability) |
Способность аналитической модели, построенной на основе машинного обучения (нейронной сети, дерева решений, карты Кохонена и др.) выдавать правильные результаты не только для обучающих примеров, но и для любых новых. |
Обобщенные ассоциативные правила (Generalized Association Rules) Иерархические ассоциативные правила, Многоуровневые ассоциативные правила, Multilevel Associative Rules |
В анализе данных — правила, которые описывают ассоциативную связь не только между отдельными товарами и их наборами, но и товарными группами. Иногда связей между отдельными предметами не обнаруживается, но они выявляются между товарными группами. |
Обогащение данных (Data enrichment) |
Процесс насыщения данных новой информацией, чтобы повысить их ценность для анализа. Для внешнего обогащения используется информация внешних источников. При внутреннем обогащении извлекается информация, неявно присутствующая в данных. |
Оборачиваемость запасов (Stock turnover) Оборачиваемость, Коэффициент оборачиваемости запасов, Stock, Inventory turnover ratio |
Показатель, указывающий сколько раз за анализируемый период компания использовала средний имеющийся остаток запасов. |
Оборачиваемость товаров (Turnover of goods) |
Количество оборотов товаров за заданный отрезок времени. |
Обработка естественного языка (Natural language processing) NLP |
Направление, решающее задачи понимания и генерации естественного языка компьютерными системами, анализа больших данных на естественном языке, взаимодействия между компьютерами и человеком на естественном языке. |
Обработка транзакций в реальном времени (Online Transaction Processing) OLTP |
Системы OLTP — это информационные системы, которые управляют работой транзакционно-ориентированных приложений. Типичные примеры — ввод заказов, розничные продажи, системы финансовых транзакций (банкоматы). |
Обучаемая модель (Taught model) Модель на основе машинного обучения, Learned model |
В машинном обучении — аналитическая модель, способная самостоятельно, в процессе обучения, настраивать параметры в состояние, при котором она сможет выполнить требуемые преобразования данных. |
Обучающий пример (Training sample) Прецедент, Образец |
В машинном обучении — запись обучающего набора данных, значения которой используются для вычисления коррекции параметров модели. |
Обучение (Training) Learning |
В машинном обучении — процесс подстройки параметров обучаемой модели до состояния, при котором она сможет выполнять требуемое преобразование данных с достаточной точностью. |
Обучение без учителя (Unsupervised learning) Самообучение, Обучение неконтролируемое, Обучение неуправляемое, Самоорганизация, Self-organization |
Технология машинного обучения, в которой для коррекции параметров обучаемой модели не используется целевая функция — то есть в обучающих примерах не нужно иметь заранее заданные выходы модели. |
Обучение онлайновое (On-line learning) Обучение по шагам, Real-time learning |
В машинном обучении — метод обучения искусственных нейронных сетей, при котором корректировка весов нейронов производится после подачи на вход каждого обучающего примера. |
Обучение оффлайновое (Off-line learning) Обучение по эпохам, Пакетное обучение |
В машинном обучении — метод обучения нейронной сети, при котором коррекции её весов на каждой итерации производится после предъявления сети всех примеров из обучающего множества. |
Обучение с подкреплением (Reinforcement learning) |
Раздел машинного обучения, изучающий поведение интеллектуальных агентов, действующих в некоторой среде и принимающих решения. Обучение агента производится на основе сигналов подкрепления от среды. |
Обучение с учетом издержек классификации (Cost-sensitive learning) |
В машинном обучении — методика обучения модели бинарной классификации, которая позволяет минимизировать ошибки I или II рода (ложно-положительные или ложно-отрицательные). |
Обучение с учителем (Supervised learning) Обучение контролируемое, Обучение управляемое, Associative learning |
Направление машинного обучения, объединяющее алгоритмы и методы построения моделей на основе множества примеров, содержащих пары «известный вход — известный выход». |
Обучение с шумом (Noise learning) |
Метод обучения нейронных сетей, который позволяет градиентным алгоритмам обучения выходить из локальных минимумов. Основан на введении небольшой случайной составляющей в величину коррекции весов нейронов. |
Озеро данных (Data Lake) |
Метод хранения структурированной, полуструктурированной и неструктурированной информации, а также организации больших объемов «сырых» данных, поступающих из различных источников. |
Окно выгрузки (Upload window) Загрузочное окно |
В области эксплуатации корпоративных информационных систем — временной интервал, в течение которого производится выгрузка информации из различных локальных источников в централизованное хранилище данных. |
Окно поставки (Time Slot) Временное окно |
Период времени, в течение которого поставка должна быть отгружена от поставщика или получена на складе получателя. |
Оперативный анализ данных (OnLine Analytical Processing) Многомерный анализ данных, Оперативная аналитическая обработка данных, OLAP |
Технология хранения и обработки многомерных данных, позволяющая получать сложные аналитические отчёты в реальном времени. Известна как OLAP — OnLine Analytical Processing. |
Описательная аналитика (Descriptive analytics) |
Область статистики, методы которой ориентированы на сбор, систематизацию и обобщение «сырых» данных из различных источников с целью обнаружения в них интерпретируемых зависимостей и закономерностей. |
Оптимизация (Optimization) |
В математике — задача нахождения экстремума функции. В анализе данных — процесс поиска состояния модели, которое позволило бы решить поставленную задачу наилучшим образом. |
Оптимизация запасов (Reserve optimization) |
Поддержание запасов товаров, незавершенного производства, сырья и других объектов на уровне, который минимизирует затраты на хранение, но обеспечивает необходимый уровень бесперебойной работы. |
Остатки линейной регрессии (Discrepancy) |
Отклонения точек реальных данных от линии регрессии. Дисперсия остатков показывает долю изменчивости выходной переменной, которая не была «объяснена» входной. Чем выше доля остаточной дисперсии, тем хуже работает модель. |
Отношение правдоподобия (Likelihood ratio) |
В теории вероятности — отношение вероятности получить положительный результат для положительного исхода к вероятности получить положительный результат для отрицательного исхода. |
Отношение шансов (Odds ratio) OR |
Статистика, которая количественно определяет силу связи между двумя событиями из одной статистической совокупности. Определяется как отношение вероятности события A в присутствии B к вероятности события A в отсутствие B. |
Отток клиентов (Customer churn) Churn |
Процесс отказа отдельных клиентов от приобретения товаров или услуг компании. Характеризуется показателем оттока (churn rate). Один из ключевых показателей в бизнес-аналитике. |
Очистка данных (Data Cleaning) |
Исключение из данных различных факторов, снижающих их качество и мешающих корректному анализу. Производится как в процессе ETL, так и в аналитическом приложении непосредственно перед анализом. |
Ошибка обобщения (Generalization error) |
Ошибка, которую модель, основанная на машинном обучении, показывает на примерах, не участвовавших в процессе обучения. Служит для оценивания «подгонки» модели к обучающему множеству и для выявления эффекта переобучения. |
Ошибка обучения (Training Error) Ошибка на обучающем множестве |
В машинном обучении — разность между желаемым (целевым) и фактическим выходом модели на примерах обучающего множества. Особенно большую роль играет при обучении нейронной сети, т.к. используется для расчета коррекции весов нейронов. |
Ошибка систематическая (Systematic error) |
Ошибка измерения или оценивания некоторого показателя. Возникает вследствие воздействия на объект и процесс измерения детерминированных факторов, систематически влияющих на эти измерения, и смещения их результатов в одном направлении. |
Ошибки I и II рода (Type I errors, type II errors) |
Ключевые понятия в математической статистике. Ошибка I рода заключается в отклонении нулевой гипотезы в случае, когда она является истинной. Ошибка II рода состоит в принятии нулевой гипотезы, когда она является ложной. |