Название/Синоним Описание
Обмен данными (Data sharing) Совместное использование данных Процесс предоставления организацией данных сторонним пользователям или компаниям для обеспечения ее коллективного использования.
Обнаружение знаний в базах данных (Knowledge Discovery in Databases) Извлечение знаний из баз данных, KDD Нетривиальный процесс обнаружения корректных, новых, потенциально полезных и интерпретируемых шаблонов в больших массивах данных. Междисциплинарное направление на стыке машинного обучения, искусственного интеллекта и других дисциплин.
Обобщающая способность (Generalization ability) Способность аналитической модели, построенной на основе машинного обучения (нейронной сети, дерева решений, карты Кохонена и др.) выдавать правильные результаты не только для обучающих примеров, но и для любых новых.
Обобщенные ассоциативные правила (Generalized Association Rules) Иерархические ассоциативные правила, Многоуровневые ассоциативные правила, Multilevel Associative Rules В анализе данных — правила, которые описывают ассоциативную связь не только между отдельными товарами и их наборами, но и товарными группами. Иногда связей между отдельными предметами не обнаруживается, но они выявляются между товарными группами.
Обогащение данных (Data enrichment) Процесс насыщения данных новой информацией, чтобы повысить их ценность для анализа. Для внешнего обогащения используется информация внешних источников. При внутреннем обогащении извлекается информация, неявно присутствующая в данных.
Оборачиваемость запасов (Stock turnover) Оборачиваемость, Коэффициент оборачиваемости запасов, Stock, Inventory turnover ratio Показатель, указывающий сколько раз за анализируемый период компания использовала средний имеющийся остаток запасов.
Оборачиваемость товаров (Turnover of goods) Количество оборотов товаров за заданный отрезок времени.
Обработка естественного языка (Natural language processing) NLP Направление, решающее задачи понимания и генерации естественного языка компьютерными системами, анализа больших данных на естественном языке, взаимодействия между компьютерами и человеком на естественном языке.
Обработка транзакций в реальном времени (Online Transaction Processing) OLTP Системы OLTP — это информационные системы, которые управляют работой транзакционно-ориентированных приложений. Типичные примеры — ввод заказов, розничные продажи, системы финансовых транзакций (банкоматы).
Обучаемая модель (Taught model) Модель на основе машинного обучения, Learned model В машинном обучении — аналитическая модель, способная самостоятельно, в процессе обучения, настраивать параметры в состояние, при котором она сможет выполнить требуемые преобразования данных.
Обучающий пример (Training sample) Прецедент, Образец В машинном обучении — запись обучающего набора данных, значения которой используются для вычисления коррекции параметров модели.
Обучение (Training) Learning В машинном обучении — процесс подстройки параметров обучаемой модели до состояния, при котором она сможет выполнять требуемое преобразование данных с достаточной точностью.
Обучение без учителя (Unsupervised learning) Самообучение, Обучение неконтролируемое, Обучение неуправляемое, Самоорганизация, Self-organization Технология машинного обучения, в которой для коррекции параметров обучаемой модели не используется целевая функция — то есть в обучающих примерах не нужно иметь заранее заданные выходы модели.
Обучение онлайновое (On-line learning) Обучение по шагам, Real-time learning В машинном обучении — метод обучения искусственных нейронных сетей, при котором корректировка весов нейронов производится после подачи на вход каждого обучающего примера.
Обучение оффлайновое (Off-line learning) Обучение по эпохам, Пакетное обучение В машинном обучении — метод обучения нейронной сети, при котором коррекции её весов на каждой итерации производится после предъявления сети всех примеров из обучающего множества.
Обучение с подкреплением (Reinforcement learning) Раздел машинного обучения, изучающий поведение интеллектуальных агентов, действующих в некоторой среде и принимающих решения. Обучение агента производится на основе сигналов подкрепления от среды.
Обучение с учетом издержек классификации (Cost-sensitive learning) В машинном обучении — методика обучения модели бинарной классификации, которая позволяет минимизировать ошибки I или II рода (ложно-положительные или ложно-отрицательные).
Обучение с учителем (Supervised learning) Обучение контролируемое, Обучение управляемое, Associative learning Направление машинного обучения, объединяющее алгоритмы и методы построения моделей на основе множества примеров, содержащих пары «известный вход — известный выход».
Обучение с шумом (Noise learning) Метод обучения нейронных сетей, который позволяет градиентным алгоритмам обучения выходить из локальных минимумов. Основан на введении небольшой случайной составляющей в величину коррекции весов нейронов.
Озеро данных (Data Lake) Метод хранения структурированной, полуструктурированной и неструктурированной информации, а также организации больших объемов «сырых» данных, поступающих из различных источников.
Окно выгрузки (Upload window) Загрузочное окно В области эксплуатации корпоративных информационных систем — временной интервал, в течение которого производится выгрузка информации из различных локальных источников в централизованное хранилище данных.
Окно поставки (Time Slot) Временное окно Период времени, в течение которого поставка должна быть отгружена от поставщика или получена на складе получателя.
Оперативный анализ данных (OnLine Analytical Processing) Многомерный анализ данных, Оперативная аналитическая обработка данных, OLAP Технология хранения и обработки многомерных данных, позволяющая получать сложные аналитические отчёты в реальном времени. Известна как OLAP — OnLine Analytical Processing.
Описательная аналитика (Descriptive analytics) Область статистики, методы которой ориентированы на сбор, систематизацию и обобщение «сырых» данных из различных источников с целью обнаружения в них интерпретируемых зависимостей и закономерностей.
Оптимизация (Optimization) В математике — задача нахождения экстремума функции. В анализе данных — процесс поиска состояния модели, которое позволило бы решить поставленную задачу наилучшим образом.
Оптимизация запасов (Reserve optimization) Поддержание запасов товаров, незавершенного производства, сырья и других объектов на уровне, который минимизирует затраты на хранение, но обеспечивает необходимый уровень бесперебойной работы.
Остатки линейной регрессии (Discrepancy) Отклонения точек реальных данных от линии регрессии. Дисперсия остатков показывает долю изменчивости выходной переменной, которая не была «объяснена» входной. Чем выше доля остаточной дисперсии, тем хуже работает модель.
Отношение правдоподобия (Likelihood ratio) В теории вероятности — отношение вероятности получить положительный результат для положительного исхода к вероятности получить положительный результат для отрицательного исхода.
Отношение шансов (Odds ratio) OR Статистика, которая количественно определяет силу связи между двумя событиями из одной статистической совокупности. Определяется как отношение вероятности события A в присутствии B к вероятности события A в отсутствие B.
Отток клиентов (Customer churn) Churn Процесс отказа отдельных клиентов от приобретения товаров или услуг компании. Характеризуется показателем оттока (churn rate). Один из ключевых показателей в бизнес-аналитике.
Очистка данных (Data Cleaning) Исключение из данных различных факторов, снижающих их качество и мешающих корректному анализу. Производится как в процессе ETL, так и в аналитическом приложении непосредственно перед анализом.
Ошибка обобщения (Generalization error) Ошибка, которую модель, основанная на машинном обучении, показывает на примерах, не участвовавших в процессе обучения. Служит для оценивания «подгонки» модели к обучающему множеству и для выявления эффекта переобучения.
Ошибка обучения (Training Error) Ошибка на обучающем множестве В машинном обучении — разность между желаемым (целевым) и фактическим выходом модели на примерах обучающего множества. Особенно большую роль играет при обучении нейронной сети, т.к. используется для расчета коррекции весов нейронов.
Ошибка систематическая (Systematic error) Ошибка измерения или оценивания некоторого показателя. Возникает вследствие воздействия на объект и процесс измерения детерминированных факторов, систематически влияющих на эти измерения, и смещения их результатов в одном направлении.
Ошибки I и II рода (Type I errors, type II errors) Ключевые понятия в математической статистике. Ошибка I рода заключается в отклонении нулевой гипотезы в случае, когда она является истинной. Ошибка II рода состоит в принятии нулевой гипотезы, когда она является ложной.