Вход
Регистрация

Глоссарий: C

Активный прогноз

Сonditional prediction

Прогноз, в процессе построения которого предполагается, что лицо, принимающее решение, может осуществлять различные меры воздействия на исследуемые показатели. Например, если

...

Алгоритм CART

CART algorithm

Один из популярных алгоритмов построения деревьев решений, предложенный в 1984 г. (Leo Breiman, Jerome Friedman, Richard

...

Алгоритм CHAID

CHAID algorithm

Алгоритм оценки значимости разбиения в узле дерева решений на основе теста хи-квадрат, который определяет лучшее из них как

...

Вычислительная сложность алгоритма

Computational complexity

Количество элементарных операций, затрачиваемых алгоритмом для решения конкретной задачи. Сложность зависит не только от размерности входных данных, но и от самих данных.

...

Денежный поток

Cash flow

Область применения: бюджетирование, финансовый анализ.

Показывает

...

Доверительный интервал

Confidence interval

Наиболее вероятный диапазон изменения наблюдений случайной величины. Значения, полученные в процессе анализа выборки данных

...

Жизненная ценность клиента

Customer Lifetime Value

Сумма денег, которую приносит компании среднестатистический клиент.

\[ LTV = \frac{ARTU}{CR}, \] где $ARTU$ - средний

...

Жизненный цикл клиента

Customer life-cycle

Процесс прохождения различных этапов взаимоотношений между клиентом и обслуживающей его компанией. Выделяют 4 основных этапа таких отношений:

  • Потенциальный
...

Задача классификации

Classification problem

Задача классификации заключается в разбиении наблюдений на классы на основе анализа их

...

Захват изменений данных

Changed data capture

Процесс обнаружения в источнике данных (например, OLTP-системе) новых, измененных или удаленных записей. Это позволяет ускорить загрузку в хранилище или в

...

Значимость клиента

Customer significance

Доля прибыли компании, получаемая от данного клиента. Является очень важным фактором, поскольку в подавляющем большинстве случаев существенно отличаются для различных

...

Издержки ошибок классификации

Classification cost error

Издержки (потери, убытки) от ошибок классификации, допущенных аналитической моделью. Такие ошибки могут приводить к неверному

...

Измерения согласованные

Сonformed dimensions

В многомерном моделировании данных измерения, которые являются совершенно идентичными, или одно измерение является точным

...

Каннибализация

Cannibalization

Негативное влияние продаж одного товара в ущерб другому, произведенному на том же предприятии в пределах одного бренда.

В некоторых случаях каннибализация является

...

Категориальная переменная

Categorial variable

Переменные, принимающие значения из некоторого ограниченного набора категорий. Они обычно связаны с неисчисляемыми признаками, такими как названия (товаров, услуг и др.),

...

Категориальные данные

Categorical Data

Данные, качественно характеризующие исследуемый процесс или объект, не имеющие количественного выражения. Обычно представляют собой строковые значения из ограниченного набора

...

Кейс-технология

Case-technology

Вид дистанционной технологии обучения, основанный на использовании наборов (кейсов) текстовых, аудиовизуальных и мультимедийных учебно-методических материалов и их рассылке

...

Кибернетика

Cybernetics

Наука об общих законах управления в природе, обществе, живых организмах и машинах. Коренными понятиями кибернетики являются понятия системы и информации, причем

...

Классификация

Classification

Задача разбиения множества объектов или наблюдений на априорно заданные группы, называемые классами, внутри каждой из которых они предполагаются похожими друг на друга,

...

Классификация с учетом издержек

Cost-sencitive classification

Методика построения бинарных классификационных моделей с учетом издержек, вызванных ошибками. Если ложноположительные ошибки обходятся дороже, что, например, характерно для

...

Классифицирующая функция

Classification function

Функция, которая присваивает каждому объекту данных метку класса или кластера в соответствии с определенным правилом. Может быть

...

Клиент

Client

Аппаратный или программный компонент вычислительной системы, посылающий запросы серверу.

В сети Интернет примером клиента

...

Клик

Click

Нажатие клавиши компьютерной мыши.

В Web Mining клик рассматривается как отдельное действие пользователя на веб-сайте.

...

Ковариация

Covariation

$\Delta w_{ij} = ny_i(t)\,y_j(t)$ служит мерой взаимной связи между случайными величинами $y$ и $x$, то есть стремление одной случайной величины возрастать или убывать при

...

Когнитивная перегрузка

Cognitive overload

Это психологический феномен, характеризуемый перегрузкой информацией человека, принимающего решение. Это происходит, когда количество информации превышает когнитивную емкость

...

Когнитивная теория

Cognitive theory

Теория обучения, в соответствии с которой человек и животное усваивают знания в виде когнитивных карт (что где расположено) или ожиданий (что к чему приведет). Это

...

Колоночная база данных

Columnar database

База данных, в которой данные группируются не по строкам, а по столбцам. В ней "соседними" являются не данные из двух столбцов одной и той же строки, а данные из одного и того

...

Комбинаторный взрыв

Combinatorial explosion

Экспоненциальный рост количества вычислительных операций, вариантов (состояний) или требуемых для решения задачи ресурсов при линейном повышении ее размерности. Например,

...

Конкурент

Competitor

Любая компания, фирма, организация, которая производит те же самые или похожие изделия, товары или услуги и интересы которой пересекаются с интересами нашей компании.

...

Конкурентная разведка

Competitive Intelligence

Процесс сбора и анализа данных из различных источников с целью выработки управленческих решений, направленных на повышение

...

Конкурентное обучение

Competitive learning

Методика обучения, используемая в сетях Кохонена, при которой нейроны соперничают друг с другом, чтобы вектор их весов

...

Коннекция

Connection

Искусственные нейронные сети часто называются коннекциями, а их парадигма – коннекционизмом.

Некоторые исследователи

...

Консолидация

Consolidation

Комплекс методов и процедур, направленных на извлечение данных из различных источников, обеспечение необходимого уровня их информативности и качества, преобразование к единому

...

Контент-анализ

Content analysis

Количественный анализ книг, эссе, интервью, дискуссий, газетных статей, исторических документов и других текстов и текстовых массивов с целью последующей содержательной

...

Контроллинг

Сontrolling

Внутриорганизационная система интегрированного информационного обеспечения, планирования и контроля. Это понятие относительно новое, поэтому в разных источниках трактуется по-

...

Контрольный лист

Check list

Один из инструментов контроля качества, используемых на производстве. Предназначен для регистрации и сбора количественных и качественных характеристик процесса (виды дефектов

...

Корреляционный анализ

Correlation analysis

Совокупность методов обнаружения статистической взаимосвязи между случайными величинами или признаками. Корреляционный анализ для двух случайных величин заключает в себе:

...

Корреляция

Сorrelation

Статистическая взаимосвязь двух или нескольких случайных величин (либо величин, которые можно с некоторой допустимой степенью точности

...

Коэффициент детерминации

Сoefficient of determination

Пусть из заданного пространства объектов $X$ и множества возможных ответов $Y \subset \mathbb{R}$ имеется выборка данных из $l$ наблюдений: $X^l = {(x_i, y_i)_{i=1}^l}$, где $

...

Коэффициент корреляции

Сorrelation coefficient

Коэффициент корреляции показывает степень статистической зависимости между двумя числовыми переменными. Он вычисляется следующим образом:

$$r=\frac{\sum \limits_{i=1

...

Кредитный портфель

Credit Portfolio

Основным направлением для получения дохода в банковской сфере являются кредиты. Эта деятельность сопровождается множеством явных и скрытых опасностей. Поскольку риски по одним

...

Критическое значение

Сritical value

Значения величины, используемой в том или ином статистическом критерии (например, t-критерии Стьюдента или F-критерии Фишера),

...

Кросс-докинг

Cross dock

Область применения: логистика.

Совокупность логистических операции, благодаря которым приёмка и отгрузка товаров на складе

...

Кросс-продажа

Cross-sell

Метод повышения эффективности работы компаний, основанный на предложении клиенту совместно с товарами и услугами основного ассортимента дополнительных товаров и услуг, которые

...

Кроссовер

Crossover

Процедура или оператор в генетических алгоритмах, используемые для получения разнообразия в процессе

...

Куб

Cube

Многомерная конструкция, сформированная соединением нескольких измерений. Каждая ячейка (cell) определена отдельным членом из каждого

...

Матрица издержек классификации

Cost-matrix

Разновидность матрицы сопряженности, в которой для каждого типа ошибок указываются издержки классификации в денежном, количественном выражении или в виде весов.

...

Метка класса

Class Label

Выходная (независимая) переменная классификационной модели. Метка класса всегда является дискретной и принимает значения из некоторого ограниченного набора категорий –

...

Метод k-средних

C-means

Алгоритм разделительной кластеризации, основанный на разбиении множества элементов векторного пространства на заранее

...

Метод комбинаторный

Сombinatorial method

Математический метод, основанный на комбинаторике — разделе математики, который изучает вопросы, связанные с размещением, перемещением и взаимным расположением частей

...

Метод сопряженных градиентов

Conjugate gradients algorithm

Быстродействующий алгоритм оптимизации, осуществляющий последовательный линейный поиск в пространстве ошибок. Последовательные направления поиска выбираются сопряженными (не

...

Метод эталонного сравнения

Сase-based reasoning

В интеллектуальном анализе данных - методика разработки решений задач с помощью рассуждений на основе эталонных ситуаций.

...

Нейронная сеть комплексированная

Complexed neural network

Нейронная сеть, в состав которой входит несколько нейронных сетей с различной топологией. Например, в

...

Непрерывная последовательность

Continuous sequence

В теории последовательных шаблонов это последовательность событий, в которой отсутствует то, которое не влияет на появление

...

Непрерывные данные

Continuous data

Данные, значения которых могут принимать какое угодно значение в некотором интервале. Над непрерывными данными можно производить арифметические операции сложения, вычитания,

...

Обучение с учетом издержек классификации

Cost-sensitive learning

Методика обучения модели бинарной классификации с целью минимизации типа ошибок (ложно положительных или ложно

...

Отток клиентов

Доля (или процент) клиентов, преставших преобретать товар или услугу, в исследуемом периоде среди клиентов, которые в этот же период переобрели товар или услугу.

Перекрестная ассоциация

Сross-assосciation

В теории нейронных сетей это ситуация, когда сеть Хопфилда «путает» близкие образы. Например, пусть сеть хранит два похожих образа

...

Перекрестная проверка

Cross-validation

Метод формирования обучающего и тестового множеств для обучения аналитической модели в условиях недостаточности исходных данных или неравномерного представления классов. Для

...

Переменная группирующая

Collecting variable

Переменная, использующаяся для разбиения на группы наблюдений выборки данных. Обычно она является категориальной. Например, пусть имеется таблица, содержащая информацию о

...

Покрытие

Coverage

Подмножество наблюдений множества данных, которое может быть успешно распознано этим классификатором. Причины, по которым

...

Полный факторный анализ

Complete factorial

Математическое описание поверхности отклика объекта в окрестности точки базового режима можно получить варьированием каждого из факторов $xi$ на двух уровнях, отличающихся от

...

Потребитель-для-бизнеса

Customer-To- Business

Концепция электронной коммерции, в рамках которой потребитель имеет возможность самостоятельно устанавливать стоимость для

...

Потребитель-для-потребителя

Customer-To-Customer

Система, организующая процесс продаж товаров и услуг между потребителями. В этом смысле системы C2C можно сравнить с «барахолкой», где люди напрямую продают, покупают или

...

Противоречие

Contradiction

В анализе данных ситуация, когда в двух записях (обучающих примерах)

...

Профайлинг конкурентов

Competitor profiling

Систематический анализ конкурентов с целью изучения их опасности, возможных потерь, системы отношений с клиентами. Его

...

Профиль клиента

Customer profile

Набор общих характеристик, присущих определенной группе клиентов, своего рода «образ» типичного клиента целевой группы. Например, можно построить профиль клиентов, дающих

...

Распределение хи-квадрат

Chi-square distribution
Распределение хи-квадрат с k степенями свободы - это распределение суммы квадратов k случайных величин, имеющих нормальное...

Свертка

Convolution

Свертка двух функций f(x) и g(x) – выражение вида

$$h(t)=\int\limits_{-\infty}^{+\infty}f(t-x)\,g(x)dx$$

В дискретном случае свертка вычисляется

...

Сжимающая функция

Compressive function

Если для функции $y = f(x)$ справедливо, что при любых значениях независимой переменной $x$ значения $y$ принадлежат некоторому

...

Система CRM

Customer Relationship Management

Система управления взаимосвязями (отношениями, взаимоотношениями) с клиентами и партнерами. Представляет собой класс корпоративных информационных систем, включающих

...

Сопряженность и сопряженные направления

Conjugacy

Два вектора $x$ и $y$ называют $H$-сопряженными (или сопряженными по отношению к матрице $H$) или $H$-ортогональными, если

...

Средний размер чека

Check Average

Сумма потраченных клиентами денег за определенный временной период, разделенная на общее количество чеков за это время.

Является важным показателем в такой

...

Сходимость алгоритма

Convergence of algorithm

Способность итерационного алгоритма достигать оптимума целевой функции или подходить достаточно близко к нему за конечное

...

Транзакция клиентская

Customer transaction

Транзакция, которая содержит не только идентификатор записи или номер чека и набор товаров, купленных по данному чеку, но и

...

Управление делами

Case management

Подход к управлению группой взаимосвязанных документов и записей, отличительным признаком которых служит присутствие некоторого главного события, которое имеет явное начало и

...

Хаос

Chaos

Детерминированная нелинейная динамическая система, бесконечная последовательность состояний которой выглядит случайной.

...

Хи-квадрат критерий

Chi-square test

Критерий согласия для проверки гипотезы о законе распределения исследуемой случайной величины. Во многих практических задачах точный закон распределения неизвестен. Поэтому

...

Хромосома

Chromosome

Представляет собой базовый элемент генетического алгоритма. Она является набором генов, описывающих параметры особи и

...

Цензурированная регрессионная модель

Censored regression model

Регрессионная модель, в которой на области изменения части (или даже всех) переменных наложены определенные ограничения, например, что они не могут быть отрицательными.

...

Циклическая составляющая

Cyclic component

Интервалы подъема или спада, которые имеют различную протяженность и амплитуду расположенных в них значений. Наличие во временных рядах циклической составляющей обусловлено

...

Ячейка куба

Cell

Часть данных, определенных ее позицией в каждом измерении. Ячейки могут быть пусты или полны. Когда значительное число их не содержат данных, говорят, что куб "разрежен" ("

...