Валидация (Validation) |
В анализе данных — проверка достаточности уровня качества данных (валидация данных) и проверка правильности работы аналитической модели, построенной на основе машинного обучения (валидация модели). |
Вариация (Variation) |
В математике — малое изменение независимой переменной или функционала. В статистике — изменчивость, многообразие значений признака у единиц совокупности. |
Веб-майнинг (Web Mining) |
Направление интеллектуального анализа данных, решающее задачи автоматического обнаружения веб-документов, извлечения информации из веб-ресурсов и выявления закономерностей в массивах данных из Интернета. |
Веб-сервис (Web-service) Веб-служба |
Обладающая уникальным веб-адресом (URL) программная система, построенная на базе открытых протоколов/стандартов и использующаяся для обмена данными между приложениями или системами. |
Вейвлет (Wavelet) |
От англ. wavelet (всплеск, маленькая волна) — класс математических функций, которые на графике выглядят как кратковременное волнообразное колебание. Используются как базисные функций в вейвлет-преобразовании. |
Вейвлет-преобразование (Wavelet Transform) |
Метод преобразования данных к представлению, в котором они могут быть локализованы как по времени, так и по частоте. Основное использование вейвлет-преобразования — сжатие данных, их сглаживание, очистка от шума. |
Векторизация текста (Text Data Vectorization) |
Конвертация текста в числа, необходимая для работы алгоритмов машинного обучения. |
Вес доказательства (Weight of evidence) Коэффициент WoE, Coefficient WoE |
В задачах бинарной классификации используется для формирования конечных классов. Коэффициенты WoE и вычисленные на их основе значения IV являются критерием для формирования конечных классов оптимальным образом. |
Визуализация (Visualization) |
В аналитических технологиях — комплекс методов представления исходной информации и результатов анализа данных в наиболее удобной для восприятия и интерпретации форме. |
Винтажный анализ (Vintage analysis) Анализ по поколениям |
Разновидность когортного анализа, когда исследование поведенческих особенностей клиентов (абонентов, заёмщиков) на протяжении их жизненно цикла подразумевает формирование групп (когорт) на основе времени начала получения услуги (период выдачи кредита, регистрации абонента и т.д.). Основное применение винтажного анализа — управление кредитными рисками. |
Витрина данных (Data Mart) Киоск данных, Секция данных |
Предметно-ориентированная база данных, содержащая данные по одному из направлений деятельности компании. В витрине информация хранится оптимизированно с точки зрения решения конкретных задач. |
Возмущение (Disturbance) Возмущающее воздействие |
Воздействие на систему, которое нарушает ее нормальное функционирование и развитие. В аналитических моделях возмущающее воздействие представляется с помощью дополнительного случайного члена, который называют ошибкой, или остатками. |
Волатильность (Volatility) Изменчивость, Неустойчивость |
Статистический показатель, характеризующий изменчивость различных величин во времени. Наиболее часто используется в экономике и финансах для описания колебания стоимости финансовых активов. |
Временной ряд (Time series data) Упорядоченные данные |
Индексированная последовательность точек данных, отражающих развитие во времени некоторого процесса, зафиксированных через равные промежутки времени. Временные ряды играют большую роль в технологиях анализа данных. |
Входная переменная (Input variable) Регрессор, Независимая переменная, Предсказывающая переменная, Объясняющая переменная, Predictor variable |
В статистическом моделировании и машинном обучении — величина, от которой зависит изменение выходной переменной. Совокупность входных переменных образует входной вектор. |
Выборка (Sample) Выборочная совокупность |
В статистике и анализе данных — подмножество наблюдений генеральной совокупности, отобранных для изучения и анализа с помощью специальной процедуры, которая также называется выборкой. |
Выборочный метод (Sampling method) |
Метод математической статистики, когда свойства генеральной совокупности изучаются на основе исследования свойств её части, полученной с помощью определенного алгоритма выборки. |
Выброс (Outlier) Экстремальное значение, Extreme value |
Значения, которые не укладываются в общую модель поведения анализируемого процесса. Могут быть вызваны ошибками измерений, некорректным вводом данных или воздействием случайных, не поддающихся прогнозированию факторов. |
Выходная переменная (Output variable) Зависимая переменная, Объясняемая переменная, Переменная класса, Целевая переменная, Predicted variable, Target variable |
В математическом моделировании — переменная модели, которая зависит от входных переменных и случайных факторов, воздействующих на моделируемый процесс или объект. Представляет результат работы модели. |
Выходной слой (Output layer) |
Слой нейронной сети, на выходах которого формируется результат — отклик сети на входное воздействие. Число составляющих его нейронов определяется количеством зависимых переменных модели. |
Вычислительная сложность алгоритма (Computational complexity) |
Количество элементарных операций, которые проводит алгоритм для решения конкретной задачи. |
Выявление мошенничеств (Fraud detection) |
Направление интеллектуального анализа данных, включающее методы выявления мошеннических действий в кредитно-финансовой сфере, телекоммуникациях и т.д. Использует методы Data Mining — нейронные сети, деревья решений и т.д. |