Название/Синоним Описание
Валидация (Validation) В анализе данных — проверка достаточности уровня качества данных (валидация данных) и проверка правильности работы аналитической модели, построенной на основе машинного обучения (валидация модели).
Вариация (Variation) В математике — малое изменение независимой переменной или функционала. В статистике — изменчивость, многообразие значений признака у единиц совокупности.
Веб-майнинг (Web Mining) Направление интеллектуального анализа данных, решающее задачи автоматического обнаружения веб-документов, извлечения информации из веб-ресурсов и выявления закономерностей в массивах данных из Интернета.
Веб-сервис (Web-service) Веб-служба Обладающая уникальным веб-адресом (URL) программная система, построенная на базе открытых протоколов/стандартов и использующаяся для обмена данными между приложениями или системами.
Вейвлет (Wavelet) От англ. wavelet (всплеск, маленькая волна) — класс математических функций, которые на графике выглядят как кратковременное волнообразное колебание. Используются как базисные функций в вейвлет-преобразовании.
Вейвлет-преобразование (Wavelet Transform) Метод преобразования данных к представлению, в котором они могут быть локализованы как по времени, так и по частоте. Основное использование вейвлет-преобразования — сжатие данных, их сглаживание, очистка от шума.
Векторизация текста (Text Data Vectorization) Конвертация текста в числа, необходимая для работы алгоритмов машинного обучения.
Вес доказательства (Weight of evidence) Коэффициент WoE, Coefficient WoE В задачах бинарной классификации используется для формирования конечных классов. Коэффициенты WoE и вычисленные на их основе значения IV являются критерием для формирования конечных классов оптимальным образом.
Визуализация (Visualization) В аналитических технологиях — комплекс методов представления исходной информации и результатов анализа данных в наиболее удобной для восприятия и интерпретации форме.
Винтажный анализ (Vintage analysis) Анализ по поколениям Разновидность когортного анализа, когда исследование поведенческих особенностей клиентов (абонентов, заёмщиков) на протяжении их жизненно цикла подразумевает формирование групп (когорт) на основе времени начала получения услуги (период выдачи кредита, регистрации абонента и т.д.). Основное применение винтажного анализа — управление кредитными рисками.
Витрина данных (Data Mart) Киоск данных, Секция данных Предметно-ориентированная база данных, содержащая данные по одному из направлений деятельности компании. В витрине информация хранится оптимизированно с точки зрения решения конкретных задач.
Возмущение (Disturbance) Возмущающее воздействие Воздействие на систему, которое нарушает ее нормальное функционирование и развитие. В аналитических моделях возмущающее воздействие представляется с помощью дополнительного случайного члена, который называют ошибкой, или остатками.
Волатильность (Volatility) Изменчивость, Неустойчивость Статистический показатель, характеризующий изменчивость различных величин во времени. Наиболее часто используется в экономике и финансах для описания колебания стоимости финансовых активов.
Временной ряд (Time series data) Упорядоченные данные Индексированная последовательность точек данных, отражающих развитие во времени некоторого процесса, зафиксированных через равные промежутки времени. Временные ряды играют большую роль в технологиях анализа данных.
Входная переменная (Input variable) Регрессор, Независимая переменная, Предсказывающая переменная, Объясняющая переменная, Predictor variable В статистическом моделировании и машинном обучении — величина, от которой зависит изменение выходной переменной. Совокупность входных переменных образует входной вектор.
Выборка (Sample) Выборочная совокупность В статистике и анализе данных — подмножество наблюдений генеральной совокупности, отобранных для изучения и анализа с помощью специальной процедуры, которая также называется выборкой.
Выборочный метод (Sampling method) Метод математической статистики, когда свойства генеральной совокупности изучаются на основе исследования свойств её части, полученной с помощью определенного алгоритма выборки.
Выброс (Outlier) Экстремальное значение, Extreme value Значения, которые не укладываются в общую модель поведения анализируемого процесса. Могут быть вызваны ошибками измерений, некорректным вводом данных или воздействием случайных, не поддающихся прогнозированию факторов.
Выходная переменная (Output variable) Зависимая переменная, Объясняемая переменная, Переменная класса, Целевая переменная, Predicted variable, Target variable В математическом моделировании — переменная модели, которая зависит от входных переменных и случайных факторов, воздействующих на моделируемый процесс или объект. Представляет результат работы модели.
Выходной слой (Output layer) Слой нейронной сети, на выходах которого формируется результат — отклик сети на входное воздействие. Число составляющих его нейронов определяется количеством зависимых переменных модели.
Вычислительная сложность алгоритма (Computational complexity) Количество элементарных операций, которые проводит алгоритм для решения конкретной задачи.
Выявление мошенничеств (Fraud detection) Направление интеллектуального анализа данных, включающее методы выявления мошеннических действий в кредитно-финансовой сфере, телекоммуникациях и т.д. Использует методы Data Mining — нейронные сети, деревья решений и т.д.