Название/Синоним Описание
Гармонизация данных (Data harmonization) Гармонизация — это совокупность процессов объединения данных компании из различных источников в единую среду хранения, с одновременным их преобразованием к виду, наиболее подходящему для решения тех или иных задач.
Генеральная совокупность (General population) Statistical population, Статистическая совокупность Совокупность всех объектов или наблюдений, которые подлежат изучению. Объем генеральной совокупности может быть очень велик, поэтому на практике обычно из нее извлекаются выборки для анализа.
Генетический алгоритм (Genetic algorithm) Метод решения задач оптимизации, основанный на принципах процессов естественного отбора (мутация, скрещивание, отбор). Является частью более обширного направления искусственного интеллекта — эволюционных вычислений.
Гетероскедастичность (Heteroskedastic regression) Свойство данных, используемых при построении регрессионной модели, когда разброс точек наблюдений вдоль линии регрессии является неравномерным на всем диапазоне изменения независимой переменной.
Гибридные интеллектуальные системы (Hybrid intelligence system) Системы, которые при решении задач используют параллельно несколько различных методов искусственного интеллекта, например, экспертные системы, нейронные сети, нечеткую логику, генетические алгоритмы, ассоциативные правила.
Гиперпараметры (Hyperparameters) В машинном обучении — параметры алгоритмов, значения которых устанавливаются перед запуском процесса обучения (тогда как обычные параметры вычисляются в процессе обучения). Используются для управления процессом обучения.
Гиперсегментация (Hyper-segmentation) Hypertargeting Технология формирования персонализированных маркетинговых предложений для очень узких сегментов целевой аудитории.
Гипотеза (Hypothesis) В математической статистике и анализе данных — предположение о виде распределения и свойствах случайной величины, которое можно подтвердить или опровергнуть применением статистических методов к выборочным данным.
Гистограмма (Histogram) Диаграмма частот, Frequency bar chart Диаграмма, которая используется в статистике для графического представления распределения вероятностей значений случайной величины. По форме гистограммы можно в первом приближении оценить закон распределения величины.
Глобальная оптимизация (Overall optimization) Global optimization В анализе данных — раздел прикладной математики и численного анализа, который занимается проблемами поиска глобальных экстремумов функций.
Глобальный минимум (Global minimum) В математическом анализе и численных методах — экстремум функции в точке, значение которой минимально на всей области определения. В машинном обучении используется для определения минимальной ошибки модели.
Глубина прогноза (Forecast depth) Глубина погружения В анализе данных — ретроспективный временной интервал, на основе наблюдений которого делается прогноз. Если мы хотим построить прогноз на VI квартал, используя данные за I, II и III кварталы, то глубина составит 3.
Гомогенность (Homogeneous) Однородность Свойство выборки данных, которое означает, что все ее элементы имеют схожие характеристики. От однородности зависят точность и корректность результатов анализа данных.
Гомоскедастичность (Homoscedastic regression) Свойство данных, используемых для построения модели линейной регрессии, которое заключается в том, что их дисперсия вдоль прямой регрессии является постоянной. Одно из условий эффективности регрессионной модели.
Горизонт прогнозирования (Time horizon) Forecast horizon Временной интервал, в пределах которого прогноз выполняется с заданной точностью. Для модели прогнозирования на основе метода скользящего окна — временной интервал, для которого строится прогноз.
Гражданский дата-сайнс (Citizen Data Science) Гражданская наука о данных Корпоративная стратегия, в рамках которой к анализу данных (в частности, реализации Big Data) активно привлекаются работники линейных подразделений компании не имеющие специального образования и подготовки, а не только сотрудники IT-отделов, обладающие соответствующими компетенциями.
Граница решения (Decision boundary) Граница принятий решения, Решающая граница, Дискриминирующая граница Термин машинного обучения, обозначающий гиперповерхность, разделяющую классы между собой.