Гармонизация данных (Data harmonization) |
Гармонизация — это совокупность процессов объединения данных компании из различных источников в единую среду хранения, с одновременным их преобразованием к виду, наиболее подходящему для решения тех или иных задач. |
Генеральная совокупность (General population) Statistical population, Статистическая совокупность |
Совокупность всех объектов или наблюдений, которые подлежат изучению. Объем генеральной совокупности может быть очень велик, поэтому на практике обычно из нее извлекаются выборки для анализа. |
Генетический алгоритм (Genetic algorithm) |
Метод решения задач оптимизации, основанный на принципах процессов естественного отбора (мутация, скрещивание, отбор). Является частью более обширного направления искусственного интеллекта — эволюционных вычислений. |
Гетероскедастичность (Heteroskedastic regression) |
Свойство данных, используемых при построении регрессионной модели, когда разброс точек наблюдений вдоль линии регрессии является неравномерным на всем диапазоне изменения независимой переменной. |
Гибридные интеллектуальные системы (Hybrid intelligence system) |
Системы, которые при решении задач используют параллельно несколько различных методов искусственного интеллекта, например, экспертные системы, нейронные сети, нечеткую логику, генетические алгоритмы, ассоциативные правила. |
Гиперпараметры (Hyperparameters) |
В машинном обучении — параметры алгоритмов, значения которых устанавливаются перед запуском процесса обучения (тогда как обычные параметры вычисляются в процессе обучения). Используются для управления процессом обучения. |
Гиперсегментация (Hyper-segmentation) Hypertargeting |
Технология формирования персонализированных маркетинговых предложений для очень узких сегментов целевой аудитории. |
Гипотеза (Hypothesis) |
В математической статистике и анализе данных — предположение о виде распределения и свойствах случайной величины, которое можно подтвердить или опровергнуть применением статистических методов к выборочным данным. |
Гистограмма (Histogram) Диаграмма частот, Frequency bar chart |
Диаграмма, которая используется в статистике для графического представления распределения вероятностей значений случайной величины. По форме гистограммы можно в первом приближении оценить закон распределения величины. |
Глобальная оптимизация (Overall optimization) Global optimization |
В анализе данных — раздел прикладной математики и численного анализа, который занимается проблемами поиска глобальных экстремумов функций. |
Глобальный минимум (Global minimum) |
В математическом анализе и численных методах — экстремум функции в точке, значение которой минимально на всей области определения. В машинном обучении используется для определения минимальной ошибки модели. |
Глубина прогноза (Forecast depth) Глубина погружения |
В анализе данных — ретроспективный временной интервал, на основе наблюдений которого делается прогноз. Если мы хотим построить прогноз на VI квартал, используя данные за I, II и III кварталы, то глубина составит 3. |
Гомогенность (Homogeneous) Однородность |
Свойство выборки данных, которое означает, что все ее элементы имеют схожие характеристики. От однородности зависят точность и корректность результатов анализа данных. |
Гомоскедастичность (Homoscedastic regression) |
Свойство данных, используемых для построения модели линейной регрессии, которое заключается в том, что их дисперсия вдоль прямой регрессии является постоянной. Одно из условий эффективности регрессионной модели. |
Горизонт прогнозирования (Time horizon) Forecast horizon |
Временной интервал, в пределах которого прогноз выполняется с заданной точностью. Для модели прогнозирования на основе метода скользящего окна — временной интервал, для которого строится прогноз. |
Гражданский дата-сайнс (Citizen Data Science) Гражданская наука о данных |
Корпоративная стратегия, в рамках которой к анализу данных (в частности, реализации Big Data) активно привлекаются работники линейных подразделений компании не имеющие специального образования и подготовки, а не только сотрудники IT-отделов, обладающие соответствующими компетенциями. |
Граница решения (Decision boundary) Граница принятий решения, Решающая граница, Дискриминирующая граница |
Термин машинного обучения, обозначающий гиперповерхность, разделяющую классы между собой. |