Файловая система HDFS (Hadoop Distributed File System) |
Система для хранения файлов больших размеров, поблочно распределенных между узлами вычислительного кластера. Все блоки (кроме последнего блока файла) имеют одинаковый размер, и каждый блок может быть размещен на нескольких узлах. |
Факт (Fact) Мера, Показатель, Measure |
В многомерном моделировании данных — показатель, количественно описывающий исследуемый процесс или объект — например, цена, количество, сумма, остаток на складе и т.д. Факты являются основой для построения многомерных OLAP-кубов. |
Фактор (Factor) |
Источник воздействия, приводящего к изменению значений переменных модели некоторой системы. В факторном анализе — линейная суперпозиция переменных, которые сильно коррелируют между собой, при том что сами факторы не коррелируют. |
Фактор сна (Churn factor) Фактор оттока |
Индивидуальный показатель ухода клиента, определяемый на основе частоты его действий. Чем выше данный показатель, тем больше вероятность, что клиент ушёл безвозвратно. |
Факторный анализ (Factorial analysis) |
Направление математической статистики, помогающее обнаружить наиболее важные факторы, которые влияют на исследуемые процессы или объекты. Это позволяет строить аналитические модели с небольшим числом независимых переменных. |
ФИАС (FIAS) Федеральная информационная адресная система |
Российский государственный информационный ресурс, содержащий сведения о существующих почтовых адресах, изменении и аннулировании адресов. Находится в ведении Федеральной налоговой службы. |
Фиктивная переменная (Dummy variable) Индикаторная переменная, Indicator variable |
Бинарная переменная, которая вводится как вспомогательная в статистические модели, особенно регрессионные. В технологиях Data Mining применяется аналогичное понятие — кодирование категориальных значений. |
Фиктивное значение (Dummy value) Фейковые данные, Недействительное значение, Мнимое значение |
В анализе данных — значение, которое помещается в ячейку таблицы в случае, когда фактическое значение отсутствует или не вызывает доверия. В процессе очистки данных фиктивные значения должны обрабатываться. |
Фильтр (Filter) |
В анализе данных — инструмент, выделяющий из исходного набора данных некоторую часть с заданными свойствами. Входит в состав большинства аналитических платформ. Распространены фильтр строк, сглаживающий фильтр, экстраполирующий фильтр. |
Фильтр Калмана (Kalman filter) |
В анализе данных — эффективный рекурсивный фильтр, оценивающий вектор состояния динамической системы, описанной рядом неполных и зашумленных измерений. Используется для исследования непрерывного временного ряда. |
Фильтр Ходрика-Прескотта (Hodrick–Prescott filter) Разложение Ходрика–Прескотта, Декомпозиция Ходрика–Прескотта, Hodrick–Prescott decomposition, HP-filter |
В анализе временных рядов, метод сглаживания циклической составляющей и выделения трендовой. В результате временной ряд представляется в виде кривой, которая лучше отражает долгосрочные изменения, чем краткосрочные. Широко применяется в экономических исследованиях и бизнес-аналитике. |
Финансовые коэффициенты (Financial ratios) |
Величины, отражающие результаты финансовой деятельности компании и рассчитываемые на основе данных финансовой отчетности. |
Функция потерь (Loss function) Целевая функция, Функция ошибки, Error function, Cost function |
В машинном обучении — функция, которая отображает некоторое событие в виде действительного числа, интуитивно представляя некоторую «стоимость», связанную с событием. Используется для оценки параметров моделей. |
Функция правдоподобия (Plausibility function) |
Функция, определяющая вероятность значений параметров регрессионной модели для заданного значения независимой переменной. |