Название/Синоним Описание
Файловая система HDFS (Hadoop Distributed File System) Система для хранения файлов больших размеров, поблочно распределенных между узлами вычислительного кластера. Все блоки (кроме последнего блока файла) имеют одинаковый размер, и каждый блок может быть размещен на нескольких узлах.
Факт (Fact) Мера, Показатель, Measure В многомерном моделировании данных — показатель, количественно описывающий исследуемый процесс или объект — например, цена, количество, сумма, остаток на складе и т.д. Факты являются основой для построения многомерных OLAP-кубов.
Фактор (Factor) Источник воздействия, приводящего к изменению значений переменных модели некоторой системы. В факторном анализе — линейная суперпозиция переменных, которые сильно коррелируют между собой, при том что сами факторы не коррелируют.
Фактор сна (Churn factor) Фактор оттока Индивидуальный показатель ухода клиента, определяемый на основе частоты его действий. Чем выше данный показатель, тем больше вероятность, что клиент ушёл безвозвратно.
Факторный анализ (Factorial analysis) Направление математической статистики, помогающее обнаружить наиболее важные факторы, которые влияют на исследуемые процессы или объекты. Это позволяет строить аналитические модели с небольшим числом независимых переменных.
ФИАС (FIAS) Федеральная информационная адресная система Российский государственный информационный ресурс, содержащий сведения о существующих почтовых адресах, изменении и аннулировании адресов. Находится в ведении Федеральной налоговой службы.
Фиктивная переменная (Dummy variable) Индикаторная переменная, Indicator variable Бинарная переменная, которая вводится как вспомогательная в статистические модели, особенно регрессионные. В технологиях Data Mining применяется аналогичное понятие — кодирование категориальных значений.
Фиктивное значение (Dummy value) Фейковые данные, Недействительное значение, Мнимое значение В анализе данных — значение, которое помещается в ячейку таблицы в случае, когда фактическое значение отсутствует или не вызывает доверия. В процессе очистки данных фиктивные значения должны обрабатываться.
Фильтр (Filter) В анализе данных — инструмент, выделяющий из исходного набора данных некоторую часть с заданными свойствами. Входит в состав большинства аналитических платформ. Распространены фильтр строк, сглаживающий фильтр, экстраполирующий фильтр.
Фильтр Калмана (Kalman filter) В анализе данных — эффективный рекурсивный фильтр, оценивающий вектор состояния динамической системы, описанной рядом неполных и зашумленных измерений. Используется для исследования непрерывного временного ряда.
Фильтр Ходрика-Прескотта (Hodrick–Prescott filter) Разложение Ходрика–Прескотта, Декомпозиция Ходрика–Прескотта, Hodrick–Prescott decomposition, HP-filter В анализе временных рядов, метод сглаживания циклической составляющей и выделения трендовой. В результате временной ряд представляется в виде кривой, которая лучше отражает долгосрочные изменения, чем краткосрочные. Широко применяется в экономических исследованиях и бизнес-аналитике.
Финансовые коэффициенты (Financial ratios) Величины, отражающие результаты финансовой деятельности компании и рассчитываемые на основе данных финансовой отчетности.
Функция потерь (Loss function) Целевая функция, Функция ошибки, Error function, Cost function В машинном обучении — функция, которая отображает некоторое событие в виде действительного числа, интуитивно представляя некоторую «стоимость», связанную с событием. Используется для оценки параметров моделей.
Функция правдоподобия (Plausibility function) Функция, определяющая вероятность значений параметров регрессионной модели для заданного значения независимой переменной.