Название/Синоним Описание
Таблица сопряженности (Contingency table) Таблица контингентности, Факторная таблица Метод представления многомерного частотного распределения двух признаков для исследования статистической связи между ними. Широко используется для обработки результатов исследований, особенно в бизнес-аналитике.
Таблица частот (Frequency array) Frequency table Показывает, сколько раз каждое значение набора данных появляется в нем. Является простейший методом анализа категориальных переменных. Наиболее часто используется в рамках разведочного анализа данных.
Таксономия (Taxonomy) Результат классификации и группировки сложных систем, представляемый обычно в виде иерархической структуры. Иногда отождествляется с близким термином «кластеризация».
Таргетинг (Targeting) В маркетинге — механизм, позволяющий выделить из аудитории потребителей часть, которая удовлетворяет заданным критериям (целевую аудиторию). Мощным инструментом таргетирования является анализ данных.
Текст майнинг (Text Mining) Text data mining, Text analytics, Интеллектуальный анализ текстов, Анализ текстов Технология получения информации из неструктурированных текстовых данных путём их преобразования в набор структурированных данных, пригодный для дальнейшего анализа методами интеллектуального анализа данных.
Текущий запас (Current stock) Резервы, обеспечивающие непрерывное движение материального потока между очередными поставками.
Темные данные (Dark data) Данные, которые собираются, накапливаются и хранятся, но никак не используются.
Теневой ИТ (Shadow IT) Теневой АйТи Несогласованное с руководством использование в корпоративной сети сторонних информационных технологий.
Теорема Байеса (Bayes’ theorem) Определяет вероятность события с привлечением связанных с ним знаний и условий. Например, если вероятность просрочки по кредиту связана со стажем работы клиента, то учет стажа позволяет более точно оценить вероятность просрочки.
Теория вероятностей (Probability theory) Раздел математики, изучающий закономерности случайных явлений, событий и величин, их свойства и операции над ними. Методы теории широко используются в анализе данных. Большинство аналитических моделей являются вероятностными.
Теория массового обслуживания (Queuing theory) Теория очередей, Waiting theory Область прикладной математики, которая описывает закономерности функционирования систем массового обслуживания (телефонные станции, ремонтные мастерские, супермаркеты и т.д.) с целью повышения их эффективности.
Теория множеств (Set theory) Раздел математической логики, который изучает множества. В математике множество — это совокупность отдельных объектов, рассматриваемая как объект сам по себе.
Тест FASMI (Fast Analysis of Shared Multidimensional Information) Быстрый анализ разделяемой многомерной информации, FASMI Определение понятия OLAP в виде пяти критериев, которым должны удовлетворять попадающие в эту категорию программные продукты. Альтернатива 13-ти правилам Кодда.
Тест Вальда (Wald test) Статистический тест с широким диапазоном применения. Наиболее часто используется для проверки гипотез, связанных с оценками параметров вероятностных моделей, получаемых на основе выборочных данных.
Тест отношения правдоподобия (Likelihood-ratio test) Тест Уилкса, Wilks’s test, LR-test Статистический тест для сравнения двух моделей, одна из которых строится на всех переменных исходного набора данных, а другая на некоторым их подмножестве.
Тест Чоу (Chow test) Позволяет оценить значимость улучшения регрессионной модели после разделения исходной выборки на части. Имеет большое практическое значение в анализе данных для повышения точности моделей.
Типы шкал (Type of scale) Типы шкал измерений, определяющих способы представления переменных в наборах данных, а также свойства значений, присваиваемых переменным для различных наблюдений. Тип используемой шкалы определяет какие алгоритмы и методы анализа можно применять к данным, измеряемым в данной шкале.
Тиражирование знаний (Knowledge replication) Процесс создания аналитических моделей, которые обеспечивают конечным пользователям возможность применять результаты моделирования для принятия решений без необходимости понимания методик.
Товар Гиффена (Giffen good) Эффект Гиффена, Парадокс Гиффена Товар, потребление которого увеличивается при повышении цены или уменьшается при ее снижении. Применение моделей Data Mining, учитывающих парадокс Гиффена, позволяет повысить результативность анализа.
Товарный запас (Inventory) Сбытовые запасы (Sales stocks) Резервы готовой продукции, находящиеся на складах предприятия, в сфере обращения (запасы в пути, запасы на предприятиях торговли).
Токенизация (Tokenization) Представляет собой процесс разделения текста на составляющие (слова, предложения, группы слов). Токенизация является важным обязательным процессом при применении алгоритмов машинного обучения и нейронных сетей для анализа текста.
Точка безубыточности (Break-event point) Критическая точка, CVP-точка Показатель минимального объема продаж, при котором организация покрывает расходы, но не получает прибыль. Расчет точки безубыточности производится в рамках решения задачи анализа издержек компании.
Точка Парето (Pareto point) Точка на пересечении линии Парето и диаграммы Парето. На практике используется в задачах ABC-анализа и XYZ-анализа.
Точность (Precision) Степень соответствия результатов, полученных в процессе исследований, измерений, экспериментов, истинным значениям. В анализе данных обычно ищут компромисс между точностью аналитической модели и затратами на ее реализацию.
Транзакционная база данных (Database of transactions) База данных транзакций, Transactional database База данных, каждая запись которой представляет собой транзакцию. Формируется с помощью систем оперативной обработки транзакций (OLTP) в банках, торговых сетях, телекоммуникационных компаниях и т.д.
Транзакция (Transaction) Минимальная логически целостная операция, которая имеет смысл и может быть совершена только целиком. В анализе данных — последовательность действий, представляющих собой логически связанную единицу.
Транзакция клиентская (Customer transaction) Транзакция, которая содержит не только информацию о покупке (операции), но и идентификатор клиента. Клиентские транзакции открывают дополнительные возможности для анализа данных, в частности, для поиска последовательных шаблонов.
Транспонирование (Transpose) В анализе данных — операция с таблицами, в результате которой столбцы таблицы становятся строками, а строки — столбцами. В линейной алгебре — операция над матрицами в результате которой матрица поворачивается относительно своей главной диагонали, при этом столбцы исходной матрицы становятся строками результирующей.
Трансформация данных (Data Transformation) Преобразование данных Оптимизация представлений и форматов данных с точки зрения решаемых задач и целей анализа. Один из важнейших процессов в анализе, от которого зависит эффективность анализа, достоверность и точность его результатов.
Трасса (Trace) Трасса (Trace) — это перечень уникальных событий, присутствующих в экземпляре процесса.
Тренд (Trend) Тенденция, Основная тенденция Долговременное, устойчивое однонаправленное изменение некоторого процесса. Наиболее часто понятие тренда употребляется в контексте анализа временных рядов.