Таблица сопряженности (Contingency table) Таблица контингентности, Факторная таблица |
Метод представления многомерного частотного распределения двух признаков для исследования статистической связи между ними. Широко используется для обработки результатов исследований, особенно в бизнес-аналитике. |
Таблица частот (Frequency array) Frequency table |
Показывает, сколько раз каждое значение набора данных появляется в нем. Является простейший методом анализа категориальных переменных. Наиболее часто используется в рамках разведочного анализа данных. |
Таксономия (Taxonomy) |
Результат классификации и группировки сложных систем, представляемый обычно в виде иерархической структуры. Иногда отождествляется с близким термином «кластеризация». |
Таргетинг (Targeting) |
В маркетинге — механизм, позволяющий выделить из аудитории потребителей часть, которая удовлетворяет заданным критериям (целевую аудиторию). Мощным инструментом таргетирования является анализ данных. |
Текст майнинг (Text Mining) Text data mining, Text analytics, Интеллектуальный анализ текстов, Анализ текстов |
Технология получения информации из неструктурированных текстовых данных путём их преобразования в набор структурированных данных, пригодный для дальнейшего анализа методами интеллектуального анализа данных. |
Текущий запас (Current stock) |
Резервы, обеспечивающие непрерывное движение материального потока между очередными поставками. |
Темные данные (Dark data) |
Данные, которые собираются, накапливаются и хранятся, но никак не используются. |
Теневой ИТ (Shadow IT) Теневой АйТи |
Несогласованное с руководством использование в корпоративной сети сторонних информационных технологий. |
Теорема Байеса (Bayes’ theorem) |
Определяет вероятность события с привлечением связанных с ним знаний и условий. Например, если вероятность просрочки по кредиту связана со стажем работы клиента, то учет стажа позволяет более точно оценить вероятность просрочки. |
Теория вероятностей (Probability theory) |
Раздел математики, изучающий закономерности случайных явлений, событий и величин, их свойства и операции над ними. Методы теории широко используются в анализе данных. Большинство аналитических моделей являются вероятностными. |
Теория массового обслуживания (Queuing theory) Теория очередей, Waiting theory |
Область прикладной математики, которая описывает закономерности функционирования систем массового обслуживания (телефонные станции, ремонтные мастерские, супермаркеты и т.д.) с целью повышения их эффективности. |
Теория множеств (Set theory) |
Раздел математической логики, который изучает множества. В математике множество — это совокупность отдельных объектов, рассматриваемая как объект сам по себе. |
Тест FASMI (Fast Analysis of Shared Multidimensional Information) Быстрый анализ разделяемой многомерной информации, FASMI |
Определение понятия OLAP в виде пяти критериев, которым должны удовлетворять попадающие в эту категорию программные продукты. Альтернатива 13-ти правилам Кодда. |
Тест Вальда (Wald test) |
Статистический тест с широким диапазоном применения. Наиболее часто используется для проверки гипотез, связанных с оценками параметров вероятностных моделей, получаемых на основе выборочных данных. |
Тест отношения правдоподобия (Likelihood-ratio test) Тест Уилкса, Wilks’s test, LR-test |
Статистический тест для сравнения двух моделей, одна из которых строится на всех переменных исходного набора данных, а другая на некоторым их подмножестве. |
Тест Чоу (Chow test) |
Позволяет оценить значимость улучшения регрессионной модели после разделения исходной выборки на части. Имеет большое практическое значение в анализе данных для повышения точности моделей. |
Типы шкал (Type of scale) |
Типы шкал измерений, определяющих способы представления переменных в наборах данных, а также свойства значений, присваиваемых переменным для различных наблюдений. Тип используемой шкалы определяет какие алгоритмы и методы анализа можно применять к данным, измеряемым в данной шкале. |
Тиражирование знаний (Knowledge replication) |
Процесс создания аналитических моделей, которые обеспечивают конечным пользователям возможность применять результаты моделирования для принятия решений без необходимости понимания методик. |
Товар Гиффена (Giffen good) Эффект Гиффена, Парадокс Гиффена |
Товар, потребление которого увеличивается при повышении цены или уменьшается при ее снижении. Применение моделей Data Mining, учитывающих парадокс Гиффена, позволяет повысить результативность анализа. |
Товарный запас (Inventory) Сбытовые запасы (Sales stocks) |
Резервы готовой продукции, находящиеся на складах предприятия, в сфере обращения (запасы в пути, запасы на предприятиях торговли). |
Токенизация (Tokenization) |
Представляет собой процесс разделения текста на составляющие (слова, предложения, группы слов). Токенизация является важным обязательным процессом при применении алгоритмов машинного обучения и нейронных сетей для анализа текста. |
Точка безубыточности (Break-event point) Критическая точка, CVP-точка |
Показатель минимального объема продаж, при котором организация покрывает расходы, но не получает прибыль. Расчет точки безубыточности производится в рамках решения задачи анализа издержек компании. |
Точка Парето (Pareto point) |
Точка на пересечении линии Парето и диаграммы Парето. На практике используется в задачах ABC-анализа и XYZ-анализа. |
Точность (Precision) |
Степень соответствия результатов, полученных в процессе исследований, измерений, экспериментов, истинным значениям. В анализе данных обычно ищут компромисс между точностью аналитической модели и затратами на ее реализацию. |
Транзакционная база данных (Database of transactions) База данных транзакций, Transactional database |
База данных, каждая запись которой представляет собой транзакцию. Формируется с помощью систем оперативной обработки транзакций (OLTP) в банках, торговых сетях, телекоммуникационных компаниях и т.д. |
Транзакция (Transaction) |
Минимальная логически целостная операция, которая имеет смысл и может быть совершена только целиком. В анализе данных — последовательность действий, представляющих собой логически связанную единицу. |
Транзакция клиентская (Customer transaction) |
Транзакция, которая содержит не только информацию о покупке (операции), но и идентификатор клиента. Клиентские транзакции открывают дополнительные возможности для анализа данных, в частности, для поиска последовательных шаблонов. |
Транспонирование (Transpose) |
В анализе данных — операция с таблицами, в результате которой столбцы таблицы становятся строками, а строки — столбцами. В линейной алгебре — операция над матрицами в результате которой матрица поворачивается относительно своей главной диагонали, при этом столбцы исходной матрицы становятся строками результирующей. |
Трансформация данных (Data Transformation) Преобразование данных |
Оптимизация представлений и форматов данных с точки зрения решаемых задач и целей анализа. Один из важнейших процессов в анализе, от которого зависит эффективность анализа, достоверность и точность его результатов. |
Трасса (Trace) |
Трасса (Trace) — это перечень уникальных событий, присутствующих в экземпляре процесса. |
Тренд (Trend) Тенденция, Основная тенденция |
Долговременное, устойчивое однонаправленное изменение некоторого процесса. Наиболее часто понятие тренда употребляется в контексте анализа временных рядов. |