Вход
Регистрация

Войти c помощью аккаунта

Статьи

Быстродействие Deductor: файлы данных (до 10 млн. строк)

В статье приведены результаты тестирования импорта и экспорта файлов на больших наборах данных. Приведены графики сравнения производительности различных форматов хранения.

Быстродействие Deductor: файлы данных (до 1 млн. строк)

В статье приведены результаты тестирования импорта и экспорта файлов на средних наборах данных. Приведены графики сравнения производительности различных форматов хранения.

Быстродействие Deductor: файлы данных (до 100 тыс. строк)

В статье приведены результаты тестирования импорта и экспорта файлов на малых наборах данных. Приведены графики сравнения производительности различных форматов хранения.

Быстродействие Deductor: файлы данных (параметры тестирования)

Одним из возможных участков оптимизации является этапы импорта и экспорта данных в программу. В этой серии материалов, мы постараемся дать несколько капель полезной информации с точки зрения производительности работы программы с источниками данных.

Метод касательных в ABC-анализе

ABC-анализ используется при решении множества задач. Однако выбрать пороги для ABC-групп не так просто, так как тяжело учесть влияние скрытых факторов на исследуемых процесс. Использование неактуальных параметров для определения ABC-групп может привести к ошибочным решениям. Метод касательных устраняет эту проблему.

Обработка пропусков в данных – часть 1

На практике в реальных данных очень часто встречаются пропуски. Причинами могут быть ошибки ввода данных, сокрытие информации, фрод. Из нашей новой статьи вы узнаете, в каких случаях неправильная обработка пропусков простыми методами приведет вас к ошибкам в моделях и принятии решений.

Введение в Social Mining

Статья посвящена общим вопросам, понятиям и задачам интеллектуального анализа социальных сетей – Social Mining. Рассмотрена виртуальная социальная сеть и её особенности.

Различные стратегии сэмплинга в условиях несбалансированности классов

В статье рассматриваются стратегии сэмплинга, которые могут быть применены в случае, когда в наборе данных классы не сбалансированы. Рассмотрены такие подходы, как случайное удаление примеров мажоритарного класса, связи Томека (Tomek links), SMOTE, ASMO и другие.

Web Mining — анализ использования веб-ресурсов. Построение моделей

В статье рассмотрены дальнейшие действия анализа использования веб-ресурсов после предобработки веб-данных. На примере показано как можно в этой области использовать статистическую информацию, применить алгоритмы Data Mining: k-means, CLOPE, Apriori.

Использование самоорганизующихся карт в задачах кластеризации

Использование нейросетей, в частности, самоорганизующихся карт при добычи информации из больших объемов данных. Описаны подходы, позволяющие находить закономерности, основываясь на поиске схожих (близких) объектов.

Страницы