Вход
Регистрация

Войти c помощью аккаунта

Статьи

Быстродействие Deductor: файлы данных (параметры тестирования)

Одним из возможных участков оптимизации является этапы импорта и экспорта данных в программу. В этой серии материалов, мы постараемся дать несколько капель полезной информации с точки зрения производительности работы программы с источниками данных.

Метод касательных в ABC-анализе

ABC-анализ используется при решении множества задач. Однако выбрать пороги для ABC-групп не так просто, так как тяжело учесть влияние скрытых факторов на исследуемых процесс. Использование неактуальных параметров для определения ABC-групп может привести к ошибочным решениям. Метод касательных устраняет эту проблему.

Обработка пропусков в данных – часть 1

На практике в реальных данных очень часто встречаются пропуски. Причинами могут быть ошибки ввода данных, сокрытие информации, фрод. Из нашей новой статьи вы узнаете, в каких случаях неправильная обработка пропусков простыми методами приведет вас к ошибкам в моделях и принятии решений.

Введение в Social Mining

Статья посвящена общим вопросам, понятиям и задачам интеллектуального анализа социальных сетей – Social Mining. Рассмотрена виртуальная социальная сеть и её особенности.

Различные стратегии сэмплинга в условиях несбалансированности классов

В статье рассматриваются стратегии сэмплинга, которые могут быть применены в случае, когда в наборе данных классы не сбалансированы. Рассмотрены такие подходы, как случайное удаление примеров мажоритарного класса, связи Томека (Tomek links), SMOTE, ASMO и другие.

Web Mining — анализ использования веб-ресурсов. Построение моделей

В статье рассмотрены дальнейшие действия анализа использования веб-ресурсов после предобработки веб-данных. На примере показано как можно в этой области использовать статистическую информацию, применить алгоритмы Data Mining: k-means, CLOPE, Apriori.

Использование самоорганизующихся карт в задачах кластеризации

Использование нейросетей, в частности, самоорганизующихся карт при добычи информации из больших объемов данных. Описаны подходы, позволяющие находить закономерности, основываясь на поиске схожих (близких) объектов.

Очистка персональных данных, часть 2

В статье описаны методы очистки персональных данных, основанные на статистических понятиях. В них приводятся определения и расчеты основных статистических показателей, с помощью которых можно выявлять возможные ошибки, а также вычислять наиболее вероятные значения для их замены.

Web Mining: анализ использования веб-ресурсов, обработка веб-лога

Статья посвящена анализу использование веб-ресурсов. В этой части рассказано о том, как устроен веб-лог: какие поля он включает, и чем они могут быть полезны. Также в ней рассматривается предобработка веб-данных, описание которой сопровождено примером.

Страницы