Вход
Регистрация

Войти c помощью аккаунта

Статьи

Метод касательных в ABC-анализе

ABC-анализ используется при решении множества задач. Однако выбрать пороги для ABC-групп не так просто, так как тяжело учесть влияние скрытых факторов на исследуемых процесс. Использование неактуальных параметров для определения ABC-групп может привести к ошибочным решениям. Метод касательных устраняет эту проблему.

Обработка пропусков в данных – часть 1

На практике в реальных данных очень часто встречаются пропуски. Причинами могут быть ошибки ввода данных, сокрытие информации, фрод. Из нашей новой статьи вы узнаете, в каких случаях неправильная обработка пропусков простыми методами приведет вас к ошибкам в моделях и принятии решений.

Введение в Social Mining

Статья посвящена общим вопросам, понятиям и задачам интеллектуального анализа социальных сетей – Social Mining. Рассмотрена виртуальная социальная сеть и её особенности.

Различные стратегии сэмплинга в условиях несбалансированности классов

В статье рассматриваются стратегии сэмплинга, которые могут быть применены в случае, когда в наборе данных классы не сбалансированы. Рассмотрены такие подходы, как случайное удаление примеров мажоритарного класса, связи Томека (Tomek links), SMOTE, ASMO и другие.

Web Mining — анализ использования веб-ресурсов. Построение моделей

В статье рассмотрены дальнейшие действия анализа использования веб-ресурсов после предобработки веб-данных. На примере показано как можно в этой области использовать статистическую информацию, применить алгоритмы Data Mining: k-means, CLOPE, Apriori.

Использование самоорганизующихся карт в задачах кластеризации

Использование нейросетей, в частности, самоорганизующихся карт при добычи информации из больших объемов данных. Описаны подходы, позволяющие находить закономерности, основываясь на поиске схожих (близких) объектов.

Очистка персональных данных, часть 2

В статье описаны методы очистки персональных данных, основанные на статистических понятиях. В них приводятся определения и расчеты основных статистических показателей, с помощью которых можно выявлять возможные ошибки, а также вычислять наиболее вероятные значения для их замены.

Web Mining: анализ использования веб-ресурсов, обработка веб-лога

Статья посвящена анализу использование веб-ресурсов. В этой части рассказано о том, как устроен веб-лог: какие поля он включает, и чем они могут быть полезны. Также в ней рассматривается предобработка веб-данных, описание которой сопровождено примером.

Нечеткие деревья решений

Статья посвящена нечетким деревьям решений (fuzzy decision trees). Описаны основные идеи: правила нахождения энтропии и прироста информации в нечетком случае. Работа алгоритма пояснена на примере.

Алгоритм ближайшего соседа

Cтатья посвящена алгоритму KNN, который широко используется в Data Mining для решения задач классификации, так как он прост для программной реализации, а полученный результат легко поддается интерпретации. Рассмотрены базовые идеи, области применения алгоритма, приведены примеры

Страницы