Статьи

Очистка и разбор текста

Алексей АрустамовОчистка данных3 комментария

Описан подход к решению задачи очистки и разбора текстов. Методика предназначена для работы с частично структурированными данными, такими как прайс-листы, описания деталей/конструкций и прочее. Способ заключается в разбиении информации, представленную в виде произвольного текста, на составные части, например, из описания детали выделить название, изготовителя, ГОСТ, различные характеристики.

Knowledge Discovery in Databases — обнаружение знаний в базах данных

Методология0 комментариев

Knowledge Discovery in Databases – это процесс поиска полезных знаний в "сырых данных". KDD включает в себя вопросы: подготовки данных, выбора информативных признаков, очистки данных, применения методов Data Mining, постобработки данных и интерпретации полученных результатов.

Применение нейронных сетей для задач классификации

alexey.starikovМетодология4 комментария

Решение задачи классификации является одним из важнейших применений нейронных сетей. Задача классификации представляет собой задачу отнесения образца к одному из нескольких попарно не пересекающихся множеств.

Разбор адреса на составляющие

Алексей АрустамовОчистка данных, Предобработка данных8 комментариев

Большое количество сведений о клиентах, имеющееся в базах данных, хранятся в неудобном для аналитической обработки виде, например, адресная информация. Можно ли и нужно ли ее применять для анализа? Да, нужно использовать обязательно. Но без предварительной обработки не получится в виду того, что общепринятого формата записи не существует. Поэтому необходимо его разбить на составляющие.

Ядро OLAP системы. Часть 2 — внутри гиперкуба

alexey.starikovOLAP0 комментариев

Описаны детали реализации библиотеки компонентов CubeBase. В частности, рассмотрены вопросы загрузки, внутреннего представления и принципов хранения информации в многомерном гиперкубе. Примененные в CubeBase подходы позволили создать масштабируемое высокопроизводительное OLAP ядро.

Хранилища данных и задачи прогнозирования

Data Warehouse0 комментариев

При решении практических задач, в частности, задачи прогнозирования, вы обязательно столкнетесь с проблемой подготовки данных. Не надо питать никаких иллюзий, что если не помог один способ прогнозирования, то поможет другой, более изощренный. Дело не в методах. Если в исходных данных не хватает параметров, если информация сильно искажена, то никакой метод не поможет. Но выход есть...

Методы отбора переменных в регрессионные модели

alexey.seninМетодология0 комментариев

Статья посвящена проблеме отбора факторов (Feature Selection) в случае с линейной моделью множественной регрессии. Рассмотрены такие итерационные алгоритмы по выбору независимых переменных как Forward Selection, Backward Elimination, Stepwise, а также изложена идея частного F-критерия, на основе которого осуществляется проверка на значимость входных признаков. Механизм работы каждой из методик разобран на конкретном примере.

Статьи

Очистка и разбор текста

Knowledge Discovery in Databases — обнаружение знаний в базах данных

Применение нейронных сетей для задач классификации

Разбор адреса на составляющие

Ядро OLAP системы. Часть 2 — внутри гиперкуба

Хранилища данных и задачи прогнозирования

Методы отбора переменных в регрессионные модели

Быстрое преобразование Фурье

Деревья решений — C4.5 математический аппарат. Часть 2

NeuralBase — нейросеть за 5 минут

Страницы

На вашу электронную почту отправлено письмо, в котором ссылка для подверждения регистрации

Восстановление пароля

Статьи

Страницы

На вашу электронную почту отправлено письмо,
в котором ссылка для подверждения регистрации