Добрый день,
Подскажите пожалуйста, какой вид нейро сети (топология, количество слоёв) лучше подходит для классификации почтовых сообщений (спам / не спам)? Кто-нибудь занимался этим?
Заранее благодарю,
Сергей
Вообще-то, лучше сначала начать не с нейросетей, а со статистической классики типа традиционного метода байеса (или линейного дискриминанта вместо него), затем наивного байеса, потом метода К ближайших соседей, а уже потом брать нейросети.
Тут телепатов нет, никто свойств собранной Вами выборки данных не знает, ничего конкретнее, чем взять любые нейросети, решающие задачу классификации с учителем, не посоветует. Топология и число слоев/нейронов подбирается путем максимизации точности решения, а каким видам сети этот максимум соответствует - нельзя сказать, ничего не зная о выборке данных.
А пойдете от простых моделей в сторону наращивания нелинейности - и станет понятно, имеет ли смысл вообще использовать нелинейные модели и нейросети в том числе, определите перемешанность примеров разных классов и неоднородность классов. Такое погружение в свойства решаемой задачи даст больше для возможности целенаправленной оптимизации качества решения (естественно, при достаточно хорошем знакомстве с нейросетями, методами, которые я назвал, и может быть и другими методами), чем подбор оптимального вида сети методом "тыка".
Большое спасибо за ответ. Статистические методы уже реализовал, получил довольно таки неплохие результаты. Теперь руки тянутся к нейросетям, очень интересная вещь.
Добрый день еще раз,
В форуме про NeuroBase вы писали, что больше не используете эти компоненты. Можно как-то заполучить компоненты, которые вы используете сейчас? Может быть там реализованы более быстрые методы обучения в отличие от Back Propagation? :)
Сергей.
Это вопрос, как я понял, коллегам из Нейропроекта? А чего на их форуме не спрашиваете?
Извините, ничего не знал про Нейропроект, спрошу. Я только начинаю знакомство с компаниями, которые работают в этой области, и началось оно с Вас и с NeuroBase :)
Сергей.
Я просто почти не увидел связи между Вашим вопросом и моим ответом перед ним, а на сайте нейропроекта кто-то недавно как раз спрашивал про приобретение библиотеки компонент, и вроде как раз она и называлась neurobase (лень специально лезть туда и смотреть-уточнять). Поэтому и подумал, что Вы немножко перепутали.
Но раз ко мне был вопрос, то я совсем не врубился :( Если актуально - то как-то другими словами спросите, я не понял вообще ничего ;)
Извините, ошибка. Я имел в виду компоненты, NeuralBase (http://www.basegroup.ru/neural/fastneuralnet.htm), которые, как написано в форуме под статьей, BaseGroup больше не использует. Хотел просто узнать что вы используете сейчас и можно ли с этим поигратсо?
С моим софтом и компонентами - поиграть нельзя, пообсуждать алгоритмы можно. Что используют в BaseGroup - ответит кто-нибудь из них, я никакого отношения к этой уважаемой компании, кроме присутствия на их форуме, не имею ;)
Я из BaseGroup, можно и мне кое-что сказать :)
Действительно, сейчас мы их не используем. Дело в том, что была очень серьезно переработана архитектура, нужно было как-то обеспечить, чтобы можно было комбинировать любые методы анализа, а в старой архитектуре это нормально реализовать не получалось. Сами алгоритмы не особо изменились.
Последние версии наших компонентов используются только внутри компании.