Вход
Регистрация

Генетические алгоритмы для обработки текстовой информации

Привет, всем участникам форума! Я здесь впервые, в смысле на форуме. Возникла проблема, помогите плиз, если кто-то сталкивался с подобными вещами. Задача состоит в следующем, есть социологический опрос, представленный ответами респондентов. Ответ-это может быть слово,фраза, словосочетание и т.д. На основе этого опроса вручную составлен словарь - кодировщик. Он устроен так, есть код, т.е. число, каждому такому числу соответствует некоторое множество ключевых слов по определённой тематике, взятых из опроса. Так вот, смысл в том, чтобы автоматически проставить коды ответам из опроса. Понятно, что совсем автоматом,это не сделать. Понадобятся обучения. Часть опроса можно достаточно неплохо закодировать обычными методами сравнения строк( расстояние Левенштейна например). Проблема в том, что это тема дипломной работы и нужна хорошая математика. Подскажите, можно ли к этой задаче применить генетические алгоритмы? Если можно, то как опрос представить в терминах генетических алгоритмов, как выбрать параметры алгоритма и их закодировать. Заранее спасибо большое.