Вход
Регистрация

Классификация текстов. Может ли Ваш продукт такое...

Добрый день!

У нас стоит такая задача:
Классифицировать тексты с сайтов. Список категорий заранее неизвестен и может постоянно увеличиваться.
Есть такие данные по каждому сайту:
1. URL, где возможно уже содержится подсказка к какой категории лучше отнести этот ресурс, например, rentcars.com можно сразу отнести к категории Rent cars
2. Title, из которого тоже возможно уже можно понять к какой категории отнести данную страницу
3. Заголовки H1, H2
4. Основной текст страницы(статьи)

Мы можем распарсить каждый URL и сохранить всю информацию в любом удобном виде. На выходе должны получить для каждого URL свою категорию, типа: Helth, Job, Politic, Sport, Insurance, Visas, Money transfers и т.д.

Может ли Ваш софт нам в этом помочь? Язык может быть любым, но можно начать с английского, например. Если да, то готовы приобрести полную лицензию. Спасибо.