Вход
Регистрация

Обучение рекуррентных сетей

Можно ли рекуррентные сети (РИНС) с фиксированным числом тактов функционирования обучать градиентными методами? Видиться мне, что так просто с прямоточных сетей градиентный алгоритм не переложишь на РИНС. По идее РИНС с фикс. числом тактов можно представить в виде многослойной (один слой на один такт). Но при обучении такой сети накладываются ограничения на равенство весов некоторых синапсов. Существующие методы градиентной оптимизации с ограничениями типа равенство строгое равенство не гарантируют, а только минимизируют разницу. Можно конечно стохастическими методами обучать, да только медленные они.