Опубликовано: 14:42, 21 август 2025

Российские ученые повысили эффективность обучения генеративных потоковых ИИ

Российские ученые предложили новый способ, который способен существенно повысить результативность обучения генеративных потоковых нейросетей, применяемых для решения сложных и неструктурированных задач. Благодаря этой методике процесс разработки искусственного интеллекта, ориентированного на поиск инновационных лекарственных средств, может значительно ускориться, сообщили в пресс-службе НИУ ВШЭ.

По словам младшего научного сотрудника Института искусственного интеллекта и цифровых наук ФКН НИУ ВШЭ Никиты Морозова, предложенный метод позволяет заметно быстрее анализировать пространство решений и находить больше качественных вариантов по сравнению с ранее используемыми инструментами. Он также отметил, что данная технология сближает генеративные модели с принципами обучения с подкреплением, что открывает новые перспективы в развитии искусственного интеллекта.

Генеративные потоковые сети, как поясняют исследователи, представляют собой особый класс алгоритмов машинного обучения, которые создают сложные объекты поэтапно. Подобные модели востребованы в различных сферах — от поиска новых белков и лекарств до оптимизации транспортных систем. Чтобы справляться с такими задачами, ИИ должен уметь работать со свойствами создаваемых объектов и корректно управлять ими.

Структура подобных сетей основана на взаимодействии двух компонентов — прямой и обратной моделей. Первая отвечает за последовательное построение сложных объектов из простых элементов, тогда как вторая «разбирает» уже созданную конструкцию, определяя цепочку шагов, приведшую к ее формированию. Сложность заключается в том, что для стабильной работы необходимо поддерживать баланс между двумя компонентами, при этом обратная модель традиционно считается наиболее уязвимой.

Как отметил стажер-исследователь Института искусственного интеллекта и цифровых наук ФКН НИУ ВШЭ Тимофей Грицаев, новая методика делает процесс поиска решений похожим на переговоры, когда обе стороны способны корректировать свои позиции. В условиях высокой неопределенности обратная модель используется как вспомогательный инструмент, позволяющий усилить результативность прямой модели. По его словам, разработчикам удалось добиться гибкости в работе этого компонента и тем самым существенно улучшить весь процесс обучения.

По мнению специалистов, предложенный подход найдет применение в самых разных областях — от фармацевтики и материаловедения до настройки крупных языковых моделей. Он не только ускорит поиск оптимальных решений, но и снизит нагрузку на вычислительные мощности, что делает разработку перспективной для дальнейшего внедрения в научные и экономические проекты.

Российские ученые повысили эффективность обучения генеративных потоковых ИИ

Читайте также: