Метод ансамблирования алгоритмов обучения с подкреплением на основе иерархичности

Козлов Д. А.

Samara University Repository

Welcome to the Samara University repository!

This is an open electronic archive created to preserve and disseminate the scientific results of our university. The works of researchers, faculty members, and students are available to everyone for academic and research purposes.

The repository contains dissertations, research articles, educational and methodological materials, monographs, and regulatory documents. The collections cover a wide range of fields: from aerospace technologies, engine engineering, and computer science to history, linguistics, mathematics, and ecology. The archive brings together the scientific heritage of the university, including materials prepared during the period of Samara State Aerospace University and Samara State University.

Looking for publications by author, title, date, or subject? Full-text search will provide relevant results. Want to explore the academic life more closely? Browse materials by the universityâs organizational units.

Descriptions of all publications and articles available in the repository can be found in the libraryâs electronic catalog. Staff and students can log in via the menu "Login -> My Resource Archive" using their personal account credentials (SSAU_id).

Use the archive for study, research, and professional development!

Title:	Метод ансамблирования алгоритмов обучения с подкреплением на основе иерархичности
Authors:	Козлов Д. А.
Keywords:	randomized ensembled double q-learning soft actorcritic deep q-learning машинное обучение мета-алгоритм обучение с подкреплением
Issue Date:	2023
Citation:	Козлов, Д. А. Метод ансамблирования алгоритмов обучения с подкреплением на основе иерархичности / Д. А. Козлов // Информационные технологии и нанотехнологии (ИТНТ-2023) : сб. тр. по материалам IX Междунар. конф. и молодеж. шк. (г. Самара, 17-23 апр. 2023 г.): в 6 т. / М-во науки и высш. образования Рос. Федерации, Самар. нац. исслед. ун-т им. С. П. Королева (Самар. ун-т), Ин-т систем обраб. изобр. РАН - Фил. Федер. науч.-исслед. центра "Кристаллография и фотоника" Рос. акад. наук. - Самара : Изд-во Самар. ун-та, 2023Т. 4: Искусственный интеллект / под. ред. А. В. Никонорова. - 2023. - С. 040602.
Abstract:	Предлагается алгоритм ансамблирования нескольких алгоритмов обучения с подкреплением. Предложенный подход действует в среднем эффективнее чем каждый из алгоритмов в ансамбле по отдельности. В статье рассматривается ансамбль из алгоритмов REDQ и SAC. Выходом из ансамбля является выход алгоритма, выбранного с помощью DQN. Возможно ансамблирование других алгоритмов и в другом количестве. Обучение с подкреплением является перспективной областью в машинном обучении. Важной нерешенной задачей обучения с подкреплением является обобщение сложных задач, и решение их при помощи мета-алгоритмов. Предлагаемый метод возможно использовать в сложных задачах, состоящих из многих подзадач, эффективные решения для которых могут предложить различные алгоритмы из ансамбля.
URI:	http://repo.ssau.ru/jspui/handle/123456789/12881
Appears in Collections:	Информационные технологии и нанотехнологии

Files in This Item:

File	Size	Format
978-5-7883-1920-9_2023-040602.pdf	297.12 kB	Adobe PDF	View/Open

Show full item record