Метод ансамблирования алгоритмов обучения с подкреплением на основе иерархичности

Козлов Д. А.

Samara University Repository

Welcome to the Samara University repository!

This is an open electronic archive created to preserve and disseminate the scientific results of our university. The works of researchers, faculty members, and students are available to everyone for academic and research purposes.

The repository contains dissertations, research articles, educational and methodological materials, monographs, and regulatory documents. The collections cover a wide range of fields: from aerospace technologies, engine engineering, and computer science to history, linguistics, mathematics, and ecology. The archive brings together the scientific heritage of the university, including materials prepared during the period of Samara State Aerospace University and Samara State University.

Looking for publications by author, title, date, or subject? Full-text search will provide relevant results. Want to explore the academic life more closely? Browse materials by the universityâs organizational units.

Descriptions of all publications and articles available in the repository can be found in the libraryâs electronic catalog. Staff and students can log in via the menu "Login -> My Resource Archive" using their personal account credentials (SSAU_id).

Use the archive for study, research, and professional development!

Full metadata record

DC Field	Value	Language
dc.contributor.author	Козлов Д. А.
dc.coverage.spatial	randomized ensembled double q-learning
dc.coverage.spatial	soft actorcritic
dc.coverage.spatial	deep q-learning
dc.coverage.spatial	машинное обучение
dc.coverage.spatial	мета-алгоритм
dc.coverage.spatial	обучение с подкреплением
dc.creator	Козлов Д. А.
dc.date	2023
dc.date.accessioned	2025-08-22T12:19:54Z	-
dc.date.available	2025-08-22T12:19:54Z	-
dc.date.issued	2023
dc.identifier.identifier	RU\НТБ СГАУ\541234
dc.identifier.citation	Козлов, Д. А. Метод ансамблирования алгоритмов обучения с подкреплением на основе иерархичности / Д. А. Козлов // Информационные технологии и нанотехнологии (ИТНТ-2023) : сб. тр. по материалам IX Междунар. конф. и молодеж. шк. (г. Самара, 17-23 апр. 2023 г.): в 6 т. / М-во науки и высш. образования Рос. Федерации, Самар. нац. исслед. ун-т им. С. П. Королева (Самар. ун-т), Ин-т систем обраб. изобр. РАН - Фил. Федер. науч.-исслед. центра "Кристаллография и фотоника" Рос. акад. наук. - Самара : Изд-во Самар. ун-та, 2023Т. 4: Искусственный интеллект / под. ред. А. В. Никонорова. - 2023. - С. 040602.
dc.identifier.uri	http://repo.ssau.ru/jspui/handle/123456789/12881	-
dc.description.abstract	Предлагается алгоритм ансамблирования нескольких алгоритмов обучения с подкреплением. Предложенный подход действует в среднем эффективнее чем каждый из алгоритмов в ансамбле по отдельности. В статье рассматривается ансамбль из алгоритмов REDQ и SAC. Выходом из ансамбля является выход алгоритма, выбранного с помощью DQN. Возможно ансамблирование других алгоритмов и в другом количестве. Обучение с подкреплением является перспективной областью в машинном обучении. Важной нерешенной задачей обучения с подкреплением является обобщение сложных задач, и решение их при помощи мета-алгоритмов. Предлагаемый метод возможно использовать в сложных задачах, состоящих из многих подзадач, эффективные решения для которых могут предложить различные алгоритмы из ансамбля.
dc.language	rus
dc.relation.ispartof	Информационные технологии и нанотехнологии (ИТНТ-2023) : сб. тр. по материалам IX Междунар. конф. и молодеж. шк. (г. Самара, 17-23 апр. 2023 г.): в 6
dc.source	Информационные технологии и нанотехнологии (ИТНТ-2023). - Т. 4 : Искусственный интеллект
dc.subject	randomized ensembled double q-learning
dc.subject	soft actorcritic
dc.subject	deep q-learning
dc.subject	машинное обучение
dc.subject	мета-алгоритм
dc.subject	обучение с подкреплением
dc.title	Метод ансамблирования алгоритмов обучения с подкреплением на основе иерархичности
dc.type	Text
dc.citation.spage	040602
dc.citation.volume	4
local.contributor.author	Козлов Д. А.
local.identifier.olduri	http://repo.ssau.ru/handle/Informacionnye-tehnologii-i-nanotehnologii/Metod-ansamblirovaniya-algoritmov-obucheniya-s-podkrepleniem-na-osnove-ierarhichnosti-105727
local.identifier.olduri	http://repo.ssau.ru/handle/Informacionnye-tehnologii-i-nanotehnologii/Metod-ansamblirovaniya-algoritmov-obucheniya-s-podkrepleniem-na-osnove-ierarhichnosti-105727
Appears in Collections:	Информационные технологии и нанотехнологии

Files in This Item:

File	Size	Format
978-5-7883-1920-9_2023-040602.pdf	297.12 kB	Adobe PDF	View/Open

Show simple item record