Full metadata record
| DC Field | Value | Language |
|---|---|---|
| dc.contributor.author | Козлов Д. А. | |
| dc.coverage.spatial | randomized ensembled double q-learning | |
| dc.coverage.spatial | soft actorcritic | |
| dc.coverage.spatial | deep q-learning | |
| dc.coverage.spatial | машинное обучение | |
| dc.coverage.spatial | мета-алгоритм | |
| dc.coverage.spatial | обучение с подкреплением | |
| dc.creator | Козлов Д. А. | |
| dc.date | 2023 | |
| dc.date.accessioned | 2025-08-22T12:19:54Z | - |
| dc.date.available | 2025-08-22T12:19:54Z | - |
| dc.date.issued | 2023 | |
| dc.identifier.identifier | RU\НТБ СГАУ\541234 | |
| dc.identifier.citation | Козлов, Д. А. Метод ансамблирования алгоритмов обучения с подкреплением на основе иерархичности / Д. А. Козлов // Информационные технологии и нанотехнологии (ИТНТ-2023) : сб. тр. по материалам IX Междунар. конф. и молодеж. шк. (г. Самара, 17-23 апр. 2023 г.): в 6 т. / М-во науки и высш. образования Рос. Федерации, Самар. нац. исслед. ун-т им. С. П. Королева (Самар. ун-т), Ин-т систем обраб. изобр. РАН - Фил. Федер. науч.-исслед. центра "Кристаллография и фотоника" Рос. акад. наук. - Самара : Изд-во Самар. ун-та, 2023Т. 4: Искусственный интеллект / под. ред. А. В. Никонорова. - 2023. - С. 040602. | |
| dc.identifier.uri | http://repo.ssau.ru/jspui/handle/123456789/12881 | - |
| dc.description.abstract | Предлагается алгоритм ансамблирования нескольких алгоритмов обучения с подкреплением. Предложенный подход действует в среднем эффективнее чем каждый из алгоритмов в ансамбле по отдельности. В статье рассматривается ансамбль из алгоритмов REDQ и SAC. Выходом из ансамбля является выход алгоритма, выбранного с помощью DQN. Возможно ансамблирование других алгоритмов и в другом количестве. Обучение с подкреплением является перспективной областью в машинном обучении. Важной нерешенной задачей обучения с подкреплением является обобщение сложных задач, и решение их при помощи мета-алгоритмов. Предлагаемый метод возможно использовать в сложных задачах, состоящих из многих подзадач, эффективные решения для которых могут предложить различные алгоритмы из ансамбля. | |
| dc.language | rus | |
| dc.relation.ispartof | Информационные технологии и нанотехнологии (ИТНТ-2023) : сб. тр. по материалам IX Междунар. конф. и молодеж. шк. (г. Самара, 17-23 апр. 2023 г.): в 6 | |
| dc.source | Информационные технологии и нанотехнологии (ИТНТ-2023). - Т. 4 : Искусственный интеллект | |
| dc.subject | randomized ensembled double q-learning | |
| dc.subject | soft actorcritic | |
| dc.subject | deep q-learning | |
| dc.subject | машинное обучение | |
| dc.subject | мета-алгоритм | |
| dc.subject | обучение с подкреплением | |
| dc.title | Метод ансамблирования алгоритмов обучения с подкреплением на основе иерархичности | |
| dc.type | Text | |
| dc.citation.spage | 040602 | |
| dc.citation.volume | 4 | |
| local.contributor.author | Козлов Д. А. | |
| local.identifier.olduri | http://repo.ssau.ru/handle/Informacionnye-tehnologii-i-nanotehnologii/Metod-ansamblirovaniya-algoritmov-obucheniya-s-podkrepleniem-na-osnove-ierarhichnosti-105727 | |
| local.identifier.olduri | http://repo.ssau.ru/handle/Informacionnye-tehnologii-i-nanotehnologii/Metod-ansamblirovaniya-algoritmov-obucheniya-s-podkrepleniem-na-osnove-ierarhichnosti-105727 | |
| Appears in Collections: | Информационные технологии и нанотехнологии | |
Files in This Item:
| File | Size | Format | |
|---|---|---|---|
| 978-5-7883-1920-9_2023-040602.pdf | 297.12 kB | Adobe PDF | View/Open |
Items in Repository are protected by copyright, with all rights reserved, unless otherwise indicated.