| Title: | Сравнение алгоритмов обучения с подкреплением в задаче приобретения навыков передвижения в трехмерном пространстве |
| Authors: | Козлов Д. А. |
| Keywords: | алгоритмы обучения виртуальная симуляция POMDP PPO SAC Unity ML-Agents MA-POCA MDP робототехника среда симуляции обучение с подкреплением машинное обучение |
| Issue Date: | 2022 |
| Citation: | Козлов, Д. А. Сравнение алгоритмов обучения с подкреплением в задаче приобретения навыков передвижения в трехмерном пространстве / Д. А. Козлов // Информационные технологии и нанотехнологии (ИТНТ-2022) : сб. тр. по материалам VIII Междунар. конф. и молодеж. шк. (г. Самара, 23 - 27 мая) : в 5 т. / М-во науки и образования Рос. Федерации, Самар. нац. исслед. ун-т им. С. П. Королева (Самар. ун-т), Ин-т систем обраб. изобр. РАН - фил. ФНИЦ "Кристаллография и фотоника" РАН. - Самара : Изд-во Самар. ун-та, 2022Т. 4: Искусственный интеллект / под ред. А. В. Никонорова. - 2022. - С. 041482. |
| Abstract: | В работе выполняется сравнение современных методов обучения с подкреплением на примере решения задачи приобретения агентом навыков передвижения в трёхмерном пространстве. Сравнение производится в симуляторе Unity с использованием пакета ml-agents. В качестве сравниваемых алгоритмов выступают: SAC, PPO, MA-POCA. Они используются для обучения навыкам передвижения нескольких моделей агентов: 3DBall, Crawler, Walker и авторскойSimplestBipedal. Результаты экспериментов говорят о преимуществах алгоритма Soft Actor Critic, что делает егоболее перспективным для использования в реальных средах. |
| URI: | http://repo.ssau.ru/jspui/handle/123456789/12376 |
| Appears in Collections: | Информационные технологии и нанотехнологии |
Files in This Item:
| File | Size | Format | |
|---|---|---|---|
| ИТНТ-2022. Том 4. Искусственный интеллект/978-5-7883-1792-2_2022-041482.pdf | 919 kB | Adobe PDF | View/Open |
Items in Repository are protected by copyright, with all rights reserved, unless otherwise indicated.