Сравнение алгоритмов обучения с подкреплением в задаче приобретения навыков передвижения в трехмерном пространстве

Козлов Д. А.

Samara University Repository

Welcome to the Samara University repository!

This is an open electronic archive created to preserve and disseminate the scientific results of our university. The works of researchers, faculty members, and students are available to everyone for academic and research purposes.

The repository contains dissertations, research articles, educational and methodological materials, monographs, and regulatory documents. The collections cover a wide range of fields: from aerospace technologies, engine engineering, and computer science to history, linguistics, mathematics, and ecology. The archive brings together the scientific heritage of the university, including materials prepared during the period of Samara State Aerospace University and Samara State University.

Looking for publications by author, title, date, or subject? Full-text search will provide relevant results. Want to explore the academic life more closely? Browse materials by the universityâs organizational units.

Descriptions of all publications and articles available in the repository can be found in the libraryâs electronic catalog. Staff and students can log in via the menu "Login -> My Resource Archive" using their personal account credentials (SSAU_id).

Use the archive for study, research, and professional development!

Title:	Сравнение алгоритмов обучения с подкреплением в задаче приобретения навыков передвижения в трехмерном пространстве
Authors:	Козлов Д. А.
Keywords:	алгоритмы обучения виртуальная симуляция POMDP PPO SAC Unity ML-Agents MA-POCA MDP робототехника среда симуляции обучение с подкреплением машинное обучение
Issue Date:	2022
Citation:	Козлов, Д. А. Сравнение алгоритмов обучения с подкреплением в задаче приобретения навыков передвижения в трехмерном пространстве / Д. А. Козлов // Информационные технологии и нанотехнологии (ИТНТ-2022) : сб. тр. по материалам VIII Междунар. конф. и молодеж. шк. (г. Самара, 23 - 27 мая) : в 5 т. / М-во науки и образования Рос. Федерации, Самар. нац. исслед. ун-т им. С. П. Королева (Самар. ун-т), Ин-т систем обраб. изобр. РАН - фил. ФНИЦ "Кристаллография и фотоника" РАН. - Самара : Изд-во Самар. ун-та, 2022Т. 4: Искусственный интеллект / под ред. А. В. Никонорова. - 2022. - С. 041482.
Abstract:	В работе выполняется сравнение современных методов обучения с подкреплением на примере решения задачи приобретения агентом навыков передвижения в трёхмерном пространстве. Сравнение производится в симуляторе Unity с использованием пакета ml-agents. В качестве сравниваемых алгоритмов выступают: SAC, PPO, MA-POCA. Они используются для обучения навыкам передвижения нескольких моделей агентов: 3DBall, Crawler, Walker и авторскойSimplestBipedal. Результаты экспериментов говорят о преимуществах алгоритма Soft Actor Critic, что делает егоболее перспективным для использования в реальных средах.
URI:	http://repo.ssau.ru/jspui/handle/123456789/12376
Appears in Collections:	Информационные технологии и нанотехнологии

Files in This Item:

File	Size	Format
ИТНТ-2022. Том 4. Искусственный интеллект/978-5-7883-1792-2_2022-041482.pdf	919 kB	Adobe PDF	View/Open

Show full item record