Title: Влияние состава наблюдений окружающей среды в задаче приобретения навыков передвижения в трехмерном пространстве при использовании алгоритмов обучения с подкреп
Authors: Козлов Д. А.
Мясников В. В.
Keywords: MDP
Unity ML-Agents
SAC
POMDP
виртуальная симуляция
робототехника
машинное обучение с подкреплением
наблюдения окружающей среды
Issue Date: 2022
Citation: Козлов, Д. А. Влияние состава наблюдений окружающей среды в задаче приобретения навыков передвижения в трехмерном пространстве при использовании алгоритмов обучения с подкреплением / Д. А. Козлов, В. В. Мясников // Информационные технологии и нанотехнологии (ИТНТ-2022) : сб. тр. по материалам VIII Междунар. конф. и молодеж. шк. (г. Самара, 23 - 27 мая) : в 5 т. / М-во науки и образования Рос. Федерации, Самар. нац. исслед. ун-т им. С. П. Королева (Самар. ун-т), Ин-т систем обраб. изобр. РАН - фил. ФНИЦ "Кристаллография и фотоника" РАН. - Самара : Изд-во Самар. ун-та, 2022Т. 4: Искусственный интеллект / под ред. А. В. Никонорова. - 2022. - С. 041502.
Abstract: В работе исследуется влияние состава наблюдений окружающей среды на процесс обучения «двуногого» мехатронного объекта навыкам передвижения в трёхмерном пространстве. Исследования проводятся всреде игрового движка Unity с использованием пакета ML-Agents. В качестве алгоритма обучения был выбран SoftActor Critic, как один из наиболее эффективных современных алгоритмов обучения с подкреплением (RL),показавший наибольшую эффективность на наборе аналогичных задач. Показано, что состав наблюденийможет радикально менять скорость обучения и даже замедлять процесс обучения при наличии «избыточных»данных.
URI: http://repo.ssau.ru/jspui/handle/123456789/12374
Appears in Collections:Информационные технологии и нанотехнологии



Items in Repository are protected by copyright, with all rights reserved, unless otherwise indicated.