Адаптивное управление светофорным объектом с использованием машинного обучения с подкреплением

Остапенко П. В.; Сапрыкин О. Н.

Отрывок: В исследовании использовался марковский алгоритм принятия решений Q- learning [3]. Для этого мы вводим функцию Q, отражающую ценность каждого возможного действия агента а (в нашем случае – светофора) для текущего состояния моделирования s, в котором он находится Секция 4. Проектирование, производство, эксплуатация авиационной техники и организация транспортных процессов 236 𝑄(𝑠, 𝑎) (1) ...

Полная запись метаданных

Поле DC	Значение	Язык
dc.contributor.author	Остапенко П. В.	ru
dc.contributor.author	Сапрыкин О. Н.	ru
dc.coverage.spatial	адаптивное управление светофорами	ru
dc.coverage.spatial	оптимизация работы светофора	ru
dc.coverage.spatial	методы машинного обучения	ru
dc.coverage.spatial	микросимуляторы движения	ru
dc.coverage.spatial	транспортная инфраструктура городов	ru
dc.coverage.spatial	управление дорожным движением	ru
dc.creator	Остапенко П. В., Сапрыкин О. Н.	ru
dc.date.issued	2019	ru
dc.identifier	RU\НТБ СГАУ\431048	ru
dc.identifier.citation	Остапенко, П. В. Адаптивное управление светофорным объектом с использованием машинного обучения с подкреплением / П. В. Остапенко, О. Н. Сапрыкин // XV Королевские чтения [Электронный ресурс] : междунар. молодеж. науч. конф., посвящ. 100-летию со дня рождения Д. И. Козлова : сб. тр. : 8-10 окт. 201 / М-во науки и высш. образования Рос. Федерации, Самар. нац. исслед. ун-т им. С. П. Королева (Самар. ун-т) ; [науч. ред. М. А. Шлеенков]. - 2019. - Т. 1. - С. 235-236	ru
dc.relation.ispartof	XV Королевские чтения [Электронный ресурс] : междунар. молодеж. науч. конф., посвящ. 100-летию со дня рождения Д. И. Козлова : сб. тр. : 8-10 окт. 201	ru
dc.source	XV Королевские чтения. - Т. 1	ru
dc.title	Адаптивное управление светофорным объектом с использованием машинного обучения с подкреплением	ru
dc.type	Text	ru
dc.citation.epage	236	ru
dc.citation.spage	235	ru
dc.citation.volume	1	ru
dc.textpart	В исследовании использовался марковский алгоритм принятия решений Q- learning [3]. Для этого мы вводим функцию Q, отражающую ценность каждого возможного действия агента а (в нашем случае – светофора) для текущего состояния моделирования s, в котором он находится Секция 4. Проектирование, производство, эксплуатация авиационной техники и организация транспортных процессов 236 𝑄(𝑠, 𝑎) (1) ...	-
Располагается в коллекциях:	Королевские чтения

Файлы этого ресурса:

Файл	Размер	Формат
XV Королевские чтения 2019 Том 1-235-236.pdf	747.98 kB	Adobe PDF	Просмотреть/Открыть

Показать базовое описание ресурса Просмотр статистики
Поделиться:

Все ресурсы в архиве электронных ресурсов защищены авторским правом, все права сохранены.

Репозиторий Самарского университета