Отрывок: В исследовании использовался марковский алгоритм принятия решений Q- learning [3]. Для этого мы вводим функцию Q, отражающую ценность каждого возможного действия агента а (в нашем случае – светофора) для текущего состояния моделирования s, в котором он находится Секция 4. Проектирование, производство, эксплуатация авиационной техники и организация транспортных процессов 236 𝑄(𝑠, 𝑎) (1) ...
Название : Адаптивное управление светофорным объектом с использованием машинного обучения с подкреплением
Авторы/Редакторы : Остапенко П. В.
Сапрыкин О. Н.
Дата публикации : 2019
Библиографическое описание : Остапенко, П. В. Адаптивное управление светофорным объектом с использованием машинного обучения с подкреплением / П. В. Остапенко, О. Н. Сапрыкин // XV Королевские чтения [Электронный ресурс] : междунар. молодеж. науч. конф., посвящ. 100-летию со дня рождения Д. И. Козлова : сб. тр. : 8-10 окт. 201 / М-во науки и высш. образования Рос. Федерации, Самар. нац. исслед. ун-т им. С. П. Королева (Самар. ун-т) ; [науч. ред. М. А. Шлеенков]. - 2019. - Т. 1. - С. 235-236
Другие идентификаторы : RU\НТБ СГАУ\431048
Ключевые слова: адаптивное управление светофорами
оптимизация работы светофора
методы машинного обучения
микросимуляторы движения
транспортная инфраструктура городов
управление дорожным движением
Располагается в коллекциях: Королевские чтения

Файлы этого ресурса:
Файл Размер Формат  
XV Королевские чтения 2019 Том 1-235-236.pdf747.98 kBAdobe PDFПросмотреть/Открыть



Все ресурсы в архиве электронных ресурсов защищены авторским правом, все права сохранены.