Отрывок: В исследовании использовался марковский алгоритм принятия решений Q- learning [3]. Для этого мы вводим функцию Q, отражающую ценность каждого возможного действия агента а (в нашем случае – светофора) для текущего состояния моделирования s, в котором он находится Секция 4. Проектирование, производство, эксплуатация авиационной техники и организация транспортных процессов 236 𝑄(𝑠, 𝑎) (1) ...
Полная запись метаданных
Поле DC | Значение | Язык |
---|---|---|
dc.contributor.author | Остапенко П. В. | ru |
dc.contributor.author | Сапрыкин О. Н. | ru |
dc.coverage.spatial | адаптивное управление светофорами | ru |
dc.coverage.spatial | оптимизация работы светофора | ru |
dc.coverage.spatial | методы машинного обучения | ru |
dc.coverage.spatial | микросимуляторы движения | ru |
dc.coverage.spatial | транспортная инфраструктура городов | ru |
dc.coverage.spatial | управление дорожным движением | ru |
dc.creator | Остапенко П. В., Сапрыкин О. Н. | ru |
dc.date.issued | 2019 | ru |
dc.identifier | RU\НТБ СГАУ\431048 | ru |
dc.identifier.citation | Остапенко, П. В. Адаптивное управление светофорным объектом с использованием машинного обучения с подкреплением / П. В. Остапенко, О. Н. Сапрыкин // XV Королевские чтения [Электронный ресурс] : междунар. молодеж. науч. конф., посвящ. 100-летию со дня рождения Д. И. Козлова : сб. тр. : 8-10 окт. 201 / М-во науки и высш. образования Рос. Федерации, Самар. нац. исслед. ун-т им. С. П. Королева (Самар. ун-т) ; [науч. ред. М. А. Шлеенков]. - 2019. - Т. 1. - С. 235-236 | ru |
dc.relation.ispartof | XV Королевские чтения [Электронный ресурс] : междунар. молодеж. науч. конф., посвящ. 100-летию со дня рождения Д. И. Козлова : сб. тр. : 8-10 окт. 201 | ru |
dc.source | XV Королевские чтения. - Т. 1 | ru |
dc.title | Адаптивное управление светофорным объектом с использованием машинного обучения с подкреплением | ru |
dc.type | Text | ru |
dc.citation.epage | 236 | ru |
dc.citation.spage | 235 | ru |
dc.citation.volume | 1 | ru |
dc.textpart | В исследовании использовался марковский алгоритм принятия решений Q- learning [3]. Для этого мы вводим функцию Q, отражающую ценность каждого возможного действия агента а (в нашем случае – светофора) для текущего состояния моделирования s, в котором он находится Секция 4. Проектирование, производство, эксплуатация авиационной техники и организация транспортных процессов 236 𝑄(𝑠, 𝑎) (1) ... | - |
Располагается в коллекциях: | Королевские чтения |
Файлы этого ресурса:
Файл | Размер | Формат | |
---|---|---|---|
XV Королевские чтения 2019 Том 1-235-236.pdf | 747.98 kB | Adobe PDF | Просмотреть/Открыть |
Показать базовое описание ресурса
Просмотр статистики
Поделиться:
Все ресурсы в архиве электронных ресурсов защищены авторским правом, все права сохранены.