Отрывок: 37 3 ɂɋɋɅȿȾɈȼȺɌȿɅɖɋɄȺə ɑȺɋɌɖ 3.1 ɋɩɟɰɢɮɢɤɚɰɢɹ ɫɪɟɞɵ ɢɫɩɵɬɚɧɢɣ ȼ ɤɚɱɟɫɬɜɟ ɫɪɟɞɵ ɢɫɩɵɬɚɧɢɹ ɚɥɝɨɪɢɬɦɨɜ ɛɵɥ ɜɵɛɪɚɧ ɫɢɦɭɥɹɬɨɪ ɢɝɪ Atari 2600 (ɩɪɨɝɪɚɦɦɧɵɣ ɞɨɫɬɭɩ ɤ ɧɟɦɭ ɨɫɭɳɟɫɬɜɥɹɥɫɹ ɩɨɫɪɟɞɫɬɜɨɦ ɛɢɛɥɢɨɬɟɤɢ OpenAI Gym). Atari 2600 – ɷɬɨ ɞɨɦɚɲɧɹɹ ɜɢɞɟɨɢɝɪɨɜɚɹ ɩɪɢɫɬɚɜɤɚ, ɜɵɩɭɳɟɧɧɚɹ ɜ 1977 ɝ ɢ ɛɵɫɬɪɨ ɡɚɜɨɟɜɚɜɲɚɹ ɩɨɩɭɥɹɪɧɨɫɬɶ. ɋɢɦɭɥɹɬɨɪ ɜɤɥɸɱɚɟɬ 55 ɢɝɪ. ...
Название : Исследование подходов к мета-обучению с подкреплением на примере игр Atari 2600
Авторы/Редакторы : Никитин И. В.
Лезин И. А.
Министерство образования и науки Российской Федерации
Самарский национальный исследовательский университет им. С. П. Королева (Самарский университет)
Дата публикации : 2017
Библиографическое описание : Никитин, И. В. Исследование подходов к мета-обучению с подкреплением на примере игр Atari 2600 : вып. квалификац. работа по спец. "Информатика и вычислительная техника" / И. В. Никитин ; рук. работы И. А. Лезин ; М-во образования и науки Рос. Федерации, Самар. нац. исслед. ун-т им. С. П. Королева (Самар. ун-т), Фак-т информатики, Каф. информ. систем и технологий. - Самара, 2017. - on-line
Другие идентификаторы : RU\НТБ СГАУ\ВКР20170703160524
Ключевые слова: асинхронный актор-критик
марковский процесс принятия решений
обучение с подкреплением
Располагается в коллекциях: Выпускные квалификационные работы

Файлы этого ресурса:
Файл Размер Формат  
Никитин_Иван_Викторович_Исследование_подходов_мета.pdf1.09 MBAdobe PDFПросмотреть/Открыть  



Все ресурсы в архиве электронных ресурсов защищены авторским правом, все права сохранены.