| Title: | Анализ применимости англоязычных языковых моделей наград для ранжирования ответов на русском языке |
| Authors: | Мигалин И. В. Килбас И. А. Парингер Р. А. |
| Keywords: | ранжирование ответов мультиязычные представления модели наград большие языковые модели RLHF |
| Issue Date: | 2025 |
| Citation: | Мигалин, И. В. Анализ применимости англоязычных языковых моделей наград для ранжирования ответов на русском языке / И. В. Мигалин, И. А. Килбас, Р. А. Парингер // Volga Cyber Week : сб. тр. I Всерос. науч.-техн. конф. по информатике и кибернетике (Самара, 24-26 марта 2025 г.) / М-во науки и высш. образования Рос. Федерации, Самар. нац. исслед. ун-т им. С. П. Королева (Самар. ун-т). - Самара : Изд-во Самар. ун-та, 2025. - С. 43-44. |
| Abstract: | Данное исследование посвящено анализу способности англоязычных моделей наград корректно ранжировать ответы на русском языке. Оценка ответов проводится при помощи модели GRM-Llama3.2-3B-rewardmodel-ft. Перевод англоязычных данных производится при помощи модели GPT-4o. Проводится анализ полученных данных: вычисляется коэффициент корреляции Спирмена между ответами на обоих языках, анализируются случаи, понижающие корреляцию. |
| URI: | http://repo.ssau.ru/jspui/handle/123456789/38638 |
| Appears in Collections: | VOLGA CYBER WEEK |
Files in This Item:
| File | Size | Format | |
|---|---|---|---|
| 978-5-7883-2192-9_2025-43-44.pdf | 532.28 kB | Adobe PDF | View/Open |
Items in Repository are protected by copyright, with all rights reserved, unless otherwise indicated.