Title: Анализ применимости англоязычных языковых моделей наград для ранжирования ответов на русском языке
Authors: Мигалин И. В.
Килбас И. А.
Парингер Р. А.
Keywords: ранжирование ответов
мультиязычные представления
модели наград
большие языковые модели
RLHF
Issue Date: 2025
Citation: Мигалин, И. В. Анализ применимости англоязычных языковых моделей наград для ранжирования ответов на русском языке / И. В. Мигалин, И. А. Килбас, Р. А. Парингер // Volga Cyber Week : сб. тр. I Всерос. науч.-техн. конф. по информатике и кибернетике (Самара, 24-26 марта 2025 г.) / М-во науки и высш. образования Рос. Федерации, Самар. нац. исслед. ун-т им. С. П. Королева (Самар. ун-т). - Самара : Изд-во Самар. ун-та, 2025. - С. 43-44.
Abstract: Данное исследование посвящено анализу способности англоязычных моделей наград корректно ранжировать ответы на русском языке. Оценка ответов проводится при помощи модели GRM-Llama3.2-3B-rewardmodel-ft. Перевод англоязычных данных производится при помощи модели GPT-4o. Проводится анализ полученных данных: вычисляется коэффициент корреляции Спирмена между ответами на обоих языках, анализируются случаи, понижающие корреляцию.
URI: http://repo.ssau.ru/jspui/handle/123456789/38638
Appears in Collections:VOLGA CYBER WEEK

Files in This Item:
File SizeFormat 
978-5-7883-2192-9_2025-43-44.pdf532.28 kBAdobe PDFView/Open


Items in Repository are protected by copyright, with all rights reserved, unless otherwise indicated.