Отрывок: Таким образом, исследование проводилось на материале трех коллекций текстов. Полученные результаты сравнены с результатами модели BART, дообученной только на списках ключевых слов, а также ряда моделей для извлечения ключевых слов: 1) TFIDF; 2) TopicRank [10]; 3) KeyBERT [11]; 4) KeyBART [3]. Для реализации моделей использовались библиотеки PKE [12] и Transformers [13]. Качество моделей было оценено с помощью F-меры, рассчитанной на основе к...
Название : Многозадачное дообучение для генерации ключевых слов к научным текстам
Авторы/Редакторы : Глазкова А. В.
Морозов Д. А.
Дата публикации : 2023
Библиографическое описание : Глазкова, А. В. Многозадачное дообучение для генерации ключевых слов к научным текстам / А. В. Глазкова, Д. А. Морозов // Информационные технологии и нанотехнологии (ИТНТ-2023) : сб. тр. по материалам IX Междунар. конф. и молодеж. шк. (г. Самара, 17-23 апр. 2023 г.): в 6 т. / М-во науки и высш. образования Рос. Федерации, Самар. нац. исслед. ун-т им. С. П. Королева (Самар. ун-т), Ин-т систем обраб. изобр. РАН - Фил. Федер. науч.-исслед. центра "Кристаллография и фотоника" Рос. акад. наук. - Самара : Изд-во Самар. ун-та, 2023Т. 4: Искусственный интеллект / под. ред. А. В. Никонорова. - 2023. - С. 040872.
Аннотация : В работе исследуется эффективность использования заголовков научных текстов в качестве дополнительной информации при обучении модели генерации списка ключевых слов. Описывается подход к многозадачному дообучению (multi-task fine-tuning) модели BART с помощью управляющих кодов. Показано, что данный подход позволяет улучшить качество BART, обученной для решения только одной задачи. Кроме того, в ряде случаев представленная многозадачная модель превосходит другие современные модели извлечения ключевых слов.
URI (Унифицированный идентификатор ресурса) : http://repo.ssau.ru/handle/Informacionnye-tehnologii-i-nanotehnologii/Mnogozadachnoe-doobuchenie-dlya-generacii-kluchevyh-slov-k-nauchnym-tekstam-105729
Другие идентификаторы : RU\НТБ СГАУ\541245
Ключевые слова: BART
генерация текста
автоматическое реферирование текстов
многозадачное обучение
ключевые слова
обработка естественного языка
научный текст
Располагается в коллекциях: Информационные технологии и нанотехнологии

Файлы этого ресурса:
Файл Размер Формат  
978-5-7883-1920-9_2023-040872.pdf232.41 kBAdobe PDFПросмотреть/Открыть



Все ресурсы в архиве электронных ресурсов защищены авторским правом, все права сохранены.