Full metadata record
DC FieldValueLanguage
dc.contributor.authorКилбас И. А.
dc.contributor.authorПарингер Р. А.
dc.contributor.authorГрибанов Д. Н.
dc.contributor.authorКуприянов А. В.
dc.contributor.authorМухин А. В.
dc.coverage.spatialбольшие языковые модели
dc.coverage.spatialискусственные нейронные сети
dc.coverage.spatialметод расширения контекста
dc.coverage.spatialлинейная интерполяция
dc.coverage.spatialобработка языка
dc.coverage.spatialпозиционные эмбеддинги
dc.creatorКилбас И. А., Парингер Р. А., Грибанов Д. Н., Куприянов А. В., Мухин А. В.
dc.date2024
dc.date.accessioned2025-08-22T12:19:42Z-
dc.date.available2025-08-22T12:19:42Z-
dc.date.issued2024
dc.identifier.identifierRU\НТБ СГАУ\563359
dc.identifier.citationРасширение контекста больших языковых моделей с использованием линейной интерполяции позиционных эмбеддингов / И. А. Килбас, Р. А. Парингер, Д. Н. Грибанов, А. В. Куприянов, А. В. Мухин // Информационные технологии и нанотехнологии (ИТНТ-2024) : сб. тр. по материалам X Междунар. конф. и молодеж. шк. (г. Самара, 20-24 мая 2024 г.): в 6 т. / М-во науки и высш. образования Рос. Федерации, Самар. нац. исслед. ун-т им. С. П. Королева (Самар. ун-т). - Самара : Изд-во Самар. ун-та, 2024. - Т. 3: Искусственный интеллект : под ред. А. В. Никонорова, 2024. - С. 030342.
dc.identifier.urihttp://repo.ssau.ru/jspui/handle/123456789/12409-
dc.description.abstractИсследуется проблема ограниченного контекста в больших языковых моделях (БЯМ) и предлагается новый метод для увеличения размера контекста без необходимости переобучения модели. Предложенный метод основан на линейной интерполяции позиционных эмбеддингов, позволяя значительно увеличить размер контекста БЯМ. Это в свою очередь имеет большое прикладное значение для обработки длинных документов и разработки приложений, требующих продолжительного взаимодействия с БЯМ. В ходе исследования была использована модель ruGPT-3.5 с 13 миллиардами параметров, обученная с контекстом 2048 токенов. С помощью линейной интерполяции позиционных эмбеддингов удалось успешно расширить контекст модели до 8192 токенов. Это значительное увеличение контекста открывает новые возможности для обработки длинных текстовых данных и повышения производительности чат-ботов и других приложений, работающих с БЯМ.
dc.languagerus
dc.relation.ispartofИнформационные технологии и нанотехнологии (ИТНТ-2024) : сб. тр. по материалам X Междунар. конф. и молодеж. шк. (г. Самара, 20-24 мая 2024 г.): в 6 т.
dc.sourceИнформационные технологии и нанотехнологии (ИТНТ-2024). - Т. 3 : Искусственный интеллект : под ред. А. В. Никонорова
dc.subjectбольшие языковые модели
dc.subjectискусственные нейронные сети
dc.subjectметод расширения контекста
dc.subjectлинейная интерполяция
dc.subjectобработка языка
dc.subjectпозиционные эмбеддинги
dc.titleРасширение контекста больших языковых моделей с использованием линейной интерполяции позиционных эмбеддингов
dc.typeText
dc.citation.spage030342
dc.citation.volume3
local.contributor.authorКилбас И. А.
local.contributor.authorПарингер Р. А.
local.contributor.authorГрибанов Д. Н.
local.contributor.authorКуприянов А. В.
local.contributor.authorМухин А. В.
local.identifier.oldurihttp://repo.ssau.ru/handle/Informacionnye-tehnologii-i-nanotehnologii/Rasshirenie-konteksta-bolshih-yazykovyh-modelei-s-ispolzovaniem-lineinoi-interpolyacii-pozicionnyh-embeddingov-112604
local.identifier.oldurihttp://repo.ssau.ru/handle/Informacionnye-tehnologii-i-nanotehnologii/Rasshirenie-konteksta-bolshih-yazykovyh-modelei-s-ispolzovaniem-lineinoi-interpolyacii-pozicionnyh-embeddingov-112604
Appears in Collections:Информационные технологии и нанотехнологии

Files in This Item:
File SizeFormat 
978-5-7883-2080-9_2024-030342.pdf312.76 kBAdobe PDFView/Open


Items in Repository are protected by copyright, with all rights reserved, unless otherwise indicated.