Full metadata record
| DC Field | Value | Language |
|---|---|---|
| dc.contributor.author | Килбас И. А. | |
| dc.contributor.author | Парингер Р. А. | |
| dc.contributor.author | Грибанов Д. Н. | |
| dc.contributor.author | Куприянов А. В. | |
| dc.contributor.author | Мухин А. В. | |
| dc.coverage.spatial | большие языковые модели | |
| dc.coverage.spatial | искусственные нейронные сети | |
| dc.coverage.spatial | метод расширения контекста | |
| dc.coverage.spatial | линейная интерполяция | |
| dc.coverage.spatial | обработка языка | |
| dc.coverage.spatial | позиционные эмбеддинги | |
| dc.creator | Килбас И. А., Парингер Р. А., Грибанов Д. Н., Куприянов А. В., Мухин А. В. | |
| dc.date | 2024 | |
| dc.date.accessioned | 2025-08-22T12:19:42Z | - |
| dc.date.available | 2025-08-22T12:19:42Z | - |
| dc.date.issued | 2024 | |
| dc.identifier.identifier | RU\НТБ СГАУ\563359 | |
| dc.identifier.citation | Расширение контекста больших языковых моделей с использованием линейной интерполяции позиционных эмбеддингов / И. А. Килбас, Р. А. Парингер, Д. Н. Грибанов, А. В. Куприянов, А. В. Мухин // Информационные технологии и нанотехнологии (ИТНТ-2024) : сб. тр. по материалам X Междунар. конф. и молодеж. шк. (г. Самара, 20-24 мая 2024 г.): в 6 т. / М-во науки и высш. образования Рос. Федерации, Самар. нац. исслед. ун-т им. С. П. Королева (Самар. ун-т). - Самара : Изд-во Самар. ун-та, 2024. - Т. 3: Искусственный интеллект : под ред. А. В. Никонорова, 2024. - С. 030342. | |
| dc.identifier.uri | http://repo.ssau.ru/jspui/handle/123456789/12409 | - |
| dc.description.abstract | Исследуется проблема ограниченного контекста в больших языковых моделях (БЯМ) и предлагается новый метод для увеличения размера контекста без необходимости переобучения модели. Предложенный метод основан на линейной интерполяции позиционных эмбеддингов, позволяя значительно увеличить размер контекста БЯМ. Это в свою очередь имеет большое прикладное значение для обработки длинных документов и разработки приложений, требующих продолжительного взаимодействия с БЯМ. В ходе исследования была использована модель ruGPT-3.5 с 13 миллиардами параметров, обученная с контекстом 2048 токенов. С помощью линейной интерполяции позиционных эмбеддингов удалось успешно расширить контекст модели до 8192 токенов. Это значительное увеличение контекста открывает новые возможности для обработки длинных текстовых данных и повышения производительности чат-ботов и других приложений, работающих с БЯМ. | |
| dc.language | rus | |
| dc.relation.ispartof | Информационные технологии и нанотехнологии (ИТНТ-2024) : сб. тр. по материалам X Междунар. конф. и молодеж. шк. (г. Самара, 20-24 мая 2024 г.): в 6 т. | |
| dc.source | Информационные технологии и нанотехнологии (ИТНТ-2024). - Т. 3 : Искусственный интеллект : под ред. А. В. Никонорова | |
| dc.subject | большие языковые модели | |
| dc.subject | искусственные нейронные сети | |
| dc.subject | метод расширения контекста | |
| dc.subject | линейная интерполяция | |
| dc.subject | обработка языка | |
| dc.subject | позиционные эмбеддинги | |
| dc.title | Расширение контекста больших языковых моделей с использованием линейной интерполяции позиционных эмбеддингов | |
| dc.type | Text | |
| dc.citation.spage | 030342 | |
| dc.citation.volume | 3 | |
| local.contributor.author | Килбас И. А. | |
| local.contributor.author | Парингер Р. А. | |
| local.contributor.author | Грибанов Д. Н. | |
| local.contributor.author | Куприянов А. В. | |
| local.contributor.author | Мухин А. В. | |
| local.identifier.olduri | http://repo.ssau.ru/handle/Informacionnye-tehnologii-i-nanotehnologii/Rasshirenie-konteksta-bolshih-yazykovyh-modelei-s-ispolzovaniem-lineinoi-interpolyacii-pozicionnyh-embeddingov-112604 | |
| local.identifier.olduri | http://repo.ssau.ru/handle/Informacionnye-tehnologii-i-nanotehnologii/Rasshirenie-konteksta-bolshih-yazykovyh-modelei-s-ispolzovaniem-lineinoi-interpolyacii-pozicionnyh-embeddingov-112604 | |
| Appears in Collections: | Информационные технологии и нанотехнологии | |
Files in This Item:
| File | Size | Format | |
|---|---|---|---|
| 978-5-7883-2080-9_2024-030342.pdf | 312.76 kB | Adobe PDF | View/Open |
Items in Repository are protected by copyright, with all rights reserved, unless otherwise indicated.