Отрывок: 2. СЛИЯНИЕ ВЕКТОРНЫХ ПРЕДСТАВЛЕНИЙ Предложенный подход использования нескольких наборов вторичных представлений близок известному подходу triplet-loss. Также формируются группы объектов и на них вычисляется функция потерь. Функционал качества — это среднее всех потерь по всем сформированным группам объектов. Обучается преобразование объединённых первичных представлений во вторичные. Функция потерь опирается на порядок близостей в парах объектов...
Название : | Улучшение качества векторных представлений слов за счёт использования нескольких источников представлений |
Авторы/Редакторы : | Колосов А. М. Майсурадзе А. И. |
Дата публикации : | 2023 |
Библиографическое описание : | Колосов, А. М. Улучшение качества векторных представлений слов за счёт использования нескольких источников представлений / А. М. Колосов, А. И. Майсурадзе // Информационные технологии и нанотехнологии (ИТНТ-2023) : сб. тр. по материалам IX Междунар. конф. и молодеж. шк. (г. Самара, 17-23 апр. 2023 г.): в 6 т. / М-во науки и высш. образования Рос. Федерации, Самар. нац. исслед. ун-т им. С. П. Королева (Самар. ун-т), Ин-т систем обраб. изобр. РАН - Фил. Федер. науч.-исслед. центра "Кристаллография и фотоника" Рос. акад. наук. - Самара : Изд-во Самар. ун-та, 2023Т. 4: Искусственный интеллект / под. ред. А. В. Никонорова. - 2023. - С. 042492. |
Аннотация : | Векторные представления слов активно используются в задачах машинного перевода, рекомендательных системах и информационном поиске. В данном исследовании проверяется гипотеза о том, что в четвёрках слов, для которых несколькими независимыми методами были получены одинаковые порядки на расстояниях между словами, монотонных четвёрках, содержится информация об истинном порядке для четвёрок с разным порядком, антимонотонных четвёрок. Проверяется, что в случае определения истинного порядка и построения векторных представлений на основе исходных и восстановленных монотонных четвёрок, качество векторных представлений слов повышается. Предложены метод отбора четвёрок слов, модель построения скорректированных векторных представлений слов и способ сравнения качества исходных и полученных в ходе коррекции векторных представлений слов. |
URI (Унифицированный идентификатор ресурса) : | http://repo.ssau.ru/handle/Informacionnye-tehnologii-i-nanotehnologii/Uluchshenie-kachestva-vektornyh-predstavlenii-slov-za-schet-ispolzovaniya-neskolkih-istochnikov-predstavlenii-105744 |
Другие идентификаторы : | RU\НТБ СГАУ\541529 |
Ключевые слова: | векторные представления слов слияние данных семантическая близость |
Располагается в коллекциях: | Информационные технологии и нанотехнологии |
Файлы этого ресурса:
Файл | Размер | Формат | |
---|---|---|---|
978-5-7883-1920-9_2023-042492.pdf | 187.08 kB | Adobe PDF | Просмотреть/Открыть |
Показать полное описание ресурса
Просмотр статистики
Поделиться:
Все ресурсы в архиве электронных ресурсов защищены авторским правом, все права сохранены.