Построение алгоритма аннотирования русскоязычных текстовых данных социальных сетей с использованием переносимого обучения

Баканов Д. С.; Куприянов А. В.

Отрывок: Чтобы учесть дисбаланс классов при оценке моделей для задачи многоклассовой классификации, была использована метрика F1-мера. Была исследована зависимость метрики точности модели от выбора N-грамм (см. Таблицу I). Таблица I. ЗАВИСИМОСТЬ F1-МЕРЫ ДЛЯ КАЖДОЙ МОДЕЛИ В ЗАВИСИМОСТИ ОТ ВЫБОРА N-ГРАММЫ Модель машинного обучения N-грамма Униграмма Биграмма Триграмма Наивный байесовский классификатор 0,67 0,59 0,48 Метод оп...

Полная запись метаданных

Поле DC	Значение	Язык
dc.contributor.author	Баканов Д. С.	ru
dc.contributor.author	Куприянов А. В.	ru
dc.coverage.spatial	BERT	ru
dc.coverage.spatial	TF-IDF	ru
dc.coverage.spatial	эмоциональный контент	ru
dc.coverage.spatial	обработка естественного языка	ru
dc.coverage.spatial	переносимое обучение	ru
dc.coverage.spatial	оценка эмоционального окраса	ru
dc.coverage.spatial	социальные сети	ru
dc.coverage.spatial	статистическое обучение	ru
dc.coverage.spatial	трансформер	ru
dc.creator	Баканов Д. С., Куприянов А. В.	ru
dc.date.accessioned	2023-10-06 09:21:40	-
dc.date.available	2023-10-06 09:21:40	-
dc.date.issued	2023	ru
dc.identifier	RU\НТБ СГАУ\541711	ru
dc.identifier.citation	Баканов, Д. С. Построение алгоритма аннотирования русскоязычных текстовых данных социальных сетей с использованием переносимого обучения / Д. С. Баканов, А. В. Куприянов // Информационные технологии и нанотехнологии (ИТНТ-2023) : сб. тр. по материалам IX Междунар. конф. и молодеж. шк. (г. Самара, 17-23 апр. 2023 г.): в 6 т. / М-во науки и высш. образования Рос. Федерации, Самар. нац. исслед. ун-т им. С. П. Королева (Самар. ун-т), Ин-т систем обраб. изобр. РАН - Фил. Федер. науч.-исслед. центра "Кристаллография и фотоника" Рос. акад. наук. - Самара : Изд-во Самар. ун-та, 2023Т. 5: Науки о данных / под ред. Е. В. Гошина. - 2023. - С. 050942.	ru
dc.identifier.uri	http://repo.ssau.ru/handle/Informacionnye-tehnologii-i-nanotehnologii/Postroenie-algoritma-annotirovaniya-russkoyazychnyh-tekstovyh-dannyh-socialnyh-setei-s-ispolzovaniem-perenosimogo-obucheniya-106021	-
dc.description.abstract	Рассматриваются способы построения алгоритма аннотирования русскоязычных текстов из социальных сетей. В качестве аннотирования будем понимать оценку эмоциональногоокраса текста. Статья затрагивает как классические базовые методы статистического обучения, так и современные методы глубокого обучения, основанные на переносимом обучении и трансформерах. В заключении строится модель, которая совмещает модель трансформера и статистическую модель машинного обучения градиентного бустинга. Актуальность данной работы заключается в создании легковесной и независимой от тематики модели, которую можно использовать для анализа текстового содержимого постовв социальных сетях.	ru
dc.language.iso	rus	ru
dc.relation.ispartof	Информационные технологии и нанотехнологии (ИТНТ-2023) : сб. тр. по материалам IX Междунар. конф. и молодеж. шк. (г. Самара, 17-23 апр. 2023 г.): в 6	ru
dc.source	Информационные технологии и нанотехнологии (ИТНТ-2023). - Т. 5 : Науки о данных	ru
dc.title	Построение алгоритма аннотирования русскоязычных текстовых данных социальных сетей с использованием переносимого обучения	ru
dc.type	Text	ru
dc.citation.spage	050942	ru
dc.citation.volume	5	ru
dc.textpart	Чтобы учесть дисбаланс классов при оценке моделей для задачи многоклассовой классификации, была использована метрика F1-мера. Была исследована зависимость метрики точности модели от выбора N-грамм (см. Таблицу I). Таблица I. ЗАВИСИМОСТЬ F1-МЕРЫ ДЛЯ КАЖДОЙ МОДЕЛИ В ЗАВИСИМОСТИ ОТ ВЫБОРА N-ГРАММЫ Модель машинного обучения N-грамма Униграмма Биграмма Триграмма Наивный байесовский классификатор 0,67 0,59 0,48 Метод оп...	-
Располагается в коллекциях:	Информационные технологии и нанотехнологии

Файлы этого ресурса:

Файл	Размер	Формат
978-5-7883-1921-6_2023-050942.pdf	293.4 kB	Adobe PDF	Просмотреть/Открыть

Показать базовое описание ресурса Просмотр статистики
Поделиться:

Все ресурсы в архиве электронных ресурсов защищены авторским правом, все права сохранены.

Репозиторий Самарского университета