Title: Применение методов машинного обучения для идентификации личности автора электронного сообщения
Authors: Кривов Д. А.
Бондаренко В. В.
Осипов М. Н.
Keywords: математические методы в лингвистике
идентификация личности по тексту
гендерная лингвистика
гендер
Word2vec
TF-IDF
электронные сообщения
темперамент личности
пол
мешок слов
метод опорных векторов
машинное обучение
Issue Date: 2025
Citation: Кривов, Д. А. Применение методов машинного обучения для идентификации личности автора электронного сообщения : вып. квалификац. работа по спец. 10.05.01 "Компьютерная безопасность" (уровень специалитета) / Д. А. Кривов ; рук. работы В. В. Бондаренко ; нормоконтролер М. Н. Осипов ; М-во науки и высш. образования Рос. Федерации, Самар. нац. исслед. ун-т им. С. П. Королева (Самар. ун-т), Ин-т естеств. и ма. - Самара, 2025. - 1 файл (829 Кб). - Текст : электронный
Abstract: Рассмотрены методы классификации текста. Проанализированы основные методы векторизации, к которым можно отнести методы «Мешок слов», «TF-IDF» и «Word2vec». Проанализированы основные этапы реализации предобработки текста, необходимые для того, чтобы текст стал пригодным для работы разработанной программы с сообщениями из мессенджера Telegram. Разработана программа профилирования автора электронного сообщения. Проведен анализ полученных результатов после обучения программы двумя методами. На основе этого выявлена зависимость количества слов в памяти программы от точности ее работы. В результате работы создан чат-бот в мессенджере Telegram, в котором реализованы функции программы профилирования автора электронного сообщения. Точность работы программы составила 81%, 71% и 69% при определении пола, возраста и темперамента автора текста соответственно. Эффективность работы заключается в разработке программы для идентификации личности автора текста при помощи методов машинного обучения и определения минимального кол
URI: http://repo.ssau.ru/jspui/handle/123456789/44830
Appears in Collections:Выпускные квалификационные работы



Items in Repository are protected by copyright, with all rights reserved, unless otherwise indicated.