Title: Исследование эффективности методов оценки схожести смыслового содержания научных статей
Authors: Чеховских И. В.
Симонова Е. В.
Соловьева Я. В.
Keywords: научные статьи
обработка естественного языка (ОЕЯ)
частотный анализ
схожесть смыслового содержания
DOC2VEC
Natural Language Processing (NLP)
Word2vec
WORD MOVER’S DISTANCE
автоматизированные системы
векторное представление текста
Issue Date: 2020
Citation: Чеховских, И. В. Исследование эффективности методов оценки схожести смыслового содержания научных статей : вып. квалификац. работа по направлению подгот. 09.04.01 "Информатика и вычислительная техника" (уровень магистратуры) / И. В. Чеховских ; рук. работы Е. В. Симонова ; нормоконтролер Я. В. Соловьева ; М-во науки и высш. образования Рос. Федерации, Самар. нац. исслед. ун-т им. С. П. Королева (Самар. ун-т), Ин-т информати. - Самара, 2020. - on-line
Abstract: В данной выпускной квалификационной работе магистра проводитсяанализ эффективности методов оценки схожести смыслового содержаниянаучных статей. В качестве объектов анализа выбраны четыре алгоритма:Doc2Vec, взвешенная сумма векторов слов, полученных с помощью FastText,Word Mover’s Distance, Skip-Thought Vectors.Целью работы является автоматизация процесса поиска научных статей сосхожим смысловым содержанием, обогащение представления текста методамимашинного обучения.Научная новизна работы заключается в исследовании зависимости оценкиэффективности методов поиска схожести исследований в научных статьях отразличных параметров алгоритмов поиска.Создана информационно-логическая модель автоматизированной системыв нотации UML с помощью бесплатного сервиса draw.io (13.0.1).Система реализована на языке Python с помощью инструмента дляинтерактивной разработки и представления проектов в области наук о данныхJupyter Notebook.Для реализованных алгоритмов был проведен сравнительный анализкачества результата
URI: http://repo.ssau.ru/jspui/handle/123456789/50960
Appears in Collections:Выпускные квалификационные работы



Items in Repository are protected by copyright, with all rights reserved, unless otherwise indicated.