Отрывок: На этом этапе вводится массив весов предложений исходного текста (weightOfSentences). Для подсчет веса каждого предложения необходимо просуммировать веса всех стемм (tempWeight), встречающихся в нем. Вес отдельно взятой стеммы приравнивается к количеству её вхождений во всем тексте. Метод getTotalHits производит подсчет вхождений заданной словоформы во временном файле индексов. После, подсчета весов каждого...
Название : Автоматизированная система аннотирования текстов на русском языке
Авторы/Редакторы : Каназин И. А.
Сопченко Е. В.
Министерство образования и науки Российской Федерации
Самарский национальный исследовательский университет им. С. П. Королева (Самарский университет)
Институт информатики
математики и электроники
Дата публикации : 2018
Библиографическое описание : Каназин, И. А. Автоматизированная система аннотирования текстов на русском языке : вып. квалификац. работа по спец. "Информатика и вычислительная техника" / И. А. Каназин ; рук. работы Е. В. Сопченко ; М-во образования и науки Рос. Федерации, Самар. нац. исслед. ун-т им. С. П. Королева (Самар. ун-т), Ин-т информатики, математики и электроники, Фак-т инфор. - Самара, 2018. - on-line
Аннотация : Целью выпускной квалификационной работы является разработкаавтоматизированной системы аннотирования текстов на русском языке. Взадачи входит изучение методов аннотирования текста, изучение методоввыделения слов, обзор систем-аналогов и разработка информационно-логического проекта системы.Разрабатываемая система должна обладать достаточным функционаломдля построения общих справочных аннотаций монографического характера свозможностью редактирования объемов свертывания.Система реализована на языке Java с использованием библиотекиполнотекстового поиска Lucene.
Другие идентификаторы : RU\НТБ СГАУ\ВКР20180625142238
Ключевые слова: ключевые слова
аннотирование текстов
автоматизированные системы
метод Стемминга
лемматизация
статистический подход
Располагается в коллекциях: Выпускные квалификационные работы




Все ресурсы в архиве электронных ресурсов защищены авторским правом, все права сохранены.