Отрывок: Цель Подготовить текстовые документы к проверке на подобие. Исполнители 1 Модуль-анализатор. 2 База данных. 46 Продолжение таблицы 12 Предусловия Пользователь ввел данные и нажал кнопку «Проверить». Постусловия Получен очищенный текст, прошедший токенизацию на предложения и слова. 1 Текст нормализован – замена «подобных» английских символов русскими. 2 Текст разбит на предложения и ...
Название : Проектирование и реализация автоматизированной системы анализа текстовой информации для определения заимствований
Авторы/Редакторы : Антошина О. В.
Гордеева О. А.
Заболотнова О. Ю.
Суханов С. В.
Министерство образования и науки Российской Федерации
Самарский национальный исследовательский университет им. С. П. Королева ( Самарский университет)
Институт информатики
математики и электроники
Факультет информатики
Кафедра технической кибернетики
Дата публикации : 2018
Библиографическое описание : Антошина, О. В. Проектирование и реализация автоматизированной системы анализа текстовой информации для определения заимствований : вып. квалификац. работа по специальности (уровень магистратуры) "Прикладная математика и информатика" / О. В. Антошина ; рук. работы О. А. Гордеева; рец. О. Ю. Заболотнова; нормоконтролер С. В. Суханов ; М-во образования и науки Рос. Федерации, Самар.нац. исслед. ун-т им. С. П. Королева (Самар. ун-т), И. - Самаpа, 2018. - on-line
Аннотация : Объектом исследования являются алгоритмы поиска текстовых заимствований.Цель работы – с применением методов текстового анализа обнаружить заимствования путем сравнения двух текстовых документов и определить степень самостоятельности автора.Спроектирована и реализована автоматизированная система поиска текстовых заимствований и определения уникальности проверяемого документа – выбран метод Surrounding Context N-Grams и предложена модификация алгоритма определения уникальности. На тестовых фрагментах текстов произведена оценка алгоритма, реализованного c применением существующих библиотек и методов. Исследованы и описаны основные режимы работы автоматизированной системы и произведена оценка качества полученного алгоритма.
Другие идентификаторы : RU\НТБ СГАУ\ВКР20180911151705
Ключевые слова: определение уникальности текста
обработка текстовых документов
методы поиска текстовых заимствований
REST- архитектура
Располагается в коллекциях: Выпускные квалификационные работы




Все ресурсы в архиве электронных ресурсов защищены авторским правом, все права сохранены.