Отрывок: Цель Подготовить текстовые документы к проверке на подобие. Исполнители 1 Модуль-анализатор. 2 База данных. 46 Продолжение таблицы 12 Предусловия Пользователь ввел данные и нажал кнопку «Проверить». Постусловия Получен очищенный текст, прошедший токенизацию на предложения и слова. 1 Текст нормализован – замена «подобных» английских символов русскими. 2 Текст разбит на предложения и ...
Название : | Проектирование и реализация автоматизированной системы анализа текстовой информации для определения заимствований |
Авторы/Редакторы : | Антошина О. В. Гордеева О. А. Заболотнова О. Ю. Суханов С. В. Министерство образования и науки Российской Федерации Самарский национальный исследовательский университет им. С. П. Королева ( Самарский университет) Институт информатики математики и электроники Факультет информатики Кафедра технической кибернетики |
Дата публикации : | 2018 |
Библиографическое описание : | Антошина, О. В. Проектирование и реализация автоматизированной системы анализа текстовой информации для определения заимствований : вып. квалификац. работа по специальности (уровень магистратуры) "Прикладная математика и информатика" / О. В. Антошина ; рук. работы О. А. Гордеева; рец. О. Ю. Заболотнова; нормоконтролер С. В. Суханов ; М-во образования и науки Рос. Федерации, Самар.нац. исслед. ун-т им. С. П. Королева (Самар. ун-т), И. - Самаpа, 2018. - on-line |
Аннотация : | Объектом исследования являются алгоритмы поиска текстовых заимствований.Цель работы – с применением методов текстового анализа обнаружить заимствования путем сравнения двух текстовых документов и определить степень самостоятельности автора.Спроектирована и реализована автоматизированная система поиска текстовых заимствований и определения уникальности проверяемого документа – выбран метод Surrounding Context N-Grams и предложена модификация алгоритма определения уникальности. На тестовых фрагментах текстов произведена оценка алгоритма, реализованного c применением существующих библиотек и методов. Исследованы и описаны основные режимы работы автоматизированной системы и произведена оценка качества полученного алгоритма. |
Другие идентификаторы : | RU\НТБ СГАУ\ВКР20180911151705 |
Ключевые слова: | определение уникальности текста обработка текстовых документов методы поиска текстовых заимствований REST- архитектура |
Располагается в коллекциях: | Выпускные квалификационные работы |
Файлы этого ресурса:
Файл | Размер | Формат | |
---|---|---|---|
Антошина_Оксана_Владимировна_Проектирование_реализация_автоматизированной.pdf | 4.09 MB | Adobe PDF | Просмотреть/Открыть |
Показать полное описание ресурса
Просмотр статистики
Поделиться:
Все ресурсы в архиве электронных ресурсов защищены авторским правом, все права сохранены.