Отрывок: 2.5.3 Описание используемых библиотек Nltk – библиотека с открытым исходным кодом для символьной и стилистической обработки естественного языка, содержащая графические представления и примеры данных. Она предоставляет множество полезных функций, таких как токенизация, стемминг, разметка, фильтрация и анализ семантический рассуждений [21]. SpaCy – это библиотека с открытым исходным кодом для обработки естественного языка (NLP), написанная на Python и Cython. Она п...
Название : Разработка автоматизированной системы определения лексических повторов и тавтологий
Авторы/Редакторы : Чеплакова Е. Ю.
Гордеева О. А.
Сопченко Е. В.
Министерство науки и высшего образования Российской Федерации
Самарский национальный исследовательский университет им. С. П. Королева (Самарский университет)
Институт информатики и кибернетики
Дата публикации : 2024
Библиографическое описание : Чеплакова, Е. Ю. Разработка автоматизированной системы определения лексических повторов и тавтологий : вып. квалификац. работа по направлению подгот. 02.03.02 Фундаментальная информатика и информационные технологии (уровень бакалавриата), направленность (профиль) «Информационные технологии» / Е. Ю. Чеплакова ; рук. работы О. А. Гордеева ; нормоконтролер Е. В. Сопченко ; М-во науки и высш. образования Рос. Федерации, Самар. нац. исслед. ун-т им. С. П. Королева (Самар. ун-т), Ин-т информати. - Самара, 2024. - 1 файл (1,9 Мб). - Текст : электронный
Аннотация : Цель работы – разработать автоматизированную систему определения лексических повторов и тавтологий. В процессе работы были разработаны алгоритмы и соответствующая программа, позволяющая пользователю анализировать текст на наличие в нем лексических повторов и тавтологий, рассчитывать статистические характеристики текста, включая заспамленность, а также подбирать синонимы к заданному слову. Система разработана на языке Python с использованием фреймворка FastAPI, библиотек Nltk, spaCy, ruwordnet, wiki-ru-wordnet и функционирует под управлением операционных систем Windows 7/8/10. Для создания пользовательского интерфейса используются такие технологии как HTML, CSS и язык программирования JavaScript. Доступ к данным осуществляется с помощью библиотек sqlite3, SQLAlchemy.
URI (Унифицированный идентификатор ресурса) : http://repo.ssau.ru/handle/Vypusknye-kvalifikacionnye-raboty/Razrabotka-avtomatizirovannoi-sistemy-opredeleniya-leksicheskih-povtorov-i-tavtologii-112154
Другие идентификаторы : RU\НТБ СГАУ\ВКР20241009143023
Ключевые слова: автоматическая обработка текста
анализ текста
заспамленность
лексический повтор
подбор синонимов
тавтология
функциональные стили текста
Располагается в коллекциях: Выпускные квалификационные работы




Все ресурсы в архиве электронных ресурсов защищены авторским правом, все права сохранены.