Отрывок: 2.5.3 Описание используемых библиотек Nltk – библиотека с открытым исходным кодом для символьной и стилистической обработки естественного языка, содержащая графические представления и примеры данных. Она предоставляет множество полезных функций, таких как токенизация, стемминг, разметка, фильтрация и анализ семантический рассуждений [21]. SpaCy – это библиотека с открытым исходным кодом для обработки естественного языка (NLP), написанная на Python и Cython. Она п...
| Название : | Разработка автоматизированной системы определения лексических повторов и тавтологий |
| Авторы/Редакторы : | Чеплакова Е. Ю. Гордеева О. А. Сопченко Е. В. Министерство науки и высшего образования Российской Федерации Самарский национальный исследовательский университет им. С. П. Королева (Самарский университет) Институт информатики и кибернетики |
| Дата публикации : | 2024 |
| Библиографическое описание : | Чеплакова, Е. Ю. Разработка автоматизированной системы определения лексических повторов и тавтологий : вып. квалификац. работа по направлению подгот. 02.03.02 Фундаментальная информатика и информационные технологии (уровень бакалавриата), направленность (профиль) «Информационные технологии» / Е. Ю. Чеплакова ; рук. работы О. А. Гордеева ; нормоконтролер Е. В. Сопченко ; М-во науки и высш. образования Рос. Федерации, Самар. нац. исслед. ун-т им. С. П. Королева (Самар. ун-т), Ин-т информати. - Самара, 2024. - 1 файл (1,9 Мб). - Текст : электронный |
| Аннотация : | Цель работы – разработать автоматизированную систему определения лексических повторов и тавтологий. В процессе работы были разработаны алгоритмы и соответствующая программа, позволяющая пользователю анализировать текст на наличие в нем лексических повторов и тавтологий, рассчитывать статистические характеристики текста, включая заспамленность, а также подбирать синонимы к заданному слову. Система разработана на языке Python с использованием фреймворка FastAPI, библиотек Nltk, spaCy, ruwordnet, wiki-ru-wordnet и функционирует под управлением операционных систем Windows 7/8/10. Для создания пользовательского интерфейса используются такие технологии как HTML, CSS и язык программирования JavaScript. Доступ к данным осуществляется с помощью библиотек sqlite3, SQLAlchemy. |
| URI (Унифицированный идентификатор ресурса) : | http://repo.ssau.ru/handle/Vypusknye-kvalifikacionnye-raboty/Razrabotka-avtomatizirovannoi-sistemy-opredeleniya-leksicheskih-povtorov-i-tavtologii-112154 |
| Другие идентификаторы : | RU\НТБ СГАУ\ВКР20241009143023 |
| Ключевые слова: | автоматическая обработка текста анализ текста заспамленность лексический повтор подбор синонимов тавтология функциональные стили текста |
| Располагается в коллекциях: | Выпускные квалификационные работы |
Файлы этого ресурса:
| Файл | Размер | Формат | |
|---|---|---|---|
| Чеплакова_Елизавета_Юрьевна_Разработка_автоматизированной_системы_определения.pdf | 1.9 MB | Adobe PDF | Просмотреть/Открыть |
Показать полное описание ресурса
Просмотр статистики
Поделиться:
Все ресурсы в архиве электронных ресурсов защищены авторским правом, все права сохранены.