Отрывок: N- грамма – это просто любая последовательность из N токенов. Можно проследить, как выглядит N-грамма на примере предложения: «Съешь еще этих мягких французских булок, да выпей чаю». Из этого предложения можно составить следующие N-граммы: 1) 1-грамма: Съешь, еще, этих, мягких, французских, булок, да, выпей, чаю. 2) 2-грамма: Съешь еще, еще этих, этих мягких, мягких французских, французских булок, булок да, да выпей, выпей чаю. 3) 3...
Название : Исследование эффективности решения задач рубрикации текстов на русском языке при помощи многослойного персептрона
Авторы/Редакторы : Рябцев А. А.
Солдатова О. П.
Соловьева Я. В.
Министерство науки и высшего образования Российской Федерации
Самарский национальный исследовательский университет им. С. П. Королева (Самарский университет)
Институт информатики и кибернетики
Дата публикации : 2023
Библиографическое описание : Рябцев, А. А. Исследование эффективности решения задач рубрикации текстов на русском языке при помощи многослойного персептрона : вып. квалификац. работа по направлению подгот. 09.04.01 "Информатика и вычислительная техника" (уровень магистратуры), профиль "Автоматизированные системы обработки информации и управления" / А. А. Рябцев ; рук. работы О. П. Солдатова ; нормоконтролер Я. В. Соловьева ; М-во науки и высш. образования Рос. Федерации, Самар. нац. исслед. ун-т им. С. П. Королева (Самар. ун-т), Ин-т информатики. - Самара, 2023. - 1 файл (1,9 Мб). - Текст : электронный
Аннотация : Целью данной работы является анализ модели многослойного персептрона решений для решения задачи классификации текстов на русском языке. Разработана интеллектуальная система, в которой реализованы: − предварительная обработка входных текстовых данных; − выделение признаков входных данных несколькими методами; − построение и обучение модели многослойного персептрона; − решение задачи классификации анализируемой модели; − вывод результатов работы моделей. Интеллектуальная система разработана на языке Java версии 8.0 в среде разработки IntelliJ IDEA 2022 для работы под управлением любой операционной системы, имеющей JVM (виртуальная Java машина). Тестирование спроектированной системы производилось с использованием размеченного сбалансированного набора данных новостей с сайта Lenta.ru.
URI (Унифицированный идентификатор ресурса) : http://repo.ssau.ru/handle/Vypusknye-kvalifikacionnye-raboty/Issledovanie-effektivnosti-resheniya-zadach-rubrikacii-tekstov-na-russkom-yazyke-pri-pomoshi-mnogosloinogo-perseptrona-106158
Другие идентификаторы : RU\НТБ СГАУ\ВКР20231012151811
Ключевые слова: алгоритм наискорейшего спуска с моментами
алгоритм обратного распространения ошибки
классификация текстов
классификация текстов на русском языке
машинное обучение
многослойный персептрон
рубрикация текстов
Располагается в коллекциях: Выпускные квалификационные работы




Все ресурсы в архиве электронных ресурсов защищены авторским правом, все права сохранены.