Отрывок: Диаграмма последовательности действий, выполняющихся при обучении классификатора, представлена на рисунке 2.4. Рисунок 2.4 – Диаграмма последовательности варианта использования «Обучение классификатора» 2.7 Диаграмма состояний Диаграмма состояний описывает возможные последовательности состояний и переходов, которые в совокупности характеризуют поведение элемента модели в течение его жизненного цикла. 36 Диаграмма состояний представляет ...
Название : Исследование методов классификации текстов на естественном языке
Авторы/Редакторы : Старкова Е. В.
Прохоров С. А.
Якимов В. Н.
Министерство образования и науки Российской Федерации
Самарский национальный исследовательский университет им. С. П. Королева (Самарский университет)
Институт информатики
математики и электроники
Дата публикации : 2018
Библиографическое описание : Старкова, Е. В. Исследование методов классификации текстов на естественном языке : вып. квалификац. работа по спец. "Информатика и вычислительная техника" / Е. В. Старкова ; рук. работы С. А. Прохоров; рец. В. Н. Якимов ; М-во образования и науки Рос. Федерации, Самар. нац. исслед. ун-т им. С. П. Королева (Самар. ун-т), Ин-т информатики, математики и элек. - Самара, 2018. - on-line
Аннотация : Цель данной квалификационной работы – проектирование и реализация классификатора текстов на естественном языке, а также анализ и сравнение результатов, полученных при реализации метода опорных векторов и деревьев решений при различных настройках параметров данных методов.Метод опорных векторов был реализован при помощи модели мульти-классификации «Каждый-против-каждого». Метод деревьев решений был реализован при помощи алгоритма ID3 и алгоритма C4.5. Обучающие и тестовые данные были сформированы из русскоязычных новостных сайтов ИнтернетаВ ходе данной работы было проведено изучение и анализ предметной области, проведен сравнительный анализ существующих систем-аналогов.Спроектирована и разработана информационно-логическая модель автоматизированной системы в нотации UML с помощью CASE-средства StarUML. Система выполнена в среде разработки Visual Studio 2017 на языке программирования C#.
Другие идентификаторы : RU\НТБ СГАУ\ВКР20180625133447
Ключевые слова: преобразования TF*ID
деревья решений
морфологические признаки слова
мульти-классификация
метод опорных векторов
классификация текстов
Располагается в коллекциях: Выпускные квалификационные работы




Все ресурсы в архиве электронных ресурсов защищены авторским правом, все права сохранены.