Отрывок: Лексический анализ – первый шаг извлечения термов. На этом этапе отбрасываются все символы, которые не являются буквами, например, знаки препинания, html-тэги, символы разметки и т.д. Удаление стоп-слов – второй шаг извлечения термов. На этом этапе удаляются слова, которые не несут какой-либо самостоятельной семантической нагрузки. К стоп-словам относятся союзы, предлоги и местоимения. В целях уменьшения размерности пространства термов стоп- слова не учитываются и удаляются при...
Полная запись метаданных
Поле DC Значение Язык
dc.contributor.authorМятлев Е. А.ru
dc.contributor.authorБелоусов А. А.ru
dc.contributor.authorСуханов С. В.ru
dc.contributor.authorМинистерство образования и науки Российской Федерацииru
dc.contributor.authorСамарский национальный исследовательский университет им. С. П. Королева (Самарский университет)ru
dc.contributor.authorИнститут информатикиru
dc.contributor.authorматематики и электроникиru
dc.coverage.spatialанализ текстаru
dc.coverage.spatialизвлечение термовru
dc.coverage.spatialметод Рошеru
dc.coverage.spatialметод опорных векторовru
dc.coverage.spatialклассификацияru
dc.coverage.spatialклассификаторыru
dc.coverage.spatialлатентно-семантический анализru
dc.creatorМятлев Е. А.ru
dc.date.issued2018ru
dc.identifierRU\НТБ СГАУ\ВКР20180907134842ru
dc.identifier.citationМятлев, Е. А. Исследование методов решения задач классификации документов : вып. квалификац. работа по направлению подготовки "Прикладная математика и информатика" (уровень бакалавриата) / Е. А. Мятлев ; рук. работы А. А. Белоусов ; нормоконтролер С. В. Суханов ; М-во образования и науки Рос. Федерации, Самар. нац. исслед. ун-т им. С. П. Королева(Самар. ун-т), Ин-т информатики, мат. и э. - Самаpа, 2018. - on-lineru
dc.description.abstractОбъектом исследования являются алгоритмы классификации текста, такие как метод опорных векторов, метод Роше, метод k-ближайших соседей. Цель работы – реализация методов классификации документации по категориям, к которым относится некоторый документ с использованием языка программирования Python и библиотеки для машинного обучения Scikit Learn. Разработана программная реализация рассмотренных алгоритмов, с ее помощью проведен анализ тестовой выборки документов, выбран наилучший метод классификации, по оценке F-меры.ru
dc.format.extentЭлектрон. дан. (1 файл : 2,3 Мб)ru
dc.titleИсследование методов решения задач классификации документовru
dc.typeTextru
dc.subject.rugasnti50.01ru
dc.subject.udc004.9ru
dc.textpartЛексический анализ – первый шаг извлечения термов. На этом этапе отбрасываются все символы, которые не являются буквами, например, знаки препинания, html-тэги, символы разметки и т.д. Удаление стоп-слов – второй шаг извлечения термов. На этом этапе удаляются слова, которые не несут какой-либо самостоятельной семантической нагрузки. К стоп-словам относятся союзы, предлоги и местоимения. В целях уменьшения размерности пространства термов стоп- слова не учитываются и удаляются при...-
Располагается в коллекциях: Выпускные квалификационные работы




Все ресурсы в архиве электронных ресурсов защищены авторским правом, все права сохранены.