Отрывок: 7% неестественных текстов. 976 текстов из 41796 были признаны неестественными, что является 2.4% ошибки на базе текстов «ruscorpora». Процент ошибки является приемлемым, а значит если «степень неестественности» текста больше 3, то текст считается неестественным. Метод может успешно использоваться и давать положительный результат для поиска неестественных текстов. И в составе классификатора данный метод поможет опред...
Полная запись метаданных
Поле DC Значение Язык
dc.contributor.authorЖиткова А. В.ru
dc.contributor.authorКнутова Е. М.ru
dc.contributor.authorПиявский С. А.ru
dc.contributor.authorМинистерство образования и науки Российской Федерацииru
dc.contributor.authorСамарский национальный исследовательский университет им. С. П. Королева (Самарский университет)ru
dc.contributor.authorИнститут информатикиru
dc.contributor.authorматематики и электроникиru
dc.coverage.spatialтематическое разнообразиеru
dc.coverage.spatialтематическая структура текстаru
dc.coverage.spatialгенератор текстаru
dc.coverage.spatialпоисковый спамru
dc.coverage.spatialзакон Ципфаru
dc.coverage.spatialспамru
dc.coverage.spatialнеестественные текстыru
dc.coverage.spatialF-мераru
dc.coverage.spatialметоды порождения неестественных текстовru
dc.coverage.spatialметоды обнаружения неестественных текстовru
dc.creatorЖиткова А. В.ru
dc.date.issued2017ru
dc.identifierRU\НТБ СГАУ\ВКР20170220101356ru
dc.identifier.citationЖиткова, А. В. Методы обнаружения неестественных текстов, порожденных на основе обучающей выборки : вып. квалификац. работа по спец. "Компьютерная безопасность" / А. В. Житкова ; рук. работы Е. М. Кнутова; рец. С. А. Пиявский ; М-во образования и науки Рос. Федерации, Самар. нац. исслед. ун-т им. С. П. Королева (Самар. ун-т), Ин-т информатики, математики и элек. - Самара, 2017. - on-lineru
dc.description.abstractРассмотрены основные методы создания текстового спама.Проанализированы методы обнаружения неестественных текстов,порожденных на основе обучающей выборки. Реализована программа,выполняющая вычисление параметра тематического разнообразия в законеЦипфа,ru
dc.format.extentЭлектрон. дан. (1 файл : 0,9 Мб)ru
dc.titleМетоды обнаружения неестественных текстов, порожденных на основе обучающей выборкиru
dc.typeTextru
dc.subject.rugasnti50.37.23ru
dc.subject.udc004.056ru
dc.textpart7% неестественных текстов. 976 текстов из 41796 были признаны неестественными, что является 2.4% ошибки на базе текстов «ruscorpora». Процент ошибки является приемлемым, а значит если «степень неестественности» текста больше 3, то текст считается неестественным. Метод может успешно использоваться и давать положительный результат для поиска неестественных текстов. И в составе классификатора данный метод поможет опред...-
Располагается в коллекциях: Выпускные квалификационные работы




Все ресурсы в архиве электронных ресурсов защищены авторским правом, все права сохранены.