Отрывок: Описание вариантов использования приведено в таблице 4. 35 Пользователь Система Ввести ключевые слова Сервер Обратиться по API Вернуть данные Система Вывести результат Пользователь Система Сервер Система Рисунок 9 – Диаграмма вариантов использования 36 Таблица 4 – Таблица вариантов использования № Имя Описание 1 Название Ввести ключевые слова Предусловия Система запущена Актеры Пользоват...
Название : Исследование и разработка методов сбора, обработки и последующей классификации текстовых данных социальной сети
Авторы/Редакторы : Рыцарев И. А.
Благов А. В.
Иващенко А. В.
Министерство образования и науки Российской Федерации
Самарский национальный исследовательский университет им. С. П. Королева (Самарский университет)
Институт информатики
математики и электроники
Дата публикации : 2017
Библиографическое описание : Рыцарев, И. А. Исследование и разработка методов сбора, обработки и последующей классификации текстовых данных социальной сети : вып. квалификац. работа по спец. "Прикладная математика и информатика" / И. А. Рыцарев ; рук. работы А. В. Благов; рец. А. В. Иващенко ; М-во образования и науки Рос. Федерации, Самар. нац. исслед. ун-т им. С. П. Королева (Самар. ун-т), Ин-т информатики, математики и элект. - Самара, 2017. - on-line
Аннотация : Работа посвящена исследованию и разработке алгоритмов классификации текстовых данных социальных сетей. В качестве объекта исследования были выбраны данные социальной сети Twitter. Сбор данных произведен по определенным геолокациям, при этом собирались, обрабатывались и анализировались текстовые данные. Для получения необходимой информации были проведены исследования в области оптимизации сбора данных социальной сети Twitter. Разработано программное средство, обеспечивающее сбор необходимых данных из заданных геолокаций. Исследованы и апробированы существующие алгоритмы кластеризации и последующей классификации данных, преимущественно большого объема, предложены модифицированные распределенные алгоритмы для работы с текстовыми данными коротких сообщений социальной сети Twitter.
Другие идентификаторы : RU\НТБ СГАУ\ВКР20170906140515
Ключевые слова: HADOOP
данные сверхбольшого объема
классификация данных
алгоритмы кластеризации данных
TF-IDF
LDA
K-MEANS
текстовый анализ
Располагается в коллекциях: Выпускные квалификационные работы




Все ресурсы в архиве электронных ресурсов защищены авторским правом, все права сохранены.