Title: Исследование и разработка методов сбора, обработки и последующей классификации текстовых данных социальной сети
Authors: Рыцарев И. А.
Благов А. В.
Иващенко А. В.
Keywords: текстовый анализ
TF-IDF
алгоритмы кластеризации данных
данные сверхбольшого объема
классификация данных
HADOOP
K-MEANS
LDA
Issue Date: 2017
Citation: Рыцарев, И. А. Исследование и разработка методов сбора, обработки и последующей классификации текстовых данных социальной сети : вып. квалификац. работа по спец. "Прикладная математика и информатика" / И. А. Рыцарев ; рук. работы А. В. Благов; рец. А. В. Иващенко ; М-во образования и науки Рос. Федерации, Самар. нац. исслед. ун-т им. С. П. Королева (Самар. ун-т), Ин-т информатики, математики и элект. - Самара, 2017. - on-line
Abstract: Работа посвящена исследованию и разработке алгоритмов классификации текстовых данных социальных сетей. В качестве объекта исследования были выбраны данные социальной сети Twitter. Сбор данных произведен по определенным геолокациям, при этом собирались, обрабатывались и анализировались текстовые данные. Для получения необходимой информации были проведены исследования в области оптимизации сбора данных социальной сети Twitter. Разработано программное средство, обеспечивающее сбор необходимых данных из заданных геолокаций. Исследованы и апробированы существующие алгоритмы кластеризации и последующей классификации данных, преимущественно большого объема, предложены модифицированные распределенные алгоритмы для работы с текстовыми данными коротких сообщений социальной сети Twitter.
URI: http://repo.ssau.ru/jspui/handle/123456789/47141
Appears in Collections:Выпускные квалификационные работы



Items in Repository are protected by copyright, with all rights reserved, unless otherwise indicated.