| Title: | Исследование и разработка методов сбора, обработки и последующей классификации текстовых данных социальной сети |
| Authors: | Рыцарев И. А. Благов А. В. Иващенко А. В. |
| Keywords: | текстовый анализ TF-IDF алгоритмы кластеризации данных данные сверхбольшого объема классификация данных HADOOP K-MEANS LDA |
| Issue Date: | 2017 |
| Citation: | Рыцарев, И. А. Исследование и разработка методов сбора, обработки и последующей классификации текстовых данных социальной сети : вып. квалификац. работа по спец. "Прикладная математика и информатика" / И. А. Рыцарев ; рук. работы А. В. Благов; рец. А. В. Иващенко ; М-во образования и науки Рос. Федерации, Самар. нац. исслед. ун-т им. С. П. Королева (Самар. ун-т), Ин-т информатики, математики и элект. - Самара, 2017. - on-line |
| Abstract: | Работа посвящена исследованию и разработке алгоритмов классификации текстовых данных социальных сетей. В качестве объекта исследования были выбраны данные социальной сети Twitter. Сбор данных произведен по определенным геолокациям, при этом собирались, обрабатывались и анализировались текстовые данные. Для получения необходимой информации были проведены исследования в области оптимизации сбора данных социальной сети Twitter. Разработано программное средство, обеспечивающее сбор необходимых данных из заданных геолокаций. Исследованы и апробированы существующие алгоритмы кластеризации и последующей классификации данных, преимущественно большого объема, предложены модифицированные распределенные алгоритмы для работы с текстовыми данными коротких сообщений социальной сети Twitter. |
| URI: | http://repo.ssau.ru/jspui/handle/123456789/47141 |
| Appears in Collections: | Выпускные квалификационные работы |
Files in This Item:
| File | Size | Format | |
|---|---|---|---|
| Рыцарев_Игорь_Андреевич_Исследование_разработка_методов.pdf | 2.28 MB | Adobe PDF | View/Open Request a copy |
Items in Repository are protected by copyright, with all rights reserved, unless otherwise indicated.