Определение близости групп в социальных сетях на основе анализа текста с использованием больших данных

Рыцарев, И.А.; Ritsarev, I.A.; Mukhin, A.S.; Мухин, А.С.

Отрывок: Подобный подход для подсчета весов слов в словарях с использованием традиционных методов и технологий при увеличении объемов и количества анализируемых словарей требует огромных вычислительных ресурсов и занимает длительное время, поэтому было принято решение использования технологии BigData и вычислительных кластеров для выполнения данной работы. На этом этапе был разработан алгоритм, который с применением технологии MapReduce отбрасывал неинформативные части словаря (слов...

Название :	Определение близости групп в социальных сетях на основе анализа текста с использованием больших данных
Другие названия :	Determining the proximity of groups in social networks based on text analysis using big data
Авторы/Редакторы :	Мухин, А.С. Рыцарев, И.А. Mukhin, A.S. Ritsarev, I.A.
Дата публикации :	Май-2019
Издательство :	Новая техника
Библиографическое описание :	Мухин А.С. Определение близости групп в социальных сетях на основе анализа текста с использованием больших данных / Мухин А.С., Рыцарев И.А. // Сборник трудов ИТНТ-2019 [Текст]: V междунар. конф. и молодеж. шк. "Информ. технологии и нанотехнологии": 21-24 мая: в 4 т. / Самар. нац.-исслед. ун-т им. С. П. Королева (Самар. ун-т), Ин-т систем. обраб. изобр. РАН-фил. ФНИЦ "Кристаллография и фотоника" РАН; [под ред. В.А. Фурсова]. - Самара: Новая техника, 2019 – Т. 4: Науки о данных. - 2019 - С. 757-760.
Аннотация :	Статья посвящена определению близости групп в социальных сетях. Объектом исследования были выбраны данные социальной сети Вконтакте. В рамках работы были собраны, обработаны и проанализированы текстовые данные сообществ социальной сети Вконтакте.Для преодоления проблем связанных с превышением лимитов, установленных социальной сетью были проведены исследования в области оптимизации сбора данных социальной сети. Был разработан программный инструмент, который обеспечивает сбор и последующую обработку необходимых данных из указанных ресурсов.Были исследованы и применены существующие алгоритмы текстового анализа большого объема данных.
URI (Унифицированный идентификатор ресурса) :	http://repo.ssau.ru/handle/Informacionnye-tehnologii-i-nanotehnologii/Opredelenie-blizosti-grupp-v-socialnyh-setyah-na-osnove-analiza-teksta-s-ispolzovaniem-bolshih-dannyh-75719
Другие идентификаторы :	Dspace\SGAU\20190421\75719
Располагается в коллекциях:	Информационные технологии и нанотехнологии

Файлы этого ресурса:

Файл	Описание	Размер	Формат
paper95.pdf	Основная статья	179.77 kB	Adobe PDF	Просмотреть/Открыть

Показать полное описание ресурса Просмотр статистики
Поделиться:

Все ресурсы в архиве электронных ресурсов защищены авторским правом, все права сохранены.

Репозиторий Самарского университета