Отрывок: Подобный подход для подсчета весов слов в словарях с использованием традиционных методов и технологий при увеличении объемов и количества анализируемых словарей требует огромных вычислительных ресурсов и занимает длительное время, поэтому было принято решение использования технологии BigData и вычислительных кластеров для выполнения данной работы. На этом этапе был разработан алгоритм, который с применением технологии MapReduce отбрасывал неинформативные части словаря (слов...
Название : Определение близости групп в социальных сетях на основе анализа текста с использованием больших данных
Другие названия : Determining the proximity of groups in social networks based on text analysis using big data
Авторы/Редакторы : Мухин, А.С.
Рыцарев, И.А.
Mukhin, A.S.
Ritsarev, I.A.
Дата публикации : Май-2019
Издательство : Новая техника
Библиографическое описание : Мухин А.С. Определение близости групп в социальных сетях на основе анализа текста с использованием больших данных / Мухин А.С., Рыцарев И.А. // Сборник трудов ИТНТ-2019 [Текст]: V междунар. конф. и молодеж. шк. "Информ. технологии и нанотехнологии": 21-24 мая: в 4 т. / Самар. нац.-исслед. ун-т им. С. П. Королева (Самар. ун-т), Ин-т систем. обраб. изобр. РАН-фил. ФНИЦ "Кристаллография и фотоника" РАН; [под ред. В.А. Фурсова]. - Самара: Новая техника, 2019 – Т. 4: Науки о данных. - 2019 - С. 757-760.
Аннотация : Статья посвящена определению близости групп в социальных сетях. Объектом исследования были выбраны данные социальной сети Вконтакте. В рамках работы были собраны, обработаны и проанализированы текстовые данные сообществ социальной сети Вконтакте.Для преодоления проблем связанных с превышением лимитов, установленных социальной сетью были проведены исследования в области оптимизации сбора данных социальной сети. Был разработан программный инструмент, который обеспечивает сбор и последующую обработку необходимых данных из указанных ресурсов.Были исследованы и применены существующие алгоритмы текстового анализа большого объема данных.
URI (Унифицированный идентификатор ресурса) : http://repo.ssau.ru/handle/Informacionnye-tehnologii-i-nanotehnologii/Opredelenie-blizosti-grupp-v-socialnyh-setyah-na-osnove-analiza-teksta-s-ispolzovaniem-bolshih-dannyh-75719
Другие идентификаторы : Dspace\SGAU\20190421\75719
Располагается в коллекциях: Информационные технологии и нанотехнологии

Файлы этого ресурса:
Файл Описание Размер Формат  
paper95.pdfОсновная статья179.77 kBAdobe PDFПросмотреть/Открыть



Все ресурсы в архиве электронных ресурсов защищены авторским правом, все права сохранены.