Отрывок: Подобный подход для подсчета весов слов в словарях с использованием традиционных методов и технологий при увеличении объемов и количества анализируемых словарей требует огромных вычислительных ресурсов и занимает длительное время, поэтому было принято решение использования технологии BigData и вычислительных кластеров для выполнения данной работы. На этом этапе был разработан алгоритм, который с применением технологии MapReduce отбрасывал неинформативные части словаря (слов...
Название : | Определение близости групп в социальных сетях на основе анализа текста с использованием больших данных |
Другие названия : | Determining the proximity of groups in social networks based on text analysis using big data |
Авторы/Редакторы : | Мухин, А.С. Рыцарев, И.А. Mukhin, A.S. Ritsarev, I.A. |
Дата публикации : | Май-2019 |
Издательство : | Новая техника |
Библиографическое описание : | Мухин А.С. Определение близости групп в социальных сетях на основе анализа текста с использованием больших данных / Мухин А.С., Рыцарев И.А. // Сборник трудов ИТНТ-2019 [Текст]: V междунар. конф. и молодеж. шк. "Информ. технологии и нанотехнологии": 21-24 мая: в 4 т. / Самар. нац.-исслед. ун-т им. С. П. Королева (Самар. ун-т), Ин-т систем. обраб. изобр. РАН-фил. ФНИЦ "Кристаллография и фотоника" РАН; [под ред. В.А. Фурсова]. - Самара: Новая техника, 2019 – Т. 4: Науки о данных. - 2019 - С. 757-760. |
Аннотация : | Статья посвящена определению близости групп в социальных сетях. Объектом исследования были выбраны данные социальной сети Вконтакте. В рамках работы были собраны, обработаны и проанализированы текстовые данные сообществ социальной сети Вконтакте.Для преодоления проблем связанных с превышением лимитов, установленных социальной сетью были проведены исследования в области оптимизации сбора данных социальной сети. Был разработан программный инструмент, который обеспечивает сбор и последующую обработку необходимых данных из указанных ресурсов.Были исследованы и применены существующие алгоритмы текстового анализа большого объема данных. |
URI (Унифицированный идентификатор ресурса) : | http://repo.ssau.ru/handle/Informacionnye-tehnologii-i-nanotehnologii/Opredelenie-blizosti-grupp-v-socialnyh-setyah-na-osnove-analiza-teksta-s-ispolzovaniem-bolshih-dannyh-75719 |
Другие идентификаторы : | Dspace\SGAU\20190421\75719 |
Располагается в коллекциях: | Информационные технологии и нанотехнологии |
Файлы этого ресурса:
Файл | Описание | Размер | Формат | |
---|---|---|---|---|
paper95.pdf | Основная статья | 179.77 kB | Adobe PDF | Просмотреть/Открыть |
Показать полное описание ресурса
Просмотр статистики
Поделиться:
Все ресурсы в архиве электронных ресурсов защищены авторским правом, все права сохранены.