Отрывок: Для выполнения процедуры проверки орфографии в рамках данной работы использовалась сторонняя библиотека. Параллельно производится учёт количества постов и комментариев. После выполнения описанных этапов, подсчёт количества вхождений каждого уникального слова w во всём множестве S текстовых данных осуще...
Название : Применение метода главных компонент для выявления семантических различий и анализа изменения положения в пространстве при анализе информационного контента сетевых сообществ
Другие названия : Analysis of components to identify semantic proximity and analyzing changes in position in space in tasks of content analysis of social networks
Авторы/Редакторы : Рыцарев, И.А.
Парингер, Р.А.
Куприянов, А.В.
Rytsarev, I.A.
Paringer, R.A.
Kupriyanov, A.V.
Дата публикации : Май-2019
Издательство : Новая техника
Библиографическое описание : Рыцарев И.А. Применение метода главных компонент для выявления семантических различий и анализа изменения положения в пространстве при анализе информационного контента сетевых сообществ / Рыцарев И.А., Парингер Р.А., Куприянов А.В. // Сборник трудов ИТНТ-2019 [Текст]: V междунар. конф. и молодеж. шк. "Информ. технологии и нанотехнологии": 21-24 мая: в 4 т. / Самар. нац.-исслед. ун-т им. С. П. Королева (Самар. ун-т), Ин-т систем. обраб. изобр. РАН-фил. ФНИЦ "Кристаллография и фотоника" РАН; [под ред. В.А. Фурсова]. - Самара: Новая техника, 2019 – Т. 4: Науки о данных. - 2019 - С. 780-787.
Аннотация : В работе мы предлагаем подход к анализу социальных групп и их положения относительно друг друга на основе выявления семантических различий в текстах, представленных в виде частотных словарей. Исходные текстовые данные мы получили путём сбора записей тематических интернет-сообществ. Для сбора записей мы реализовали специализированный программный модуль, позволяющий анализировать и загружать как посты, так и комментарии из интересующих открытых сообществ социальной сети ВКонтакте. Для составления частотного словаря, мы разработали, алгоритм, который учитывает особенности данных, собираемых из социальных сетей. В статье мы предлагаем подход, основанный на использовании методов снижения размерности пространств признаков, для выявления ключевых слов на основе анализа частоты их употребления. Алгоритм, который мы представили, использует метод главных компонент. В результате работы мы показали, что, используя коэффициенты полученного линейного преобразования можно оценить значимость слов. С использованием полученных оценок, мы не только смогли выявить не только ключевые слова, но и составить семантические различия в сообществах социальных сетей, а так же построить графики изменения положения этих групп в пространстве относительно друг друга.
URI (Унифицированный идентификатор ресурса) : http://repo.ssau.ru/handle/Informacionnye-tehnologii-i-nanotehnologii/Primenenie-metoda-glavnyh-komponent-dlya-vyyavleniya-semanticheskih-razlichiĭ-i-analiza-izmeneniya-polozheniya-v-prostranstve-pri-analize-informacionnogo-kontenta-setevyh-soobshestv-75722
Другие идентификаторы : Dspace\SGAU\20190421\75722
Располагается в коллекциях: Информационные технологии и нанотехнологии

Файлы этого ресурса:
Файл Описание Размер Формат  
paper98.pdfОсновная статья274.75 kBAdobe PDFПросмотреть/Открыть



Все ресурсы в архиве электронных ресурсов защищены авторским правом, все права сохранены.