Отрывок: Для выполнения процедуры проверки орфографии в рамках данной работы использовалась сторонняя библиотека. Параллельно производится учёт количества постов и комментариев. После выполнения описанных этапов, подсчёт количества вхождений каждого уникального слова w во всём множестве S текстовых данных осуще...
Название : | Применение метода главных компонент для выявления семантических различий и анализа изменения положения в пространстве при анализе информационного контента сетевых сообществ |
Другие названия : | Analysis of components to identify semantic proximity and analyzing changes in position in space in tasks of content analysis of social networks |
Авторы/Редакторы : | Рыцарев, И.А. Парингер, Р.А. Куприянов, А.В. Rytsarev, I.A. Paringer, R.A. Kupriyanov, A.V. |
Дата публикации : | Май-2019 |
Издательство : | Новая техника |
Библиографическое описание : | Рыцарев И.А. Применение метода главных компонент для выявления семантических различий и анализа изменения положения в пространстве при анализе информационного контента сетевых сообществ / Рыцарев И.А., Парингер Р.А., Куприянов А.В. // Сборник трудов ИТНТ-2019 [Текст]: V междунар. конф. и молодеж. шк. "Информ. технологии и нанотехнологии": 21-24 мая: в 4 т. / Самар. нац.-исслед. ун-т им. С. П. Королева (Самар. ун-т), Ин-т систем. обраб. изобр. РАН-фил. ФНИЦ "Кристаллография и фотоника" РАН; [под ред. В.А. Фурсова]. - Самара: Новая техника, 2019 – Т. 4: Науки о данных. - 2019 - С. 780-787. |
Аннотация : | В работе мы предлагаем подход к анализу социальных групп и их положения относительно друг друга на основе выявления семантических различий в текстах, представленных в виде частотных словарей. Исходные текстовые данные мы получили путём сбора записей тематических интернет-сообществ. Для сбора записей мы реализовали специализированный программный модуль, позволяющий анализировать и загружать как посты, так и комментарии из интересующих открытых сообществ социальной сети ВКонтакте. Для составления частотного словаря, мы разработали, алгоритм, который учитывает особенности данных, собираемых из социальных сетей. В статье мы предлагаем подход, основанный на использовании методов снижения размерности пространств признаков, для выявления ключевых слов на основе анализа частоты их употребления. Алгоритм, который мы представили, использует метод главных компонент. В результате работы мы показали, что, используя коэффициенты полученного линейного преобразования можно оценить значимость слов. С использованием полученных оценок, мы не только смогли выявить не только ключевые слова, но и составить семантические различия в сообществах социальных сетей, а так же построить графики изменения положения этих групп в пространстве относительно друг друга. |
URI (Унифицированный идентификатор ресурса) : | http://repo.ssau.ru/handle/Informacionnye-tehnologii-i-nanotehnologii/Primenenie-metoda-glavnyh-komponent-dlya-vyyavleniya-semanticheskih-razlichiĭ-i-analiza-izmeneniya-polozheniya-v-prostranstve-pri-analize-informacionnogo-kontenta-setevyh-soobshestv-75722 |
Другие идентификаторы : | Dspace\SGAU\20190421\75722 |
Располагается в коллекциях: | Информационные технологии и нанотехнологии |
Файлы этого ресурса:
Файл | Описание | Размер | Формат | |
---|---|---|---|---|
paper98.pdf | Основная статья | 274.75 kB | Adobe PDF | Просмотреть/Открыть |
Показать полное описание ресурса
Просмотр статистики
Поделиться:
Все ресурсы в архиве электронных ресурсов защищены авторским правом, все права сохранены.