Отрывок: Вывод Мы представили технологию кластеризации контен- та в социальных сетях на основе алгоритмов аннотации классов GoogLeNet и k-means++. Предложенный метод показал многообещающие результаты и позволил соот- нести каждое изображение с одним из 13 классов, опи- сывающих наиболее часто размещаемый медиаконтент. Серия экспериментов доказала высокое качество кла- стеризации, в среднем, ошибка составила порядка 5 %, для сравнения, алгоритм на основе оценки гистогр...
Название : Кластеризация медиа-контента из социальных сетей с использованием технологии BigData
Другие названия : Clustering of media content from social networks using BigData technology
Авторы/Редакторы : Рыцарев, И.А.
Кирш, Д.В.
Куприянов, А.В.
Ключевые слова : кластеризация
технология BigData
текстовое аннотирование
социальные сети
анализ медиа-контента
алгоритм k-means
GoogLeNet
Дата публикации : 2018
Издательство : Новая техника
Библиографическое описание : Рыцарев, И.А. Кластеризация медиа-контента из социальных сетей с использованием технологии BigData / И.А. Рыцарев, Д.В. Кирш, А.В. Куприянов // Компьютерная оптика. – 2018. – Т. 42, № 5. – С. 921-927. – DOI: 10.18287/2412-6179-2018-42-5- 921-927
Серия/номер : 42;5
Аннотация : Статья посвящена одной из ключевых проблем, возникающих при анализе социальных сетей, – проблеме классификации учётных записей на основе медиаконтента, загружаемого пользователями. Основными трудностями на пути решения проблемы являются гетерогенность контента (как по формату, так и по содержанию) и колоссальные объёмы анализируемой информации, что приводит к чрезмерной вычислительной сложности её обработки, а зачастую и к полной неэффективности традиционных методов анализа. В статье мы обсуждаем подход к кластеризации медиаконтента из социальных сетей на основе текстового аннотирования с использованием технологии BigData – современного и эффективного инструмента, позволяющего решить проблемы обработки данных большого объёма. Для проведения вычислительных экспериментов была собрана большая выборка разнородных изображений (фотографии, картины, поздравительные открытки и т. д.) из реальных профилей пользователей социальной сети Twitter. Проведённое исследование подтвердило высокое качество кластеризации медиаконтента, в среднем, значение ошибки составило порядка 5 %.
URI (Унифицированный идентификатор ресурса) : 10.18287/2412-6179-2018-42-5- 921-927
http://repo.ssau.ru/handle/Zhurnal-Komputernaya-optika/Klasterizaciya-mediakontenta-iz-socialnyh-setei-s-ispolzovaniem-tehnologii-BigData-72399
Другие идентификаторы : Dspace\SGAU\20181112\72399
ГРНТИ: 28.23.15
Располагается в коллекциях: Журнал "Компьютерная оптика"

Файлы этого ресурса:
Файл Описание Размер Формат  
420524.pdf669.12 kBAdobe PDFПросмотреть/Открыть



Все ресурсы в архиве электронных ресурсов защищены авторским правом, все права сохранены.