Отрывок: Рядом друг с другом в данном случае значит в близких контекстах. Word2vec анализирует контексты употребления слов и делает вывод, что являются или не являются близкими по смыслу. Так как подобные выводы word2vec делает на основа- нии большого количества текста, выводы оказываются вполне адекватными. Алгоритмы, на которых базируется word2vec подробно изложены в работах [1...
Название : Классификация текстовых данных социальной сети Twitter
Авторы/Редакторы : Рыцарев, И.А.
Благов, А.В.
Ключевые слова : big data
обработка данных
анализ данных
кластеризация
классификация
TF-IDF
latent dirichlet allocation
Дата публикации : 2016
Издательство : Издательство СГАУ
Библиографическое описание : Материалы Международной конференции и молодёжной школы «Информационные технологии и нанотехнологии», с. 1073-1076
Аннотация : В социальные сети играют большую роль в современном мире, важным при этом является определение значимых и популярных обсуждаемых тем. В данной статье рассматриваются вопросы сбора текстовых данных социальной сети Twitter и дальнейшей кластеризации и классификации собранных данных.
URI (Унифицированный идентификатор ресурса) : http://repo.ssau.ru/handle/Informacionnye-tehnologii-i-nanotehnologii/Klassifikaciya-tekstovyh-dannyh-socialnoi-seti-Twitter-60919
ISBN : 978-5-7883-1078-7
Другие идентификаторы : Dspace\SGAU\20161219\60919
Располагается в коллекциях: Информационные технологии и нанотехнологии

Файлы этого ресурса:
Файл Описание Размер Формат  
1073-1076.pdfОсновная статья412.58 kBAdobe PDFПросмотреть/Открыть



Все ресурсы в архиве электронных ресурсов защищены авторским правом, все права сохранены.