Отрывок: Совместное распределение тогда выглядит так: (2) В отличие от обычной кластеризации с априорным распределением Дирихле или обычным распределением Байеса, мы не выбираем кластер один раз, а затем «накидываем» слова из этого кластера, а для каждого слова сначала выбираем по распределению θ тему, а уже потом «набрасываем» это слово по данной теме. [18] В ходе работы э...
Полная запись метаданных
Поле DC Значение Язык
dc.contributor.authorРыцарев, И.А.-
dc.contributor.authorБлагов, А.В.-
dc.date.accessioned2017-05-25 13:46:45-
dc.date.available2017-05-25 13:46:45-
dc.date.issued2017-
dc.identifierDspace\SGAU\20170523\64149ru
dc.identifier.citationРыцарев И.А. Разработка и исследование алгоритмов кластеризации данных сверхбольшого объема / И.А. Рыцарев, А.В. Благов // Сборник трудов III международной конференции и молодежной школы «Информационные технологии и нанотехнологии» (ИТНТ-2017) - Самара: Новая техника, 2017. - С. 1774-1777.ru
dc.identifier.urihttp://repo.ssau.ru/handle/Informacionnye-tehnologii-i-nanotehnologii/Razrabotka-i-issledovanie-algoritmov-klasterizacii-dannyh-sverhbolshogo-obema-64149-
dc.description.abstractРабота посвящена исследованию алгоритмов кластеризации текстовых данных. В качестве объекта исследования были выбраны данные социальной сети Twitter. Собирались, обрабатывались и анализировались при этом текстовые данные. Для решения задачи получения необходимой информации были проведены исследования в области оптимизации сбора данных социальной сети Twitter. Разработано программное средство, обеспечивающее сбор необходимых данных из заданных геолокаций. Исследованы и апробированы существующие алгоритмы кластеризации данных, преимущественно большого объема.ru
dc.language.isorusru
dc.publisherНовая техникаru
dc.subjectалгоритмы кластеризации данныхru
dc.subjectданные сверхбольшого объемаru
dc.subjectтекстовый анализru
dc.subjectk-meansru
dc.subjecttf-idf метрикаru
dc.subjectldaru
dc.subjectметод судьиru
dc.titleРазработка и исследование алгоритмов кластеризации данных сверхбольшого объемаru
dc.typeArticleru
dc.textpartСовместное распределение тогда выглядит так: (2) В отличие от обычной кластеризации с априорным распределением Дирихле или обычным распределением Байеса, мы не выбираем кластер один раз, а затем «накидываем» слова из этого кластера, а для каждого слова сначала выбираем по распределению θ тему, а уже потом «набрасываем» это слово по данной теме. [18] В ходе работы э...-
Располагается в коллекциях: Информационные технологии и нанотехнологии

Файлы этого ресурса:
Файл Описание Размер Формат  
paper 319_1774-1777.pdfОсновная статья. Раздел: Наука о данных832.21 kBAdobe PDFПросмотреть/Открыть



Все ресурсы в архиве электронных ресурсов защищены авторским правом, все права сохранены.