Отрывок: е. примерно N e прецедентов не войдут в неё вообще. Построим решающее дерево, которое классифицирует прецеденты данной подвыборки, причём в ходе создания нового узла дерева будем выбирать признак, на основе которого производится разбиение, не из всех M признаков, а только из m случайно выбранных. Наилучший из этих m признаков может выбираться р...
Название : Сравнительное исследование алгоритмов классификации больших объемов данных
Авторы/Редакторы : Ситникова, Н.В.
Парингер, Р.А.
Куприянов, А.В.
Ключевые слова : классификация
большие данные
параллельные вычисления
MapReduce
BigData
Дата публикации : 2016
Издательство : Издательство СГАУ
Библиографическое описание : Материалы Международной конференции и молодёжной школы «Информационные технологии и нанотехнологии», с. 1096-1099
Аннотация : Приводится краткий обзор двух методов классификации: метод ближайшего соседа и случайный лес. Оба метода реализованы с помощью технологии MapReduce, с целью применения к большим объемам данных. Приводится сравнительный анализ результатов, полученных на тестовых данных Heterogeneity Activity Recognition Data Set из репозитория UCI.
URI (Унифицированный идентификатор ресурса) : http://repo.ssau.ru/handle/Informacionnye-tehnologii-i-nanotehnologii/Sravnitelnoe-issledovanie-algoritmov-klassifikacii-bolshih-obemov-dannyh-60924
ISBN : 978-5-7883-1078-7
Другие идентификаторы : Dspace\SGAU\20161219\60924
Располагается в коллекциях: Информационные технологии и нанотехнологии

Файлы этого ресурса:
Файл Описание Размер Формат  
1096-1099.pdfОсновная статья289.01 kBAdobe PDFПросмотреть/Открыть



Все ресурсы в архиве электронных ресурсов защищены авторским правом, все права сохранены.