Быстрое приближенное решение двухклассовой задачи SVM для больших обучающих совокупностей

Makarova, A.I.; Макарова, А.И.; Сулимова, В.В.; Sulimova, V.V.

Отрывок: 3.2.3. Исследование на реальных данных Предлагаемый подход экспериментально тестировался на известных наборах данных из репозитория LibSVM [6], таких как ijcnn1, mnist-576, mnist-784 и covtype, характеристики которых приведены в таблице 2. Таблица 2. Наборы реальных данных для тестирования реализаций SVM. Название набора данных Объектов на обучении Объектов на кон...

Название :	Быстрое приближенное решение двухклассовой задачи SVM для больших обучающих совокупностей
Другие названия :	Fast approximate two-class SVM learning for large training sets
Авторы/Редакторы :	Макарова, А.И. Сулимова, В.В. Makarova, A.I. Sulimova, V.V.
Дата публикации :	Май-2019
Издательство :	Новая техника
Библиографическое описание :	Макарова А.И. Быстрое приближенное решение двухклассовой задачи SVM для больших обучающих совокупностей / Макарова А.И., Сулимова В.В. // Сборник трудов ИТНТ-2019 [Текст]: V междунар. конф. и молодеж. шк. "Информ. технологии и нанотехнологии": 21-24 мая: в 4 т. / Самар. нац.-исслед. ун-т им. С. П. Королева (Самар. ун-т), Ин-т систем. обраб. изобр. РАН-фил. ФНИЦ "Кристаллография и фотоника" РАН; [под ред. В.А. Фурсова]. - Самара: Новая техника, 2019. – Т. 4: Науки о данных. - 2019. - С. 25-34.
Аннотация :	Метод опорных векторов (SVM) является удобным и надежным инструментом решения двухклассовой задачи распознавания, однако в условиях больших обучающих совокупностей он оказывается чрезвычайно трудоемким. В данной работе предлагается простой подход нахождения решения задачи SVМ, основанный на усреднении решающих правил, построенных по небольшим случайным, возможно пересекающимся подвыборкам исходной обучающей совокупности. Предлагаемый подход позволяет быстро найти приближенное (но не сильно отличающееся от точного) решение задачи SVM даже для больших обучающих совокупностей. При этом предлагаемый метод является экономичным по памяти (что обеспечивает возможность его применения для обучения на одной вычислительной машине) и, в то же время, обладает высокой степенью параллелизма, что дает возможность его эффективной реализации с применением технологий параллельных и распределенных вычислений. Support Vector Machines (SVM) is one of the most convenient and reliable tools for solving the two-class recognition problem, but it is very laborious in the case of large training sets. In this paper we propose a simple approach to finding a solution of the SVM problem, based on averaging the decision rules, which are constructed from small random, possibly intersecting subsamples of the initial training set. The proposed approach allows to quickly find an approximate (but not very different from the exact) solution of the SVM problem, even for large training sets. In addition, the proposed approach is memory-efficient and so provides the possibility of training on a single computer, and, at the same time, has a high degree of parallelism and can be effectively implemented using parallel and distributed computing technologies.
URI (Унифицированный идентификатор ресурса) :	http://repo.ssau.ru/handle/Informacionnye-tehnologii-i-nanotehnologii/Bystroe-priblizhennoe-reshenie-dvuhklassovoi-zadachi-SVM-dlya-bolshih-obuchaushih-sovokupnostei-75218
Другие идентификаторы :	Dspace\SGAU\20190416\75218
Располагается в коллекциях:	Информационные технологии и нанотехнологии

Файлы этого ресурса:

Файл	Описание	Размер	Формат
paper4.pdf	Основная статья	1.18 MB	Adobe PDF	Просмотреть/Открыть

Показать полное описание ресурса Просмотр статистики
Поделиться:

Все ресурсы в архиве электронных ресурсов защищены авторским правом, все права сохранены.

Репозиторий Самарского университета