| Title: | Быстрое приближенное решение двухклассовой задачи SVM для больших обучающих совокупностей |
| Other Titles: | Fast approximate two-class SVM learning for large training sets |
| Authors: | Макарова, А.И. Сулимова, В.В. |
| Issue Date: | May-2019 |
| Publisher: | Новая техника |
| Citation: | Макарова А.И. Быстрое приближенное решение двухклассовой задачи SVM для больших обучающих совокупностей / Макарова А.И., Сулимова В.В. // Сборник трудов ИТНТ-2019 [Текст]: V междунар. конф. и молодеж. шк. "Информ. технологии и нанотехнологии": 21-24 мая: в 4 т. / Самар. нац.-исслед. ун-т им. С. П. Королева (Самар. ун-т), Ин-т систем. обраб. изобр. РАН-фил. ФНИЦ "Кристаллография и фотоника" РАН; [под ред. В.А. Фурсова]. - Самара: Новая техника, 2019. – Т. 4: Науки о данных. - 2019. - С. 25-34. |
| Abstract: | Метод опорных векторов (SVM) является удобным и надежным инструментом решения двухклассовой задачи распознавания, однако в условиях больших обучающих совокупностей он оказывается чрезвычайно трудоемким. В данной работе предлагается простой подход нахождения решения задачи SVМ, основанный на усреднении решающих правил, построенных по небольшим случайным, возможно пересекающимся подвыборкам исходной обучающей совокупности. Предлагаемый подход позволяет быстро найти приближенное (но не сильно отличающееся от точного) решение задачи SVM даже для больших обучающих совокупностей. При этом предлагаемый метод является экономичным по памяти (что обеспечивает возможность его применения для обучения на одной вычислительной машине) и, в то же время, обладает высокой степенью параллелизма, что дает возможность его эффективной реализации с применением технологий параллельных и распределенных вычислений. Support Vector Machines (SVM) is one of the most convenient and reliable tools for solving the two-class recognition problem, but it is very laborious in the case of large training sets. In this paper we propose a simple approach to finding a solution of the SVM problem, based on averaging the decision rules, which are constructed from small random, possibly intersecting subsamples of the initial training set. The proposed approach allows to quickly find an approximate (but not very different from the exact) solution of the SVM problem, even for large training sets. In addition, the proposed approach is memory-efficient and so provides the possibility of training on a single computer, and, at the same time, has a high degree of parallelism and can be effectively implemented using parallel and distributed computing technologies. |
| URI: | http://repo.ssau.ru/jspui/handle/123456789/11074 |
| Appears in Collections: | Информационные технологии и нанотехнологии |
Files in This Item:
| File | Description | Size | Format | |
|---|---|---|---|---|
| paper4.pdf | Основная статья | 1.18 MB | Adobe PDF | View/Open |
Items in Repository are protected by copyright, with all rights reserved, unless otherwise indicated.