| Title: | Снижение вычислительных затрат в глубоком обучении при почти идеальной линейной разделимости обучающей выборки |
| Other Titles: | Reducing computational costs in deep learning on almost linearly separable training data |
| Authors: | Куликовских, И.М. |
| Issue Date: | Apr-2020 |
| Publisher: | Самарский национальный исследовательский университет |
| Citation: | Куликовских, И.М. Снижение вычислительных затрат в глубоком обучении при почти идеальной линейной разделимости обучающей выборки / И.М. Куликовских // Компьютерная оптика. – 2020. – Т. 44, № 2. – С. 282-289. – DOI: 10.18287/2412-6179-CO-645. |
| Series/Report no.: | 44;2 |
| Abstract: | Последние исследования в области глубокого обучения показали, что метод градиентного спуска при условии почти идеальной разделимости обучающей выборки сходится к оптимальному решению, обеспечивающему максимальный зазор между классами. Даже без введения явной регуляризации положение разделяющей гиперплоскости продолжает изменяться, несмотря на то, что ошибка классификации на обучении стремится к нулю. Данное свойство так называемой «неявной» регуляризации позволяет использовать градиентный метод с более агрессивным шагом обучения, что гарантирует более низкие вычислительные затраты. Однако, хотя метод градиентного спуска обеспечивает хорошую обобщающую способность при стремлении к оптимальному решению, скорость сходимости к данному решению в условиях почти идеальной линейной разделимости значительно ниже, чем скорость сходимости, определяемая самой функцей потерь с заданным шагом обучения. В данной работе предлагается расширенная логарифмическая функция потерь, оптимизация параметров которой повышает скорость сходимости, обеспечивая границу погрешности, эквивалентную границе метода градиентного спуска. Результаты вычислительных экспериментов при классификации изображений на эталонных наборах MNIST и Fashion MNIST подтвердили эффективность предложенного подхода к снижению вычислительных затрат в условиях почти идеальной линейной разделимости обучающей выборки и обозначили направления дальнейших исследований. |
| URI: | https://dx.doi.org/10.18287/2412-6179-CO-645 http://repo.ssau.ru/jspui/handle/123456789/22811 |
| Appears in Collections: | Журнал "Компьютерная оптика" |
Files in This Item:
| File | Description | Size | Format | |
|---|---|---|---|---|
| 440219.pdf | Основная статья | 1.29 MB | Adobe PDF | View/Open |
Items in Repository are protected by copyright, with all rights reserved, unless otherwise indicated.