Отрывок: Для расширения изначального объема данных, со- держащихся в созданном нами наборе данных, при- менялась техника аугментации, при которой при опо- ре на оригинальный датасет искусственно генериру- ются новые его элементы. Это необходимо, когда ис- пользуемый набор данных недостаточно велик или же он достаточно однороден. Аугментация производилось у случайным образом отобранных изображений из набора данных и вклю- чала в себя следующие действия: – масштабирование (изменение изнача...
Название : Детектирование книг на книжных полках при помощи глубоких нейронных сетей
Другие названия : Book spine recognition with the use of deep neural networks
Авторы/Редакторы : Калинина, М.О.
Николаев, П.Л.
Kalinina, M.O.
Nikolaev, P.L.
Ключевые слова : распознавание изображений
детектирование объектов
компьютерное зрение
машинное обучение
искусственные нейронные сети
глубокое обучение
сверточные нейронные сети
image recognition
object detection
computer vision
machine learning
artificial neural networks
deep learning
convolutional neural networks
Дата публикации : Дек-2020
Издательство : Самарский национальный исследовательский университет
Библиографическое описание : Калинина, М.О. Детектирование книг на книжных полках при помощи глубоких нейронных сетей / М.О.Калинина, П.Л. Николаев // Компьютерная оптика. – 2020. – Т. 44, № 6. – С. 968-977. – DOI: 10.18287/2412-6179-CO-731.
Серия/номер : 44;6
Аннотация : Глубокие нейронные сети в настоящее время получили широкое распространение в различных сферах деятельности человека, в том числе тех, где требуется работа с большим объемом данных, а также операции по получению и обработке информации из окружающего мира. В данной статье рассмотрено создание сверточной нейронной сети на основе архитектуры YOLO по детектированию книг в режиме реального времени. Описаны процесс создания собственного набора данных и обучение на нем глубокой нейронной сети. Приведена структура полученной нейронной сети, и рассмотрены наиболее часто используемые метрики для оценки качества ее работы. Также сделан краткий обзор существующих видов архитектур нейронных сетей. Выбранная в качестве основы для нейросети архитектура обладает рядом преимуществ, позволяющих ей в значительной мере конкурировать с другими моделями нейросетей и делающих ее наиболее подходящим вариантом для создания сети, нацеленной на детектирование объектов, так как при ее разработке были значительно снивелированы некоторые часто встречающиеся недостатки подобных сетей (проблемы с распознаванием схожих по оформлению, имеющих одинаковый цвет обложек или расположенных под наклоном книг). Результаты, полученные в ходе обучения глубокой нейронной сети, позволяют использовать ее в качестве основы для дальнейшей разработки приложения, целью которого будет являться детектирование книг по книжным корешкам. Nowadays deep neural networks play a significant part in various fields of human activity. Especially they benefit spheres dealing with large amounts of data and lengthy operations on obtaining and processing information from the visual environment. This article deals with the development of a convolutional neural network based on the YOLO architecture, intended for real-time book recognition. The creation of an original data set and the training of the deep neural network are described. The structure of the neural network obtained is presented and the most frequently used metrics for estimating the quality of the network performance are considered. A brief review of the existing types of neural network architectures is also made. YOLO architecture possesses a number of advantages that allow it to successfully compete with other models and make it the most suitable variant for creating an object detection network since it enables some of the common disadvantages of such networks to be significantly mitigated (such as recognition of similarly looking, same-color book coves or slanted books). The results obtained in the course of training the deep neural network allow us to use it as a basis for the development of the software for book spine recognition.
URI (Унифицированный идентификатор ресурса) : https://dx.doi.org/10.18287/2412-6179-CO-731
http://repo.ssau.ru/handle/Zhurnal-Komputernaya-optika/Detektirovanie-knig-na-knizhnyh-polkah-pri-pomoshi-glubokih-neironnyh-setei-86861
Другие идентификаторы : Dspace\SGAU\20210106\86861
ГРНТИ: 28.23.15
Располагается в коллекциях: Журнал "Компьютерная оптика"

Файлы этого ресурса:
Файл Описание Размер Формат  
440615.pdfОсновная статья2.26 MBAdobe PDFПросмотреть/Открыть



Все ресурсы в архиве электронных ресурсов защищены авторским правом, все права сохранены.