Разработка нейросетевого алгоритма распознавания надписей на изображениях реальных сцен

Иванова, Ю.А.; Лобанова, В.А.

Отрывок: 3.3. Определение типов слоев Было проведено сравнение для конфигураций сети с использованием слоёв Max Pooling и без них. Во втором случае свёртка слоёв происходила за счёт слоёв Convolution2D. Обучение производилось в те- чение 10 эпох. На рис. 6 представлены графики зави- симости коэффициента Дайса обучения и валидации от количества эпох. Рис. 6. Графики зависимости коэффициента Дайса обучения и валидации от количества эпох при использовании сл...

Полная запись метаданных

Поле DC	Значение	Язык
dc.contributor.author	Лобанова, В.А.	-
dc.contributor.author	Иванова, Ю.А.	-
dc.date.accessioned	2023-12-29 12:56:24	-
dc.date.available	2023-12-29 12:56:24	-
dc.date.issued	2022-10	-
dc.identifier	Dspace\SGAU\20231223\107663	ru
dc.identifier.citation	Лобанова, В.А. Разработка нейросетевого алгоритма распознавания надписей на изображениях реальных сцен / В.А. Лобанова, Ю.А. Иванова // Компьютерная оптика. – 2022. – Т. 46, № 5. – С. 790-800. – DOI: 10.18287/2412-6179-CO-1047.	ru
dc.identifier.uri	https://dx.doi.org/10.18287/2412-6179-CO-1047	-
dc.identifier.uri	http://repo.ssau.ru/handle/Zhurnal-Komputernaya-optika/Razrabotka-neirosetevogo-algoritma-raspoznavaniya-nadpisei-na-izobrazheniyah-realnyh-scen-107663	-
dc.description.abstract	Работа посвящена проектированию и реализации нейросетевого алгоритма детектирования надписей на изображениях реальных сцен. Проведен обзор существующих нейросетевых и классических моделей, в качестве базовой была выбрана модель U-net. На ее основе предложен и реализован алгоритм детектирования текстовых областей на изображениях. В ходе проведения экспериментов были определены следующие параметры нейронной сети: размеры входных изображений, количество и типы составляющих её слоёв. В качестве предобработки рассматривались билатеральные фильтры сглаживания и сглаживающие частотные фильтры. Увеличение исходной базы изображений KAIST Scene Text Database достигается за счёт применения поворотов, сжатия и разбиения входящих в неё изображений. Полученные результаты превосходят другие методы по значению F-меры и достигают 0,88.	ru
dc.language.iso	rus	ru
dc.publisher	Самарский национальный исследовательский университет	ru
dc.relation.ispartofseries	46;5	-
dc.subject	детектирование текстовых областей	ru
dc.subject	U-Net	ru
dc.subject	изображения реальных сцен	ru
dc.subject	сегментация изображений	ru
dc.title	Разработка нейросетевого алгоритма распознавания надписей на изображениях реальных сцен	ru
dc.title.alternative	Development of software for the segmentation of text areas in real-scene images	ru
dc.type	Article	ru
dc.textpart	3.3. Определение типов слоев Было проведено сравнение для конфигураций сети с использованием слоёв Max Pooling и без них. Во втором случае свёртка слоёв происходила за счёт слоёв Convolution2D. Обучение производилось в те- чение 10 эпох. На рис. 6 представлены графики зави- симости коэффициента Дайса обучения и валидации от количества эпох. Рис. 6. Графики зависимости коэффициента Дайса обучения и валидации от количества эпох при использовании сл...	-
dc.classindex.scsti	28.23.37	-
Располагается в коллекциях:	Журнал "Компьютерная оптика"

Файлы этого ресурса:

Файл	Описание	Размер	Формат
2412-6179_2022_46_5_790-800.pdf		1.3 MB	Adobe PDF	Просмотреть/Открыть

Показать базовое описание ресурса Просмотр статистики
Поделиться:

Все ресурсы в архиве электронных ресурсов защищены авторским правом, все права сохранены.

Репозиторий Самарского университета