Отрывок: 3.3. Определение типов слоев Было проведено сравнение для конфигураций сети с использованием слоёв Max Pooling и без них. Во втором случае свёртка слоёв происходила за счёт слоёв Convolution2D. Обучение производилось в те- чение 10 эпох. На рис. 6 представлены графики зави- симости коэффициента Дайса обучения и валидации от количества эпох. Рис. 6. Графики зависимости коэффициента Дайса обучения и валидации от количества эпох при использовании сл...
Полная запись метаданных
Поле DC | Значение | Язык |
---|---|---|
dc.contributor.author | Лобанова, В.А. | - |
dc.contributor.author | Иванова, Ю.А. | - |
dc.date.accessioned | 2023-12-29 12:56:24 | - |
dc.date.available | 2023-12-29 12:56:24 | - |
dc.date.issued | 2022-10 | - |
dc.identifier | Dspace\SGAU\20231223\107663 | ru |
dc.identifier.citation | Лобанова, В.А. Разработка нейросетевого алгоритма распознавания надписей на изображениях реальных сцен / В.А. Лобанова, Ю.А. Иванова // Компьютерная оптика. – 2022. – Т. 46, № 5. – С. 790-800. – DOI: 10.18287/2412-6179-CO-1047. | ru |
dc.identifier.uri | https://dx.doi.org/10.18287/2412-6179-CO-1047 | - |
dc.identifier.uri | http://repo.ssau.ru/handle/Zhurnal-Komputernaya-optika/Razrabotka-neirosetevogo-algoritma-raspoznavaniya-nadpisei-na-izobrazheniyah-realnyh-scen-107663 | - |
dc.description.abstract | Работа посвящена проектированию и реализации нейросетевого алгоритма детектирования надписей на изображениях реальных сцен. Проведен обзор существующих нейросетевых и классических моделей, в качестве базовой была выбрана модель U-net. На ее основе предложен и реализован алгоритм детектирования текстовых областей на изображениях. В ходе проведения экспериментов были определены следующие параметры нейронной сети: размеры входных изображений, количество и типы составляющих её слоёв. В качестве предобработки рассматривались билатеральные фильтры сглаживания и сглаживающие частотные фильтры. Увеличение исходной базы изображений KAIST Scene Text Database достигается за счёт применения поворотов, сжатия и разбиения входящих в неё изображений. Полученные результаты превосходят другие методы по значению F-меры и достигают 0,88. | ru |
dc.language.iso | rus | ru |
dc.publisher | Самарский национальный исследовательский университет | ru |
dc.relation.ispartofseries | 46;5 | - |
dc.subject | детектирование текстовых областей | ru |
dc.subject | U-Net | ru |
dc.subject | изображения реальных сцен | ru |
dc.subject | сегментация изображений | ru |
dc.title | Разработка нейросетевого алгоритма распознавания надписей на изображениях реальных сцен | ru |
dc.title.alternative | Development of software for the segmentation of text areas in real-scene images | ru |
dc.type | Article | ru |
dc.textpart | 3.3. Определение типов слоев Было проведено сравнение для конфигураций сети с использованием слоёв Max Pooling и без них. Во втором случае свёртка слоёв происходила за счёт слоёв Convolution2D. Обучение производилось в те- чение 10 эпох. На рис. 6 представлены графики зави- симости коэффициента Дайса обучения и валидации от количества эпох. Рис. 6. Графики зависимости коэффициента Дайса обучения и валидации от количества эпох при использовании сл... | - |
dc.classindex.scsti | 28.23.37 | - |
Располагается в коллекциях: | Журнал "Компьютерная оптика" |
Файлы этого ресурса:
Файл | Описание | Размер | Формат | |
---|---|---|---|---|
2412-6179_2022_46_5_790-800.pdf | 1.3 MB | Adobe PDF | Просмотреть/Открыть |
Показать базовое описание ресурса
Просмотр статистики
Поделиться:
Все ресурсы в архиве электронных ресурсов защищены авторским правом, все права сохранены.