Отрывок: Определяется точность распознавания с помощью расстояния Левенштейна (см. формулу 19). В качестве входных данных использовались фотографии печатного текста, которые подвергались различного рода помехам. Помехи были разделены по следующим группам: − затенения и засветы; − монохромный и цветной шум; − помехи во время съемки; − пуассоновский и лаплассовский шум; − различная четкость и насыщенность; − физические помехи. Автоматизиров...
Название : Исследование методов предварительной обработки изображений в задаче распознавания текста
Авторы/Редакторы : Ефимов А. А.
Кудрина М. А.
Соловьева Я. В.
Министерство образования и науки Российской Федерации
Самарский национальный исследовательский университет им. С. П. Королева (Самарский университет)
Институт информатики
математики и электроники
Дата публикации : 2020
Библиографическое описание : Ефимов, А. А. Исследование методов предварительной обработки изображений в задаче распознавания текста : вып. квалификац. работа по направлению подгот. 09.04.01 "Информатика и вычислительная техника" (уровень магистратуры) / А. А. Ефимов ; рук. работы М. А. Кудрина ; нормоконтролер Я. В. Соловьева ; М-во образования и науки Рос. Федерации, Самар. нац. исслед. ун-т им. С. П. Королева (Самар. ун-т), Ин-т информатики, матема. - Самара, 2020. - on-line
Аннотация : Целью настоящей работы является разработка и реализация программного обеспечения для исследования влияния различных алгоритмов бинаризации изображения на решение задачи распознавания текста. В системе были реализованы следующие алгоритмы: бинаризация с нижним порогом, бинаризация с двойным ограничением, метод Брэдли, метод Саувола, метод Оцу, медианная фильтрация, подсчет точности распознавания с помощью расстояния Левенштейна. Тестирование разработанной системы производилось с использованием фотографий с различными видами искажений. Полученные результаты были показаны на графиках, наглядно показывающих, какие методы являются наиболее подходящими для каждого вида искажений. Создана информационно-логическая модель программной системы в нотации UML с помощью CASE-средства StarUML. Система реализована на языке Java в интегрированной среде разработки IntelliJ IDEA, пользовательский интерфейс реализован на основе фреймворка JavaFX.
Другие идентификаторы : RU\НТБ СГАУ\ВКР20200914101851
Ключевые слова: алгоритм Брэдли
Tesseract
бинаризация
интегральные изображения
расстояние Левенштейна
распознавание текстов
удаление шумов
Располагается в коллекциях: Выпускные квалификационные работы




Все ресурсы в архиве электронных ресурсов защищены авторским правом, все права сохранены.