Отрывок: Набор базовых изображений представляет собой коллекцию черте- жей, оформленных в соответствии с ЕСКД. В наборе можно выделить несколько классов машин (экскава- торы, бульдозеры, автомобильные краны). С целью проверки эффективности предлагаемого подхода в плане поиска аналогов и заимствований некоторые чертежи были модифицированы (поменяны местами в...
Название : Исследование применимости методов обработки естественного языка к задачам поиска и сравнения изображений машиностроительных чертежей
Другие названия : Investigation of the applicability of natural language processing methods to problems of searching and matching of machinery drawing images
Авторы/Редакторы : Фигура, К.Н.
Ключевые слова : обработка естественного языка
метод tf-idf
поиск изображений
анализ изображений
распознавание образов
цифровая обработка изображений
Дата публикации : Авг-2022
Издательство : Самарский национальный исследовательский университет
Библиографическое описание : Фигура, К.Н. Исследование применимости методов обработки естественного языка к задачам поиска и сравнения изображений машиностроительных чертежей / К.Н. Фигура // Компьютерная оптика. – 2022. – Т. 46, № 4. – С. 590-595. – DOI: 10.18287/2412-6179-CO-1030.
Серия/номер : 46;4
Аннотация : Проведенные в работе исследования показывают, что применение технологии дескрипторов особых точек в чистом виде к задаче сравнения и поиска чертежей является неэффективным. Выявлено, что основной причиной этому служит наличие в чертежах большого количества идентичных элементов (рамки, основная надпись, выносные линии, элементы шрифтов и др.). Для решения данной проблемы предложено использование метода tf-idf (term frequency-inverse document frequency), широко известного в технологии обработки естественного языка. В исследовании вместо векторов слов, применяемых в оригинальной методике tf-idf, использовались дескрипторы особых точек изображений, вычисленных по алгоритмам ORB и BRISK. В результате исследования получены следующие выводы: 1) показана высокая эффективность предлагаемого подхода для поиска копии изображения-запроса в базе данных. Так, для всех изображений, предложенных для поиска и имеющих свои полные аналоги в базе данных, было выявлено наличие копий. 2) Количество выявленных изображений, являющихся модификациями изображения-запроса, разнится и зависит от алгоритма нахождения особых точек и дескрипторов. Так, при использовании ORB максимальное количество выявленных модифицированных аналогов составило 60%, при использовании BRISK – 80% от всех аналогов изображения, находящихся в базе данных. 3) Предлагаемый подход показывает ограниченную эффективность для нахождения изображений, которые можно отнести к тому же классу, что и изображение-запрос (например, чертеж экскаватора, бульдозера, автомобильного крана). Здесь максимальное количество ложных определений достигло 60%.
URI (Унифицированный идентификатор ресурса) : https://dx.doi.org/10.18287/2412-6179-CO-1030
http://repo.ssau.ru/handle/Zhurnal-Komputernaya-optika/Issledovanie-primenimosti-metodov-obrabotki-estestvennogo-yazyka-k-zadacham-poiska-i-sravneniya-izobrazhenii-mashinostroitelnyh-chertezhei-104024
Другие идентификаторы : Dspace\SGAU\20230601\104024
ГРНТИ: 20.19.29
Располагается в коллекциях: Журнал "Компьютерная оптика"

Файлы этого ресурса:
Файл Описание Размер Формат  
2412-6179_2022_46-4_590-595.pdf930.74 kBAdobe PDFПросмотреть/Открыть



Все ресурсы в архиве электронных ресурсов защищены авторским правом, все права сохранены.