Отрывок: Набор базовых изображений представляет собой коллекцию черте- жей, оформленных в соответствии с ЕСКД. В наборе можно выделить несколько классов машин (экскава- торы, бульдозеры, автомобильные краны). С целью проверки эффективности предлагаемого подхода в плане поиска аналогов и заимствований некоторые чертежи были модифицированы (поменяны местами в...
Название : | Исследование применимости методов обработки естественного языка к задачам поиска и сравнения изображений машиностроительных чертежей |
Другие названия : | Investigation of the applicability of natural language processing methods to problems of searching and matching of machinery drawing images |
Авторы/Редакторы : | Фигура, К.Н. |
Ключевые слова : | обработка естественного языка метод tf-idf поиск изображений анализ изображений распознавание образов цифровая обработка изображений |
Дата публикации : | Авг-2022 |
Издательство : | Самарский национальный исследовательский университет |
Библиографическое описание : | Фигура, К.Н. Исследование применимости методов обработки естественного языка к задачам поиска и сравнения изображений машиностроительных чертежей / К.Н. Фигура // Компьютерная оптика. – 2022. – Т. 46, № 4. – С. 590-595. – DOI: 10.18287/2412-6179-CO-1030. |
Серия/номер : | 46;4 |
Аннотация : | Проведенные в работе исследования показывают, что применение технологии дескрипторов особых точек в чистом виде к задаче сравнения и поиска чертежей является неэффективным. Выявлено, что основной причиной этому служит наличие в чертежах большого количества идентичных элементов (рамки, основная надпись, выносные линии, элементы шрифтов и др.). Для решения данной проблемы предложено использование метода tf-idf (term frequency-inverse document frequency), широко известного в технологии обработки естественного языка. В исследовании вместо векторов слов, применяемых в оригинальной методике tf-idf, использовались дескрипторы особых точек изображений, вычисленных по алгоритмам ORB и BRISK. В результате исследования получены следующие выводы: 1) показана высокая эффективность предлагаемого подхода для поиска копии изображения-запроса в базе данных. Так, для всех изображений, предложенных для поиска и имеющих свои полные аналоги в базе данных, было выявлено наличие копий. 2) Количество выявленных изображений, являющихся модификациями изображения-запроса, разнится и зависит от алгоритма нахождения особых точек и дескрипторов. Так, при использовании ORB максимальное количество выявленных модифицированных аналогов составило 60%, при использовании BRISK – 80% от всех аналогов изображения, находящихся в базе данных. 3) Предлагаемый подход показывает ограниченную эффективность для нахождения изображений, которые можно отнести к тому же классу, что и изображение-запрос (например, чертеж экскаватора, бульдозера, автомобильного крана). Здесь максимальное количество ложных определений достигло 60%. |
URI (Унифицированный идентификатор ресурса) : | https://dx.doi.org/10.18287/2412-6179-CO-1030 http://repo.ssau.ru/handle/Zhurnal-Komputernaya-optika/Issledovanie-primenimosti-metodov-obrabotki-estestvennogo-yazyka-k-zadacham-poiska-i-sravneniya-izobrazhenii-mashinostroitelnyh-chertezhei-104024 |
Другие идентификаторы : | Dspace\SGAU\20230601\104024 |
ГРНТИ: | 20.19.29 |
Располагается в коллекциях: | Журнал "Компьютерная оптика" |
Файлы этого ресурса:
Файл | Описание | Размер | Формат | |
---|---|---|---|---|
2412-6179_2022_46-4_590-595.pdf | 930.74 kB | Adobe PDF | Просмотреть/Открыть |
Показать полное описание ресурса
Просмотр статистики
Поделиться:
Все ресурсы в архиве электронных ресурсов защищены авторским правом, все права сохранены.