Отрывок: • Highlighting the main formulas and text blocks. • Search for variables in text blocks. • Recognition of the main formulas and local variables. • Linking formulas and local variables. • Markup of mathematical concepts in text blocks based on OntoMathPRO ontology. • Linking the selected concepts with the variables of the formula. These tasks were performed using python programming language. The division into blocks wa...
Название : Annotation of mathematical formulas in PDF documents
Авторы/Редакторы : Nikolaev K.
Nevzorova O.
Дата публикации : 2023
Библиографическое описание : Nikolaev, K. Annotation of mathematical formulas in PDF documents / K. Nikolaev, O. Nevzorova // Информационные технологии и нанотехнологии (ИТНТ-2023) : сб. тр. по материалам IX Междунар. конф. и молодеж. шк. (г. Самара, 17-23 апр. 2023 г.): в 6 т. / М-во науки и высш. образования Рос. Федерации, Самар. нац. исслед. ун-т им. С. П. Королева (Самар. ун-т), Ин-т систем обраб. изобр. РАН - Фил. Федер. науч.-исслед. центра "Кристаллография и фотоника" Рос. акад. наук. - Самара : Изд-во Самар. ун-та, 2023Т. 5: Науки о данных / под ред. Е. В. Гошина. - 2023. - С. 053052.
Аннотация : This article provides an overview of existing solutions for semantic analysis of mathematical documents, and also presents a method for automatic semantic analysis of documents in PDF format. This method searches for local variables in the text of the article, extracts their definitions and connects concepts with formulas. The advantage of the method over the existing ones is independence from the markup of theoriginal PDF document, which expands the scope of the method. We provide estimates of recall, precision and Fmeasure for algorithms for finding variables and linking local variables with formulas. The resulting semantic markup of the document will be used to create a collection of documents suitable for the semantic formula search service, which is part of the set of services of the Lobachevskii-DML digitalpublishing system.
URI (Унифицированный идентификатор ресурса) : http://repo.ssau.ru/handle/Informacionnye-tehnologii-i-nanotehnologii/Annotation-of-mathematical-formulas-in-PDF-documents-106037
Другие идентификаторы : RU\НТБ СГАУ\541884
Ключевые слова: Lobachevskii-DML
document processing
scientific journals
semantic analysis
PDF-документы
семантический анализ
научные тексты
Лобачевский-DML
Располагается в коллекциях: Информационные технологии и нанотехнологии

Файлы этого ресурса:
Файл Размер Формат  
978-5-7883-1921-6_2023-053052.pdf310.28 kBAdobe PDFПросмотреть/Открыть



Все ресурсы в архиве электронных ресурсов защищены авторским правом, все права сохранены.