Full metadata record
DC FieldValueLanguage
dc.coverage.spatialLobachevskii-DML
dc.coverage.spatialdocument processing
dc.coverage.spatialscientific journals
dc.coverage.spatialsemantic analysis
dc.coverage.spatialPDF-документы
dc.coverage.spatialсемантический анализ
dc.coverage.spatialнаучные тексты
dc.coverage.spatialЛобачевский-DML
dc.creatorNikolaev K., Nevzorova O.
dc.date2023
dc.date.accessioned2025-08-22T12:18:52Z-
dc.date.available2025-08-22T12:18:52Z-
dc.date.issued2023
dc.identifier.identifierRU\НТБ СГАУ\541884
dc.identifier.citationNikolaev, K. Annotation of mathematical formulas in PDF documents / K. Nikolaev, O. Nevzorova // Информационные технологии и нанотехнологии (ИТНТ-2023) : сб. тр. по материалам IX Междунар. конф. и молодеж. шк. (г. Самара, 17-23 апр. 2023 г.): в 6 т. / М-во науки и высш. образования Рос. Федерации, Самар. нац. исслед. ун-т им. С. П. Королева (Самар. ун-т), Ин-т систем обраб. изобр. РАН - Фил. Федер. науч.-исслед. центра "Кристаллография и фотоника" Рос. акад. наук. - Самара : Изд-во Самар. ун-та, 2023Т. 5: Науки о данных / под ред. Е. В. Гошина. - 2023. - С. 053052.
dc.identifier.urihttp://repo.ssau.ru/jspui/handle/123456789/13198-
dc.description.abstractThis article provides an overview of existing solutions for semantic analysis of mathematical documents, and also presents a method for automatic semantic analysis of documents in PDF format. This method searches for local variables in the text of the article, extracts their definitions and connects concepts with formulas. The advantage of the method over the existing ones is independence from the markup of theoriginal PDF document, which expands the scope of the method. We provide estimates of recall, precision and Fmeasure for algorithms for finding variables and linking local variables with formulas. The resulting semantic markup of the document will be used to create a collection of documents suitable for the semantic formula search service, which is part of the set of services of the Lobachevskii-DML digitalpublishing system.
dc.languageeng
dc.relation.ispartofИнформационные технологии и нанотехнологии (ИТНТ-2023) : сб. тр. по материалам IX Междунар. конф. и молодеж. шк. (г. Самара, 17-23 апр. 2023 г.): в 6
dc.sourceИнформационные технологии и нанотехнологии (ИТНТ-2023). - Т. 5 : Науки о данных
dc.subjectLobachevskii-DML
dc.subjectdocument processing
dc.subjectscientific journals
dc.subjectsemantic analysis
dc.subjectPDF-документы
dc.subjectсемантический анализ
dc.subjectнаучные тексты
dc.subjectЛобачевский-DML
dc.titleAnnotation of mathematical formulas in PDF documents
dc.typeText
dc.citation.spage053052
dc.citation.volume5
local.contributor.authorNikolaev K.
local.contributor.authorNevzorova O.
local.identifier.oldurihttp://repo.ssau.ru/handle/Informacionnye-tehnologii-i-nanotehnologii/Annotation-of-mathematical-formulas-in-PDF-documents-106037
local.identifier.oldurihttp://repo.ssau.ru/handle/Informacionnye-tehnologii-i-nanotehnologii/Annotation-of-mathematical-formulas-in-PDF-documents-106037
Appears in Collections:Информационные технологии и нанотехнологии

Files in This Item:
File SizeFormat 
978-5-7883-1921-6_2023-053052.pdf310.28 kBAdobe PDFView/Open


Items in Repository are protected by copyright, with all rights reserved, unless otherwise indicated.