Отрывок: Секция: Науки о данных Применение методов обработки естественного языка в задачах классификации радиологических отчётов VI Международная конференция и молодёжная школа «Информационные технологии и нанотехнологии» (ИТНТ-2020) 181 Стохастический градиентный спуск, для которого использовалась L1-регуляризация, а в качестве функции потерь была выбрана функц...
Название : Применение методов обработки естественного языка в задачах классификации радиологических отчётов
Другие названия : Natural language processing for radiological reports classification
Авторы/Редакторы : Слуднова, А.А.
Шутько, В.В.
Гайдель, А.В.
Никоноров, А.В.
Дата публикации : 2020
Библиографическое описание : Слуднова А.А. Применение методов обработки естественного языка в задачах классификации радиологических отчётов / А.А. Слуднова, В.В. Шутько, А.В. Гайдель, А.В. Никоноров // Информационные технологии и нанотехнологии (ИТНТ-2020). Сборник трудов по материалам VI Международной конференции и молодежной школы (г. Самара, 26-29 мая): в 4 т. / Самар. нац.-исслед. ун-т им. С. П. Королева (Самар. ун-т), Ин-т систем. обраб. изобр. РАН-фил. ФНИЦ "Кристаллография и фотоника" РАН; [под ред. В. А. Фурсова]. – Самара: Изд-во Самар. ун-та, 2020. – Том 4. Науки о данных. – 2020. – С. 179-182.
Аннотация : В работе представлены результаты исследований по использованию методов обработки естественного языка в задаче классификации медицинских текстов. В качестве исходных данных использовался набор радиологических отчётов. Задача классификации сводилась к разделению отчётов с различными диагнозами (гидроцефалия, перелом, киста или отсутствие патологий). Используемые алгоритмы классификации (SGD и другие) сравнивались с поиском по подстроке, для каждого способа рассчитывались полнота и точность прогноза. На исследуемом ограниченном наборе данных наилучшие результаты классификации были достигнуты с использованием решающего дерева на наборе весов, полученных с помощью TF-IDF. The paper presents the results of studies on the use of natural language processing methods in the classification of medical texts. A set of radiological reports was used as initial data. The classification task was reduced to the separation of reports with various diagnoses (hydrocephalus, fracture, cyst or no pathologies). The classification algorithms (SGD and others) were compared with a substring search, the accuracy and recall were calculated. On the limited data set, the best classification results were achieved by using a decision tree with TF- IDF weights.
URI (Унифицированный идентификатор ресурса) : http://repo.ssau.ru/handle/Informacionnye-tehnologii-i-nanotehnologii/Primenenie-metodov-obrabotki-estestvennogo-yazyka-v-zadachah-klassifikacii-radiologicheskih-otchetov-84843
Другие идентификаторы : Dspace\SGAU\20200730\84843
Располагается в коллекциях: Информационные технологии и нанотехнологии

Файлы этого ресурса:
Файл Описание Размер Формат  
ИТНТ-2020_том 4-179-182.pdf574.58 kBAdobe PDFПросмотреть/Открыть



Все ресурсы в архиве электронных ресурсов защищены авторским правом, все права сохранены.