Отрывок: Так как количество заданных нитей 1024, то через каждые 1024 узла выделяется новый блок на видеокарте. Использование одного блока осуществляется в интервале размерностей 1 и 10. Второй и третий блоки используются до размерности 16. На последних размерностях используется 42 блока, что могло бы негативно отразиться на ускорении. Однако ускорение достаточно высокое. Вследствие особенностей работы кэш-памяти на видеокарте в определённ...
Название : Исследование эффективности высокопроизводительного алгоритма параметрической идентификации кристаллических решёток, основанного на технологии CUDA
Другие названия : Effectiveness investigation of a high-performance crystal lattice parametric identification algorithm based on CUDA technology
Авторы/Редакторы : Широканев, А.С.
Кирш, Д.В.
Куприянов, А.В.
Shirokanev, A.S.
Kirsh, D.V.
Kupriyanov, A.V.
Дата публикации : Май-2019
Издательство : Новая техника
Библиографическое описание : Широканев А.С. Исследование эффективности высокопроизводительного алгоритма параметрической идентификации кристаллических решёток, основанного на технологии CUDA / Широканев А.С., Кирш Д.В., Куприянов А.В. // Сборник трудов ИТНТ-2019 [Текст]: V междунар. конф. и молодеж. шк. "Информ. технологии и нанотехнологии": 21-24 мая: в 4 т. / Самар. нац.-исслед. ун-т им. С. П. Королева (Самар. ун-т), Ин-т систем. обраб. изобр. РАН-фил. ФНИЦ "Кристаллография и фотоника" РАН; [под ред. В.А. Фурсова]. - Самара: Новая техника, 2019. – Т. 4: Науки о данных. - 2019. - С. 72-77.
Аннотация : Исследование вещества с кристаллической структурой – сложный многоэтапный процесс. Ключевым этапом в анализе кристаллического вещества является оценивание параметров элементарной ячейки. Оценка параметров элементарной ячейки кристаллической решётки представляет собой отдельную задачу, заключающуюся в поиске параметров модели кристаллической решётки по той информации, которую удаётся извлечь из вещества. В последнее время наиболее точную информацию о структуре вещества можно получать с электронного микроскопа, линейное разрешение которого достаточно высокое, чтобы наблюдать атомарную структуру вещества. Задача оценивания параметров в данном случае сводится к реконструкции трёхмерной структуры кристаллической решётки по двумерным снимкам, полученным с электронного микроскопа, и оцениванию параметров элементарной ячейки кристаллической решётки по сформированной трёхмерной структуре. В предыдущих работах были представлены алгоритмы параметрической идентификации кристаллических решёток, основанные на решении задачи локальной оптимизации. Однако анализ большой базы данных кристаллических решёток занимает достаточно много времени. В настоящей работе предлагается технология анализа большой базы кристаллических структур, основанная на применении высокопроизводительного алгоритма параметрической идентификации кристаллических решёток с использованием технологии CUDA. Исследование эффективности технологии проводилось на видеокарте GeForce NVidia GTX 1070 Ti. При размерностях данных свыше 32 ускорение оказывается выше 70. Алгоритм эффективнее работает при использовании большого количества CUDA-блоков. The study of substances with a crystal structure is a complex multi-step process. The crucial step in the analysis of the crystalline substance is the unit cell parameter estimation. Estimation of the parameters of the unit cell of the crystal lattice is a particular problem. This problem consists in finding the parameters of the model of the crystal lattice according to the information that can be extracted from the substance. Recently, the most accurate structure substance information can be obtained using an. The electron microscope linear resolution is high enough to observe the atomic structure of a substance. The task of estimating the parameters in this case is reduced to the reconstruction of the three-dimensional structure of the crystal lattice by two-dimensional images obtained from an electron microscope, and the estimation of the parameters of the unit cell of the crystal lattice by the formed three-dimensional structure. In previous works, algorithms for the parametric identification of crystal lattices, based on solving a local optimization problem, were presented. However, the analysis of a large database of crystal lattices requires a lot of time. In this paper, a high-performance algorithm for the parametric identification of crystal lattices using the CUDA technology was proposed. Efficiency study was carry out using GeForce NVidia GTX 1070 Ti. If we process crystal structure with size more 32 the acceleration is higher than 70. We also concluded that the algorithm runs more efficiently by using a large number of CUDA blocks.
URI (Унифицированный идентификатор ресурса) : http://repo.ssau.ru/handle/Informacionnye-tehnologii-i-nanotehnologii/Issledovanie-effektivnosti-vysokoproizvoditelnogo-algoritma-parametricheskoi-identifikacii-kristallicheskih-reshetok-osnovannogo-na-tehnologii-CUDA-75223
Другие идентификаторы : Dspace\SGAU\20190417\75223
Располагается в коллекциях: Информационные технологии и нанотехнологии

Файлы этого ресурса:
Файл Описание Размер Формат  
paper9_new.pdf221.53 kBAdobe PDFПросмотреть/Открыть



Все ресурсы в архиве электронных ресурсов защищены авторским правом, все права сохранены.