Отрывок: Затем происходит спад ускорения, поскольку высоки затраты на обмен данными с графическим устройством. Пиковое значение ускорения приближается к значению 3,3. 27 Можно предположить, что при увеличении размера блока мы сможем добиться большего ускорения. Проведем аналогичные эксперименты при размере блока равном 5120. Результаты вычислительных экспериментов по блочному р...
Полная запись метаданных
Поле DC Значение Язык
dc.contributor.authorШаркунов А. В.ru
dc.contributor.authorГоловашкин Д. Л.ru
dc.contributor.authorВостокин С. В.ru
dc.contributor.authorМинистерство образования и науки Российской Федерацииru
dc.contributor.authorСамарский национальный исследовательский университет им. С. П. Королева (Самарский университет)ru
dc.contributor.authorИнститут информатикиru
dc.contributor.authorматематики и электроникиru
dc.coverage.spatialплотные матрицыru
dc.coverage.spatialязык программирования CUDA Fortranru
dc.coverage.spatialблочный алгоритмru
dc.coverage.spatialвекторный алгоритмru
dc.coverage.spatialвычислительные экспериментыru
dc.coverage.spatialразложение Холецкогоru
dc.coverage.spatialграфические процессорыru
dc.creatorШаркунов А. В.ru
dc.date.issued2017ru
dc.identifierRU\НТБ СГАУ\ВКР20170919160427ru
dc.identifier.citationШаркунов, А. В. Исследование эффективности реализации разложения Холецкого плотной матрицы на графическом процессоре с помощью языка программирования CUDA Fortran : вып. квалификац. работа по спец. "Прикладная математика и информатика" / А. В. Шаркунов ; рук. работы Д. Л. Головашкин; рец. С. В. Востокин ; М-во образования и науки Рос. Федерации, Самар. нац. исслед. ун-т им. С. П. Королева (Самар. ун-т), Ин-т информатики, математики и. - Самара, 2017. - on-lineru
dc.description.abstractОбъектом исследования является блочный алгоритм разложенияХолецкого для плотных матриц.Цель работы – реализация разложения Холецкого плотной матрицы награфическом процессоре с помощью языка программирования CUDA Fortran.Разработана программная реализация блочного алгоритма Холецкогоплотной матрицы на графическом процессоре с помощью языкапрограммирования CUDA Fortran. В ходе исследования эффективностиалгоритма было получено ускорение в 6,3 раз по сравнению с реализацией нацентральном процессоре.ru
dc.format.extentЭлектрон. дан. (1 файл : 10,8 Мб)ru
dc.titleИсследование эффективности реализации разложения Холецкого плотной матрицы на графическом процессоре с помощью языка программирования CUDA Fortranru
dc.typeTextru
dc.subject.rugasnti50.01ru
dc.subject.udc004.9ru
dc.textpartЗатем происходит спад ускорения, поскольку высоки затраты на обмен данными с графическим устройством. Пиковое значение ускорения приближается к значению 3,3. 27 Можно предположить, что при увеличении размера блока мы сможем добиться большего ускорения. Проведем аналогичные эксперименты при размере блока равном 5120. Результаты вычислительных экспериментов по блочному р...-
Располагается в коллекциях: Выпускные квалификационные работы




Все ресурсы в архиве электронных ресурсов защищены авторским правом, все права сохранены.