Реализация и исследование параллельного алгоритма циклической редукции на графическом процессорном устройстве

Погорельских К. С.; Логанова Л. В.; Суханов С. В.; Институт информатики; Министерство образования и науки Российской Федерации; математики и электроники; Самарский национальный исследовательский университет им. С. П. Королева (Самарский университет)

Отрывок: На втором этапе для вычисления 𝑥𝑖′ используются значения 𝑘𝑖 (𝑞) и 𝑏𝑖 (𝑞) . Таким образом, на втором этапе каждой нити необходимо единовременно хранить в разделяемой памяти по одному элементу массивов коэффициентов и массива 𝑥. Реализация алгоритма PARACR на GPU с использованием разделяемой памяти происходит по схеме, описанной в пункте 1.3. Опишем алгоритм функции ядра. На первом этап...

Название :	Реализация и исследование параллельного алгоритма циклической редукции на графическом процессорном устройстве
Авторы/Редакторы :	Погорельских К. С. Логанова Л. В. Суханов С. В. Министерство образования и науки Российской Федерации Самарский национальный исследовательский университет им. С. П. Королева (Самарский университет) Институт информатики математики и электроники
Дата публикации :	2018
Библиографическое описание :	Погорельских, К. С. Реализация и исследование параллельного алгоритма циклической редукции на графическом процессорном устройстве : вып. квалификац. работа по направлению подгот."Прикладная математика и информатика" (уровень бакалавриата) / К. С. Погорельских ; рук. работы Л. В. Логанова ; нормоконтролер С. В. Суханов ; М-во образования и науки Рос. Федерации, Самар. нац. исслед. ун-т им. С. П. Королева (Самар. ун-т), Ин-т информатики, м. - Самаpа, 2018. - on-line
Аннотация :	Целью данной работы является реализация и исследование существующих алгоритмов решения СЛАУ трехдиагонального вида, основанных на методе прогонки и алгоритме циклической редукции с использованием программно-аппаратной архитектуры CUDA (с применением разделяемой и глобальной памяти).Рассмотрены алгоритм прогонки и алгоритм циклической редукции. Изучены основы работы с технологией CUDA, особенности взаимодействия с разными типами памяти.Разработаны и исследованы компьютерные программы, реализующие алгоритм прогонки и две версии алгоритма циклической редукции на CPU, на GPU без использования разделяемой памяти и на GPU с использованием разделяемой памяти.Программа написана на языке С++.
Другие идентификаторы :	RU\НТБ СГАУ\ВКР20180907144745
Ключевые слова:	параллельные алгоритмы разделяемая память метод прогонки циклическая редукция графический процессор глобальная память
Располагается в коллекциях:	Выпускные квалификационные работы

Файлы этого ресурса:

Файл	Размер	Формат
Погорельских_Ксения_Сергеевна_Реализация_исследование_параллельного.pdf	2.05 MB	Adobe PDF	Просмотреть/Открыть

Показать полное описание ресурса Просмотр статистики
Поделиться:

Все ресурсы в архиве электронных ресурсов защищены авторским правом, все права сохранены.

Репозиторий Самарского университета