Отрывок: На втором этапе для вычисления 𝑥𝑖′ используются значения 𝑘𝑖 (𝑞) и 𝑏𝑖 (𝑞) . Таким образом, на втором этапе каждой нити необходимо единовременно хранить в разделяемой памяти по одному элементу массивов коэффициентов и массива 𝑥. Реализация алгоритма PARACR на GPU с использованием разделяемой памяти происходит по схеме, описанной в пункте 1.3. Опишем алгоритм функции ядра. На первом этап...
Название : Реализация и исследование параллельного алгоритма циклической редукции на графическом процессорном устройстве
Авторы/Редакторы : Погорельских К. С.
Логанова Л. В.
Суханов С. В.
Министерство образования и науки Российской Федерации
Самарский национальный исследовательский университет им. С. П. Королева (Самарский университет)
Институт информатики
математики и электроники
Дата публикации : 2018
Библиографическое описание : Погорельских, К. С. Реализация и исследование параллельного алгоритма циклической редукции на графическом процессорном устройстве : вып. квалификац. работа по направлению подгот."Прикладная математика и информатика" (уровень бакалавриата) / К. С. Погорельских ; рук. работы Л. В. Логанова ; нормоконтролер С. В. Суханов ; М-во образования и науки Рос. Федерации, Самар. нац. исслед. ун-т им. С. П. Королева (Самар. ун-т), Ин-т информатики, м. - Самаpа, 2018. - on-line
Аннотация : Целью данной работы является реализация и исследование существующих алгоритмов решения СЛАУ трехдиагонального вида, основанных на методе прогонки и алгоритме циклической редукции с использованием программно-аппаратной архитектуры CUDA (с применением разделяемой и глобальной памяти).Рассмотрены алгоритм прогонки и алгоритм циклической редукции. Изучены основы работы с технологией CUDA, особенности взаимодействия с разными типами памяти.Разработаны и исследованы компьютерные программы, реализующие алгоритм прогонки и две версии алгоритма циклической редукции на CPU, на GPU без использования разделяемой памяти и на GPU с использованием разделяемой памяти.Программа написана на языке С++.
Другие идентификаторы : RU\НТБ СГАУ\ВКР20180907144745
Ключевые слова: параллельные алгоритмы
разделяемая память
метод прогонки
циклическая редукция
графический процессор
глобальная память
Располагается в коллекциях: Выпускные квалификационные работы




Все ресурсы в архиве электронных ресурсов защищены авторским правом, все права сохранены.