Отрывок: Записывается как: #pragma acc kernels { структурный блок } Конструкция data определяет область программы, в которой данные доступны для устройства. Существует несколько опций для этой директивы: copy. В начале блока происходит проверка на наличие данных на устройстве, если они отсутствуют, происходит копирование с хоста на устройство, иначе программа продолжает использовать ресурсы. По окончании блока, данные выгружаются с устройства на хост, память на устройстве освобождается...
Название : | Исследование эффективности реализации разностного решения уравнения теплопроводности с помощью технологии параллельного программирования OpenACC |
Авторы/Редакторы : | Курганский И. Н. Головашкин Д. Л. Востокин С. В. Министерство образования и науки Российской Федерации Самарский национальный исследовательский университет им. С. П. Королева (Самарский университет) Институт информатики математики и электроники |
Дата публикации : | 2017 |
Библиографическое описание : | Курганский, И. Н. Исследование эффективности реализации разностного решения уравнения теплопроводности с помощью технологии параллельного программирования OpenACC : вып. квалификац. работа по спец. "Прикладная математика и информатика" / И. Н. Курганский ; рук. работы Д. Л. Головашкин; рец. С. В. Востокин ; М-во образования и науки Рос. Федерации, Самар. нац. исслед. ун-т им. С. П. Королева (Самар. ун-т), Ин-т информатики, математики. - Самара, 2017. - on-line |
Аннотация : | Объектом исследования является методика применения технологии OpenACC для решения сеточных уравнений явной разностной схемы.Цель работы – разработка приемов программной реализации разностного решения уравнения теплопроводности с помощью технологии параллельного программирования OpenACC.Для исследования методики применения технологии OpenACC выбрано уравнение теплопроводности и его разностная схема. Разработана программная реализация разностного решения этого уравнения теплопроводности с использованием технологий OpenACC. В ходе многочисленных вычислительных экспериментов получена методика выбора директив OpenACC для достижения ускорения. Произведено сравнение с аналогом написанном с использованием технологии CUDA С. Выявлены достоинства и недостатки разработанного подхода. |
Другие идентификаторы : | RU\НТБ СГАУ\ВКР20170919152516 |
Ключевые слова: | OpenACC явная разностная схема технология параллельного программирования программно-аппаратная архитектура CUDA центральный процессор графический процессор уравнение теплопроводности |
Располагается в коллекциях: | Выпускные квалификационные работы |
Файлы этого ресурса:
Файл | Размер | Формат | |
---|---|---|---|
Курганский_Илья_Николаевич_Исследование_эффективности_реализации__разностного.pdf | 1.61 MB | Adobe PDF | Просмотреть/Открыть |
Показать полное описание ресурса
Просмотр статистики
Поделиться:
Все ресурсы в архиве электронных ресурсов защищены авторским правом, все права сохранены.