ИССЛЕДОВАНИЕ ВЛИЯНИЯ ШАБЛОНА ДОСТУПА К ГЛОБАЛЬНОЙ ПАМЯТИ ГРАФИЧЕСКОГО ПРОЦЕССОРА НА ПРОИЗВОДИТЕЛЬНОСТЬ
Аннотация и ключевые слова
Аннотация (русский):
Целью данной работы является изучение влияния загруженности вычислительных ядер графического процессора и шаблона обращения к памяти на пропускную способность шины памяти и ускорение масштабирования. Предмет исследования — задача масштабируемости производительности параллельных вычислений и их ускорение. В ходе работы была проверена следующая гипотеза: при обработке изображений для многоядерных систем с общей памятью закон Густафсона — Барсиса более важен, нежели шаблон обращения к памяти при недостаточной загруженности вычислительных ядер графического процессора. Методология проведения исследования — вычислительный эксперимент с последующим анализом по-лученных данных. В ходе исследования подтверждена выдвинутая гипотеза. Для этого был проведен ряд экспериментов на различных гетерогенных вычислительных системах с поддержкой стандарта OpenCL. Анализ результатов позволяет сделать следующие выводы. Шаблон доступа к памяти начинает накладывать ограничения на производительность алгоритма только при достаточной загруженности вычислительных ядер. Видеокарты, оснащенные собственной памятью, показывают более стабильные результаты работы по сравнению с теми, что используют память, общую с центральным процессором. Область применения полученных данных — разработка алгоритмов и программного обеспечения для высокопараллельных вычислительных систем.

Ключевые слова:
GPGPU, доступ к памяти, OpenCL.
Текст

В настоящее время признано, что графические процессоры (graphical processing unit — GPU) явля-ются мощным инструментом решения задач, хорошо поддающихся распараллеливанию (General-purpose computing for graphics processing units, GPGPU — неспециализированные вычисления на графических процессорах). Однако лишь малая часть существующего программного обеспечения эффективно использует мощности графических процессоров. 

В качестве причин могут быть названы относительная новизна (широкое распространение технологии GPGPU получили в 2008–2010 гг.) и существенное архитектурное отличие от процессоров приложений (большее количество ядер,малый суммарный объем кэш-памяти).

 

Список литературы

1. OpenCL Programming Guide for the CUDA Architecture / NVIDIA corporation. - Santa Clara : NVIDIA, 2009. - 60 p.

2. AMD Accelerated Parallel Processing OpenCL Programming Guide / Advanced Micro Devices. - Sunnyvale : ADM, 2013. - 294 p.

3. Mali T600 Series OpenCL GPU Developer Guide [Электронный ресурс] / ARM. - Режим доступа: http://infocenter.arm.com/help/topic/com.arm.doc.dui0538e/DUI0538E_mali_t600_opencl_dg.pdf (дата обращения: 16.04.16).

4. Сухинов, А. И. Двумерные схемы расщепления и некоторые их приложения / А. И. Сухинов // Москва : МАКС Пресс, 2005. - 408 с.

5. Николаев, И. A. О распараллеливании треугольных итерационных методов на специализированной много-процессорной системе / И. A. Николаев, А. И. Сухинов, О. Д. Харина // Автоматика и телемеханика. - 1986. - Вып. 5. - С. 135-142. 6. Сухинов, А. И. Локально-двумерные схемы для решения многомерных параболических уравнений на вы-числительных системах матричного типа / А. И. Сухинов // Известия вузов. Математика. - 1984. - № 11. - С. 45-53.

6. Encyclopedia of Parallel Computing / Ed. D. Padua. - New York : Springer, 2011. - 2176 p.

7. Quinn, M.-J. Parallel Programming in C with MPI and OpenMP / M.-J. Quinn. - New York : McGraw-Hill, 2003. - 516 p.

8. AMD Graphic Core Next [Электронный ресурс] / Advanced Micro Devices // AMD Fusion Developer Summit 2013. - Режим доступа: http://developer.amd.com/wordpress/media/2013/06/2620_final.pdf (дата обращения: 16.04.16).

9. Global Internet Phenomena Report [Электронный ресурс] / Sandvine. - Режим доступа : https://www.sandvine.com/trends/global-internet-phenomena/ (дата обращения: 16.04.16).

Войти или Создать
* Забыли пароль?