본문 바로가기

추천 검색어

실시간 인기 검색어

학술논문

CPU-GPU환경에서 효율적인 메인메모리 접근을 위한 융합 프로세서 구조 개발

이용수 42

영문명
A Development of Fusion Processor Architecture for Efficient Main Memory Access in CPU-GPU Environment
발행기관
한국전자통신학회
저자명
박현문(Hyun-Moon Park) 권진산(Jin-San Kwon) 황태호(Tae-Ho Hwang) 김동순(Dong-Sun Kim)
간행물 정보
『한국전자통신학회 논문지』제11권 제2호, 151~158쪽, 전체 8쪽
주제분류
공학 > 전자/정보통신공학
파일형태
PDF
발행일자
2016.02.28
4,000

구매일시로부터 72시간 이내에 다운로드 가능합니다.
이 학술논문 정보는 (주)교보문고와 각 발행기관 사이에 저작물 이용 계약이 체결된 것으로, 교보문고를 통해 제공되고 있습니다.

1:1 문의
논문 표지

국문 초록

이기종시스템 구조(HSA)는 두 유닛의 각각에 메모리 폴(pools)이 가상메모리를 통해 공유할 수 있게 됨에 따라 CPU와 GPU 아키텍처의 오랜 문제를 해결하였다. 그러나 물리적 실제 시스템에서는 가상메모리 처리를 위해 GPU와 GPU 사이의 빈번한 메모리 이동으로 병목현상(Bottleneck)과 일관성 요청(Coherence request)의 오버헤드를 갖게 된다. 본 연구는 CPU와 GPU간의 효율적인 메인 메모리 접근방안으로 퓨전프로세서 알고리즘을 제안하였다. CPU가 요청한 처리할 메모리 영역을 GPU의 코어에 맞게 분배·제어해주는 기능으로 작업관리자(Job Manager)와 Re-mapper, Pre-fetcher를 제안하였다. 이를 통해 CPU와 GPU간의 빈번한 메시지도 감소되고 CPU의 메모리주소에 없는 Page-Table 요청이 낮아져 두 매체간의 효율성이 증대되었다. 제안한 알고리즘의 검증 방안으로 QEMU(:short for Quick EMUlator)기반의 에뮬레이터를 개발하고 CUDA(:Compute Unified Device. Architecture), OpenMP, OpenCL 등의 알고리즘과 비교평가를 하였다. 성능평가 결과, 본 연구에서 제안한 융합 프로세서 구조를 기존과 비교했을 때 최대 198%이상 빠르게 처리되면서 메모리 복사, 캐시미스 등의 오버헤드를 최소화하였다.

영문 초록

The HSA resolves an old problem with existing CPU and GPU architectures by allowing both units to directly access each other's memory pools via unified virtual memory. In a physically realized system, however, frequent data exchanges between CPU and GPU for a virtual memory block result bottlenecks and coherence request overheads. In this paper, we propose Fusion Processor Architecture for efficient access of main memory from both CPU and GPU. It consists of Job Manager, Re-mapper, and Pre-fetcher to control, organize, and distribute work loads and working areas for GPU cores. These components help on reducing memory exchanges between the two processors and improving overall efficiency by eliminating faulty page table requests. To verify proposed algorithm architectures, we develop an emulator based on QEMU, and compare several architectures such as CUDA(Compute Unified Device Architecture), OpenMP, OpenCL. As a result, Proposed fusion processor architectures show 198% faster than others by removing unnecessary memory copies and cache-miss overheads.

목차

Ⅰ. 서 론
Ⅱ. 이기종 시스템 구조와 퓨전아키텍처의 비교
Ⅲ. 제안된 융합 프로세서 구조
Ⅳ. QEMU를 통한 성능비교
Ⅴ. 결 론

키워드

해당간행물 수록 논문

참고문헌

교보eBook 첫 방문을 환영 합니다!

신규가입 혜택 지급이 완료 되었습니다.

바로 사용 가능한 교보e캐시 1,000원 (유효기간 7일)
지금 바로 교보eBook의 다양한 콘텐츠를 이용해 보세요!

교보e캐시 1,000원
TOP
인용하기
APA

박현문(Hyun-Moon Park),권진산(Jin-San Kwon),황태호(Tae-Ho Hwang),김동순(Dong-Sun Kim). (2016).CPU-GPU환경에서 효율적인 메인메모리 접근을 위한 융합 프로세서 구조 개발. 한국전자통신학회 논문지, 11 (2), 151-158

MLA

박현문(Hyun-Moon Park),권진산(Jin-San Kwon),황태호(Tae-Ho Hwang),김동순(Dong-Sun Kim). "CPU-GPU환경에서 효율적인 메인메모리 접근을 위한 융합 프로세서 구조 개발." 한국전자통신학회 논문지, 11.2(2016): 151-158

결제완료
e캐시 원 결제 계속 하시겠습니까?
교보 e캐시 간편 결제