PTX(ISA)
덤프버전 :
분류
1. 개요[편집]
PTX는 NVIDIA 병렬 스레드 실행 가상머신의 명령어 집합 아키텍처이다.
2. 역사[편집]
2.1. PTX 8.0 (Hopper)[편집]
-
명령어 추가wgmma
2.2. PTX 6.0 (Volta)[편집]
-
명령어 추가wmma
-
} 명령어 추가barrier
-
명령어의neg
및.f16
자료형 지원.f16x2
-
명령어 추가fns
-
} 명령어 추가bar.warp.sync
-
} 명령어 추가match.sync
-
} 명령어 추가brx.idx
2.3. PTX 5.0 (Pascal)[편집]
-
,dp4a
명령어 추가 (4-way/2-way dot product with accumulation)dp2a
- 특수 레지스터
지원%clock_hi
2.4. PTX 3.0 (Kepler)[편집]
-
,mad.cc
명령어 추가madc
- 성능 모니터 카운터 특수 레지스터
추가%pm4..%pm7
2.5. PTX 2.0 (Fermi)[편집]
- 단정밀도 명령어가 subnormal number를 지원
- 1.x와의 호환성을 위해
.ftz
수식어를 지원- 단정밀도
,add
,sub
이mul
및.rm
rounding 수식어를 지원.rp
- 단정밀도 fused multiply-add (FMA) 명령어
추가fma.f32
- 기존
mad.f32
명령어는 호환성을 위해 유지- 단정밀도 및 배정밀도
,div
,rcp
명령어에 IEEE 754 대응 rounding 추가sqrt
-
및testp
명령어 추가copysign
3. 자료형[편집]
4. 명령어 목록[편집]
5. 기타[편집]
6. 관련 문서[편집]
이 문서의 내용 중 전체 또는 일부는 2024-05-11 04:48:51에 나무위키 PTX(ISA) 문서에서 가져왔습니다.