PTX(ISA)

분류

명령어 집합

1. 개요

2. 역사

2.1. PTX 8.0 (Hopper)

2.2. PTX 6.0 (Volta)

2.3. PTX 5.0 (Pascal)

2.4. PTX 3.0 (Kepler)

2.5. PTX 2.0 (Fermi)

3. 자료형

4. 명령어 목록

5. 기타

6. 관련 문서

1 . 개요[편집]

PTX는 NVIDIA 병렬 스레드 실행 가상머신의 명령어 집합 아키텍처이다.

2 . 역사[편집]

PTX ISA 버전	CUDA 연산 능력	CUDA 버전	해당 GPU 칩셋
1.0		CUDA 1.0	G80
1.1		CUDA 1.1
1.2		CUDA 2.0
1.3		CUDA 2.1
1.4		CUDA 2.2
2.0		CUDA 3.0	GF110
2.3		CUDA 4.0
3.0		CUDA 4.1	GK104
4.0	5.0	CUDA 6.0
5.0	6.0	CUDA 8.0
6.0	7.0	CUDA 9.0

2.1 . PTX 8.0 (Hopper)[편집]

```
wgmma
```
명령어 추가

2.2 . PTX 6.0 (Volta)[편집]

```
wmma
```
명령어 추가
```
barrier
```
} 명령어 추가
```
neg
```
명령어의
```
.f16
```
및
```
.f16x2
```
자료형 지원
```
fns
```
명령어 추가
```
bar.warp.sync
```
} 명령어 추가
```
match.sync
```
} 명령어 추가
```
brx.idx
```
} 명령어 추가

2.3 . PTX 5.0 (Pascal)[편집]

```
dp4a
```
,
```
dp2a
```
명령어 추가 (4-way/2-way dot product with accumulation)
특수 레지스터
```
%clock_hi
```
지원

2.4 . PTX 3.0 (Kepler)[편집]

```
mad.cc
```
,
```
madc
```
명령어 추가
성능 모니터 카운터 특수 레지스터
```
%pm4..%pm7
```
추가

2.5 . PTX 2.0 (Fermi)[편집]

단정밀도 명령어가 subnormal number를 지원

- 1.x와의 호환성을 위해

.ftz

수식어를 지원

단정밀도
```
add
```
,
```
sub
```
,
```
mul
```
이
```
.rm
```
및
```
.rp
```
rounding 수식어를 지원
단정밀도 fused multiply-add (FMA) 명령어
```
fma.f32
```
추가

- 기존

mad.f32

명령어는 호환성을 위해 유지

단정밀도 및 배정밀도
```
div
```
,
```
rcp
```
,
```
sqrt
```
명령어에 IEEE 754 대응 rounding 추가
```
testp
```
및
```
copysign
```
명령어 추가

3 . 자료형[편집]

기본 형식	형식 지정자
부호 있는 정수	.s8, .s16, .s32, .s64
부호 없는 정수	.u8, .u16, .u32, .u64
부동소수점	.f16, .f32, .f64
비트 (자료형 없음)	.b8, .b16, .b32, .b64
Predicate	.pred

4 . 명령어 목록[편집]

5 . 기타[편집]

6 . 관련 문서[편집]

CUDA

이 문서의 내용 중 전체 또는 일부는 2024-05-11 04:48:51에 나무위키 PTX(ISA) 문서에서 가져왔습니다.

PTX(ISA)

분류

1. 개요[편집]

2. 역사[편집]

2.1. PTX 8.0 (Hopper)[편집]

2.2. PTX 6.0 (Volta)[편집]

2.3. PTX 5.0 (Pascal)[편집]

2.4. PTX 3.0 (Kepler)[편집]

2.5. PTX 2.0 (Fermi)[편집]

3. 자료형[편집]

4. 명령어 목록[편집]

5. 기타[편집]

6. 관련 문서[편집]

관련 문서