[[분류:명령어 집합]][[분류:ARM]] [include(틀:명령어 집합)] [목차] [clearfix] == 개요 == [[ARM]]의 아키텍처와, 명령어 집합 및 관련된 기능들을 기술하는 문서.[* 여기서 아키텍처란 Arm 아키텍처를 의미한다. [[마이크로아키텍처]]는 포함하지 않는다. 자세한 내용은 [[https://developer.arm.com/documentation/102404/latest|Learn the architecture - Introducing the Arm architecture]] 문서를 참고할 것.] == 실행 상태 == [[파일:ARMv8-A_14p.jpg]] Execution state. 64비트를 지원하기 위해 추가된 구조로, ARMv8-A 아키텍처와 함께 도입되었다. AArch64와 AArch32가 있으며, 64비트 명령어를 실행할 때는 AArch64 상태로, 32비트 명령어를 실행할 때는 AArch32 상태로 변경하여 실행한다. === AArch32 === 32비트 실행 상태. ARMv7-A에서 발전한 실행 상태로, [[#A32|A32(ARM)]]과 [[#T32|T32(Thumb)]] 명령어 집합을 지원한다. 가상 주소가 32비트 레지스터에 저장된다. === AArch64[anchor(ARM64)] === 64비트 실행 상태. ARMv8-A에서 추가된 64비트 실행 상태로, [[#A64|A64]]와 고정 길이 32비트 명령어 집합을 지원한다. 가상 주소가 64비트 레지스터에 저장되며, 새로운 예외 처리 모델이 도입되었다. [[AMD64]]가 x86_64, Intel64 등 여러 이름으로 불리는것 처럼 AArch64 또한 비슷한 이유로 표현이 뒤섞여 있는데 아키텍처 개발사인 [[ARM Holdings]]의 공식 표현은 [[https://developer.arm.com/documentation/102374/latest/|AArch64]]이다. ARM측이나 오픈소스 개발 커뮤니티와 같은 엔지니어 집단에서는 AArch64라고 부르지만 [[Apple]]이나 [[Microsoft]]와 같은 일부 기업들은 ARM64라는 표기를 쓰는 경향이 있다. == 명령어 집합 == === NEON === [[https://developer.arm.com/Architectures/Neon|ARM Neon 공식문서]] 원래 명칭은 ARM Advanced [[플린 분류#SIMD|SIMD]]로, 줄여서 ASIMD라고도 부른다. ARMv6 아키텍처와 함께 추가된 SIMD 명령어 집합이다. ARMv8의 Advanced SIMD가 이 NEON을 기반으로 한다. === VFP === Vector Floating Point. ARMv6 아키텍처에서 처음으로 추가된 추가된 부동소수점 명령어 집합이다. === A32 === [[https://developer.arm.com/Architectures/A32%20Instruction%20Set%20Architecture|A32 Instruction Set Architecture]] 과거에는 ARM 명령어 집합이라 불렸으나, 64비트 명령어 집합이 추가됨에 따라 A32로 이름이 변경되었다. === T32 === [[https://developer.arm.com/Architectures/T32%20Instruction%20Set%20Architecture|T32 Instruction Set Architecture]] 과거에 Thumb, Thumb-2 등으로 불리던 명령어 집합으로, ARMv4T 아키텍처에서 처음 추가된 명령어 집합이다. 이후 T32라는 이름으로 변경되었다. 16비트, 32비트 길이를 지원한다. === A64 === [[https://developer.arm.com/Architectures/A64%20Instruction%20Set%20Architecture|A64 Instruction Set Architecture]] ARMv8-A에서 AArch64와 함께 새롭게 도입된 64비트 명령어 집합. 기존의 [[#NEON|NEON]]과 [[#VFP|VFP]] 명령어 집합들은 Advanced SIMD[* ASIMD2라고 부르기도 한다.]라는 이름으로 표준화되었으며, 여러가지 기능들이 추가되었다.[* 다만 A64에 도입된 SIMD 기능에 대해서 NEON보다 너프되었다는 비판이 있다. [[https://www.cnx-software.com/2017/08/07/how-arm-nerfed-neon-permute-instructions-in-armv8/|How ARM Nerfed NEON Permute Instructions in ARMv8]]] == 아키텍처 목록 == 아키텍처는 프로파일로 구분된다. 프로파일에는 A-Profile (Applications), R-Profile (Real-time), M-Profile (Microcontroller)이 존재하며, 아키텍처 명칭에 ARMv8'''-A''', ARMv8'''-M'''과 같이 해당 프로파일에 해당되는 알파벳이 접두어로 붙는다. 참고로 ARM에서는 ARM를 AArch라고 부르기도 한다. 즉 ARMv8-A의 구현체는 AArchv8-A이라고 부를 수 있고, Armv9-A 구현체는 AArchv9-A 구현체라고 부를 수 있다. 일부 프로그램에서는 armv8-a라는 표현 대신 aarchv8-a라고 표현하는 것을 볼 수 있다. === ARMv4 === * [[#Thumb|Thumb]] 명령어 집합 지원 === ARMv5 === * Jazelle 및 [[#VFP|VFPv2]] 명령어 집합 지원 추가 === ARMv6 === * TrustZone 지원 추가 * Thumb-2, SIMD 명령어 집합 지원 추가 === ARMv7 === * [[#NEON|Advanced SIMD(NEON)]], [[#VFP|VFPv3/v4]] 명령어 집합 지원 추가 * 가상화 지원 * LPAE(Large Physical Address Extension) 지원(선택적) === ARMv8-A === ARMv8-A는 [[ARM]]최초로 64비트를 지원하는 아키텍처로, [[2011년]] [[10월]]에 발표되었다. 64비트 명령어 집합([[#A64|A64]]) 지원이 추가되었으며, 기존 32비트 명령어 집합([[#A32|A32]]/[[#T32|T32]])과의 호환성을 제공한다. * 새로운 실행 모드인 AArch64 지원 * 31개의 범용 64bit 레지스터 * 전용 스택 포인터 레지스터 * PC(Program Counter)는 더이상 레지스터로 직접 접근 불가능 * 대부분 명령어는 A32와 같고 32bit 길이 * 대부분 명령어는 32bit와 64bit 변수를 사용 가능 * 주소는 64bit으로 사용 * SIMD (NEON) 향상 * 32개의 128bit 레지스터로 증가(기존에는 16개) * 배정밀도 포맷 지원 * AES 암/복호화 및 SHA-1,SHA-2 해쉬 명령어도 위 레지스터를 사용 * 새로운 예외처리 시스템 ==== 버전 ==== || 버전 || 발표 시기 || 비고 || ||ARMv8.0-A ||2011년 10월 || || ||ARMv8.1-A ||2014년 12월 || || ||ARMv8.2-A ||2016년 1월 || || ||ARMv8.3-A ||2016년 10월 || || ||ARMv8.4-A ||2017년 11월 || || ||ARMv8.5-A ||2018년 9월 || || ||ARMv8.6-A ||2019년 9월 || || ||ARMv8.7-A || || || ||ARMv8.8-A || || || ||ARMv8.9-A || || || ||ARMv9.0-A ||2021년 3월 ||ARMv8.5-A 기반 || ||ARMv9.1-A ||2021년 || || ||ARMv9.2-A ||2021년 || || ||ARMv9.3-A ||2021년 || || * ARMv8.0-A * ARMv8-A의 최초 버전을 이후 버전과 구분할 때 사용한다. * ARMv8.1-A * Atomic memory access 명령어 추가 * ARMv8.2-A * 52-bit 주소 지원 * FP16 데이터 처리 명령어 추가 * ARMv8.3-A * Advanced SIMD 복소수 지원 * ARMv8.4-A * 추가적인 crypto 명령어 추가 * SHA512, SHA3 명령어 추가 * ARMv8.5-A * * ARMv8.6-A * * ARMv8.7-A * * ARMv8.8-A * * ARMv8.9-A * * ARMv9.0-A * ARMv9-A의 최초 버전을 이후 버전과 구분할 때 사용된다. * ARMv8.5-A 기반 ==== [[ARMv8-A/명령어 목록|명령어 목록]] ==== [include(틀:상세 내용, 문서명=ARMv8-A/명령어 목록)] ==== ARMv8-A 호환 마이크로 아키텍처 테이블[anchor(ARMv8-A 호환 아키텍처 목록)] ==== AArch64-ARMv8-A ISA와 호환되는 물리적 구현인 마이크로 아키텍처의 테이블이다 ||<:>{{{#FFFFFF 타깃 연도}}}[* 실 제품에 적용되어 출시된 연도 기준] ||<:>{{{#FFFFFF 적용 칩셋}}} [* 가짓수가 많을 경우 메인 코어로 사용된 경우만 기재] ||<:>{{{#FFFFFF µarch[* 마이크로아키텍처]}}} ||<:>{{{#FFFFFF ISA[* 명령어셋 아키텍처]}}} ||<:>{{{#FFFFFF 디코더}}}||<:>{{{#FFFFFF 비순차 실행[br]버퍼[* ROB 엔트리 개수]}}} ||<:>{{{-2 {{{#FFFFFF ALU/FPU/LSU}}}}}}[br][* 산술 논리 연산 / 부동 소수점 연산 / 로드 스토어 유닛][* 유닛 수가 같더라도 유닛의 성능에 따라 전체 성능이 달라지므로 참고만 할 것] ||<:>{{{-2 {{{#FFFFFF L1 캐시(KB)[br]명령어+데이터}}} }}}||<:>{{{#FFFFFF 클럭당 [br]성능 [* IPC 긱벤치5 ST@1Ghz][* 숫자가 클수록 규모가 큰 아키텍처라고 볼 수 있다.]}}} || ||<-9> ARM Cortex 계열 || ||<:>2014||<:>Exynos 5433[br]Snapdragon 810[br]Snapdragon808[br] Tegra X1[br] Opeteron A1100[* 발표는 2014년 1월에 하였으나 실제품은 2016년 출시] ||<:>[[ARM Cortex-A 시리즈#Cortex-A57|Cortex-A57]]||<:>ARMv8.0-A||<:>3-wide||<:>128||<:>2/2/2||<:>{{{-2 48+32}}}||<:>127|| ||<:>2014||<:> Snapdragon 410[br]Snapdragon 615[br]BCM2837[br]MT6795[br]Exynos 7580[br]Exynos 7270[br]Exynos 9110||<:>[[ARM Cortex-A 시리즈#Cortex-A53|Cortex-A53]]||<:>ARMv8.0-A||<:>2-wide||<:>미지원||<:>2/1/1||<:>{{{-2 8-64+8-64}}}||<:>82 || ||<:>2015||<:>BCM2711[br]Snapdragon[br]650, 652, 653 ||<:>[[ARM Cortex-A 시리즈#Cortex-A72|Cortex-A72]]||<:>ARMv8.0-A||<:>3-wide||<:>128||<:>2/2/2||<:>{{{-2 48+32}}}||<:>147|| ||<:>2016||<:>Kirin 960[br]Helio x30||<:>[[ARM Cortex-A 시리즈#Cortex-A73|Cortex-A73]]||<:>ARMv8.0-A||<:>2-wide||<:>128||<:>2/2/2||<:>{{{-2 64+32}}}||<:>157|| ||<:>2017||<:>Exynos 850||<:>[[ARM Cortex-A 시리즈#Cortex-A55|Cortex-A55]]||<:>ARMv8.2-A||<:>2-wide||<:>미지원||<:>2/2/2||<:>{{{-2 16-64+16-64}}}||<:>89|| ||<:>2017||<:>Snapdragon[br] 670, 710, 712||<:>[[ARM Cortex-A 시리즈#Cortex-A75|Cortex-A75]]||<:>ARMv8.2-A||<:>3-wide||<:>128||<:>2/3/2||<:>{{{-2 64+64}}}||<:>177|| ||<:>2018||<:>Kirin 980||<:>[[ARM Cortex-A 시리즈#Cortex-A76|Cortex-A76]]||<:>ARMv8.2-A||<:>4-wide||<:>128||<:>3/2/2||<:>{{{-2 64+64}}}||<:>265|| ||<:>2019||<:>Kirin 990[br]Kirin 9000||<:>[[ARM Cortex-A 시리즈#Cortex-A77|Cortex-A77]]||<:>ARMv8.2-A||<:>4-wide||<:>160||<:>4/2/2||<:>{{{-2 32/64+32/64}}}||<:>306|| ||<:>2020||<:>Snapdragon 888[br] Exynos 2100,1080||<:>[[ARM Cortex-A 시리즈#Cortex-A78|Cortex-A78]]||<:>ARMv8.2-A||<:>4-wide||<:>160||<:>4/2/3||<:>{{{-2 64+64}}}||<:>325|| ||<:>2020||<:>Snapdragon 888[br] Exynos 2100||<:>[[Cortex-X1]]||<:>ARMv8.2-A||<:>5-wide||<:>224||<:>4/4/3||<:>{{{-2 64+64}}}||<:>380|| ||<:>2021||<:>[[스냅드래곤 8 Gen 라인업#s-2.1|스냅드래곤 8 Gen1]][[스냅드래곤 8 Gen 라인업#s-2.2|스냅드래곤 8+ Gen1]][br]Exynos 2200||<:>[[ARM Cortex-X 시리즈#Cortex-X2|Cortex-X2]]||<:>ARMv9-A||<:>5-wide||<:>288||<:>--||<:>{{{-2 64+64}}}||<:>413|| ||<-9> Apple Silicon 계열 || ||<:>2013||<:>[[Apple A7|A7]] ||<:>[[Apple Cyclone|Cyclone]]||<:>ARMv8.0-A||<:>6-wide||<:>192||<:>4/3/2||<:>{{{-2 64+64}}}||<:>200 || ||<:>2014||<:>[[Apple A8|A8]] / [[Apple A8X|A8X]] ||<:>[[Apple Typhoon|Typhoon]]||<:>ARMv8.0-A||<:>6-wide||<:>192||<:>4/3/2||<:>{{{-2 64+64}}}||<:>237 || ||<:>2015||<:>[[Apple A9|A9]] / [[Apple A9X|A9X]] ||<:>[[Apple Twister|Twister]]||<:>ARMv8.0-A||<:>6-wide||<:>192||<:>4/3/2||<:>{{{-2 64+64}}}||<:>305 || ||<|2><:>2016||<|2><:>[[Apple A10|A10]] / [[Apple A10X|A10X]] ||<:>[[Apple Hurricane|Hurricane]]||<|2><:>ARMv8.1-A||<:>6-wide||<:>||<:>4/3/2||<:>{{{-2 64+64}}}||<:>325 || ||<:>[[Apple Zephyr|Zephyr]]||<:>[* 영문 위키백과에서는 3-wide로 기재하고 있지만 차세대인 Mistral 코어와 구조가 많이 달라 섣불리 단언하기 어렵다.]||<:>||<:>||<:>{{{-2 32+32}}}||<:>[* HMP 미지원이라 Hurricane과 동시에 동작하지 못하는 구조이다. 후속 아키텍처들과 구조가 많이 달라 성능을 알아내기 어렵다. Apple 발표에 근거하면 후속작인 Mistral보다 클럭당 성능이 높은 것으로 보인다.] || ||<|2><:>2017||<|2><:>[[Apple A11|A11]] ||<:>[[Apple Monsoon|Monsoon]]||<|2><:>ARMv8.2-A||<:>7-wide||<:>||<:>6/3/||<:>{{{-2 64+64}}}||<:>382|| ||<:>[[Apple Mistral|Mistral]]||<:>3-wide||<:>||<:>2/2/1||<:>{{{-2 32+32}}}||<:>168|| ||<|2><:>2018||<|2><:>[[Apple A12|A12]] / [[Apple A12X|A12X]] / [[Apple A12Z|A12Z]],[br]([[Apple S4|S4]], [[Apple S5|S5]])[* Tempest만 사용]||<:>[[Apple Vortex|Vortex]]||<|2><:>ARMv8.3-A||<:>7-wide||<:>||<:>6/3/||<:>{{{-2 128+128}}}||<:>447|| ||<:>[[Apple Tempest|Tempest]]||<:>3-wide||<:>||<:>2/2/1||<:>{{{-2 32+32}}}||<:>196|| ||<|2><:>2019||<|2><:>[[Apple A13|A13]][br]([[Apple S6|S6]],[[Apple S7|S7]],[[Apple S8|S8]])[* Thunder만 사용]||<:>[[Apple Lightning|Lightning]]||<|2><:>ARMv8.4-A||<:>7-wide||<:>530||<:>6/3/||<:>{{{-2 128+128}}}||<:>498|| ||<:>[[Apple Thunder|Thunder]]||<:>3-wide||<:>||<:>2/2/1||<:>{{{-2 96+48}}}||<:>202|| ||<|2><:>2020||<|2><:>[[Apple A14|A14]], [[Apple M1|M1]], [[Apple M1 Pro|M1 Pro]], [[Apple M1 Max|M1 Max]]||<:>[[Apple Firestorm|Firestorm]]||<|2><:>ARMv8.5-A||<:>8-wide||<:>630||<:>7/4/4||<:>{{{-2 192+128}}}||<:>535|| ||<:>[[Apple Icestorm|Icestorm]]||<:>4-wide||<:>111||<:>3/2/2||<:>{{{-2 128+64}}}||<:>261|| ||<|2><:>2021||<|2><:>[[Apple A15|A15]], [[Apple M2|M2]]||<:>[[Apple Avalanche|Avalanche]]||<|2><:>ARMv8.6-A||<:>8-wide||<:>||<:>||<:>{{{-2 xx+xx}}}||<:> || ||<:>[[Apple Blizzard|Blizzard]]||<:>4-wide||<:>||<:>||<:>{{{-2 xx+xx}}}||<:>|| ||<-9> 삼성 몽구스 계열 || ||<:>2016||<:>Exynos 8890 ||<:>[[삼성전자/마이크로아키텍처 목록#Exynos M1|M1]]||<:>ARMv8.0-A||<:>4-wide||<:>96||<:>3/2/2||<:>{{{-2 64+32}}}||<:> 152|| ||<:>2017||<:>Exynos 8895 ||<:>[[삼성전자/마이크로아키텍처 목록#Exynos M2|M2]]||<:>ARMv8.0-A||<:>4-wide||<:>100||<:>3/2/2||<:>{{{-2 64+32}}}||<:> 159|| ||<:>2018||<:>Exynos 9810 ||<:>[[삼성전자/마이크로아키텍처 목록#Exynos M3|M3]]||<:>ARMv8.2-A||<:>6-wide||<:>228||<:>4/3/3||<:>{{{-2 64+64}}}||<:>220|| ||<:>2019||<:>Exynos 9820[br]Exynos 9825 ||<:>[[삼성전자/마이크로아키텍처 목록#Exynos M4|M4]]||<:>ARMv8.2-A||<:>6-wide||<:>228||<:>4/3/3||<:>{{{-2 64+64}}}||<:>277|| ||<:>2020||<:>Exynos 990 ||<:>[[삼성전자/마이크로아키텍처 목록#Exynos M5|M5]]||<:>ARMv8.2-A||<:>6-wide||<:>228||<:>6/3/3||<:>{{{-2 64+64}}}||<:>330|| ||<-9> NVIDIA Tegra 계열 || ||<:>2014||<:>Tegra K1(T132)[* K1은 T132, T124두가지 버전이 있었으며 T124버전엔 Cortex-A15 4코어가 들어갔고 대부분 기기는 T124버전을 사용했다. T132버전이 채용된 건 넥서스9 하나뿐이다.] ||<:>[[NVIDIA/CPU 아키텍처#Denver|Denver]] ||<:>ARMv8-A||<:>2-wide[* VLIW uOPs는 7-wide]||<:>||<:>||<:>{{{-2 128+64}}}||<:>144|| ||<:>2016||<:>TegraX2||<:>[[NVIDIA/CPU 아키텍처#Denver|Denver2]]||<:>ARMv8-A||<:>||<:>||<:>||<:>{{{-2 128+64}}}||<:>186|| ||<:>2018||<:>Xavier ||<:>[[NVIDIA/CPU 아키텍처#Carmel|Carmel]]||<:>ARMv8.2-A||<:>||<:>||<:>||<:>{{{-2 128+64}}}||<:>232|| ||<-9> 후지츠 || ||<:>2019||<:>[[후가쿠(컴퓨터)|A64FX]]||<:>[[후가쿠(컴퓨터)|A64FX]]||<:>ARMv8.2-A + SVE[* ARM SVE 512bit 벡터연산 지원]||<:>4/2-wide||<:>||<:>||<:>{{{-2 64+64}}}||<:>|| === ARMv9-A[anchor(ARMv9)][anchor(ARMv9-A)] === 2021년 4월 공식 발표되었으며, ARMv8.5까지의 모든 기능을 포함한다. ARMv8-A와 별개의 아키텍처가 아니라 ARMv8.5-A의 연장선이기 때문에, ARMv8.6 이후의 기능들은 예전과 마찬가지로 ARMv9-A의 하부 스펙으로 존재한다. ARMv9.1은 ARMv8.6 까지의 모든 기능을 포함한다. ARMv9.2은 ARMv8.7 까지의 모든 기능을 포함한다. 보안 관련 기능과 머신 러닝 관련 기능, 벡터연산이 강화되었다. 특히 Memory Tagging Extension (MTE), Branch Target Identification (BTI) 그리고 Pointer Authentication Code (PAC)의 추가가 눈에 띈다. 이들은 해커들이 주로 사용하는 해킹기법이나 취약점을 프로세서 단계에서 차단 할 수 있도록 돕는 기능이다. MTE는 큰 성능 오버헤드 없이 흔한 메모리 버그인 Buffer Overflow나 Use-After-Free 로부터 메모리를 보호한다. BTI는 동적 분기가 임의 명령어의 경계 위치가 아닌 올바른 위치인지 확인하여 제어 흐름을 보호한다. PAC는 포인터를 서명하여 포인터가 올바른 메모리 주소라는 무결성을 보장한다. NEON의 뒤를 잇는 SVE(Scalable Vector Extension)의 등장으로 벡터연산과 머신러닝 관련 기능이 크게 강화되었다. NEON은 128-bit으로 고정된 SIMD 연산을 지원하는데 비해, SVE는 최대 2048-bit 가변 길이 벡터 연산을 지원한다. 벡터 하나의 크기는 설계 할 때 128-bit부터 2048-bit까지 크기 중 하나를 선택하여 탑재한다. SSE, AVX, AVX512처럼 소프트웨어에서 개별적인 벡터 크기를 일일이 고려할 필요 없이 하나의 명령으로 처리 가능하다. == 참고 == * [[https://developer.arm.com/documentation/102404/latest|Learn the architecture - Introducing the Arm architecture]] [각주][include(틀:문서 가져옴, title=AArch64 , version=85)]