Ampere (microarquitectura)

De la Viquipèdia, l'enciclopèdia lliure
Infotaula equipament informàticAmpere
DissenyadorNvidia Modifica el valor a Wikidata
Llançament1r setembre 2020 Modifica el valor a Wikidata
Característiques de CPUs
Conjunt d'instruccionsUnitat de procés gràfic
MicroarquitecturaAmpere de Nvidia
Turing Modifica el valor a Wikidata

Ampere és el nom en clau d'una microarquitectura d'unitat de processament gràfic (GPU) desenvolupada per Nvidia com a successora de les arquitectures Volta i Turing, anunciades oficialment el 14 de maig de 2020. Porta el nom del matemàtic i físic francès André-Marie Ampère.[1][2] Nvidia va anunciar la propera generació de GPU de consum de la sèrie GeForce 30 en un esdeveniment especial de GeForce l'1 de setembre de 2020.[3][4] Nvidia va anunciar la GPU A100 de 80 GB a SC20 el 16 de novembre de 2020.[5] Les targetes gràfiques RTX mòbils i la RTX 3060 es van revelar el 12 de gener de 2021.[6] Nvidia també va anunciar el successor d'Ampere, Hopper, a GTC 2022, i "Ampere Next Next" per al llançament de 2024 a la GPU Technology Conference 2021.

Les millores arquitectòniques de l'arquitectura Ampere inclouen les següents:

  • CUDA Compute Capability 8.0 per a A100 i 8.6 per a la sèrie GeForce 30.[7]
  • Procés FinFET de 7 nm de TSMC per a A100.
  • Versió personalitzada de 8 nm de Samsung per a la sèrie GeForce 30.[8]
  • Nuclis Tensor de tercera generació amb suport FP16, bfloat16, TensorFloat-32 (TF32) i FP64 i acceleració de dispersió.[9] Els nuclis Tensor individuals tenen 256 operacions FP16 FMA per segon 4x de potència de processament (només GA100, 2x a GA10x) en comparació amb les generacions anteriors de Tensor Core; el recompte de nuclis del tensor es redueix a un per SM.
  • Nuclis de traçat de raigs de segona generació; traçat de raigs, ombrejat i càlcul simultània per a la sèrie GeForce 30.
  • Memòria d'amplada de banda alta 2 (HBM2) en A100 de 40 GB i A100 de 80 GB.
  • Memòria GDDR6X per a GeForce RTX 3090, RTX 3080 Ti, RTX 3080, RTX 3070 Ti.
  • Doble nucli FP32 per SM a les GPU GA10x.
  • NVLink 3.0 amb un rendiment de 50 Gbit/s per parell.[9]
  • PCI Express 4.0 amb suport SR-IOV (SR-IOV només es reserva per a A100).
  • Funció de virtualització de GPU multiinstància (MIG) i partició de GPU a l'A100 que admet fins a set instàncies.
  • Conjunt de funcions PureVideo K descodificació de vídeo de maquinari amb descodificació de maquinari AV1 [10] per a la sèrie GeForce 30 i conjunt de funcions J per a A100.
  • 5 NVDEC per a A100.
  • Afegeix una nova descodificació JPEG de 5 nuclis basada en maquinari (NVJPG) amb YUV420, YUV422, YUV444, YUV400, RGBA. No s'ha de confondre amb Nvidia NVJPEG (biblioteca accelerada per GPU per a la codificació/descodificació JPEG).

Referències[modifica]

  1. Newsroom, NVIDIA. «NVIDIA's New Ampere Data Center GPU in Full Production». NVIDIA Newsroom Newsroom. [Consulta: 1r setembre 2022].
  2. «NVIDIA Ampere Architecture In-Depth» (en anglès). NVIDIA Developer Blog, May 14, 2020. [Consulta: 1r setembre 2022].
  3. Newsroom, NVIDIA. «NVIDIA Delivers Greatest-Ever Generational Leap with GeForce RTX 30 Series GPUs» (en anglès). NVIDIA Newsroom Newsroom. [Consulta: 1r setembre 2022].
  4. «NVIDIA GeForce Ultimate Countdown» (en anglès). NVIDIA. [Consulta: 1r setembre 2022].
  5. «NVIDIA Doubles Down: Announces A100 80GB GPU, Supercharging World's Most Powerful GPU for AI Supercomputing» (en anglès). [Consulta: 1r setembre 2022].
  6. «Join us for an NVIDIA GeForce RTX: Game on Special Broadcast Event» (en anglès). [Consulta: 1r setembre 2022].
  7. «I.7. Compute Capability 8.x» (en anglès). docs.nvidia.com. [Consulta: 23 setembre 2020].
  8. B., Dominik. «Samsung's old 8nm tech at the heart of NVIDIA's monstrous Ampere cards» (en anglès). SamMobile. https://www.sammobile.com,+01-09-2022.+[Consulta: 19 setembre 2020].
  9. 9,0 9,1 Smith , May 14, 2020.
  10. «GeForce RTX 30 Series GPUs: Ushering In A New Era of Video Content With AV1 Decode» (en https://www.sammobile.com).+NVIDIA. [Consulta: 1r setembre 2022].