Nvidia představuje mobilní profi karty RTX 500 a RTX 1000 nejen pro AI

05.03.2024 13:55
Nvidia má pro profesionální nasazení v nabídce nové mobilní low-endové grafické karty RTX 500 a RTX 1000 Ada Generation. Ty sice moc nepotěší počtem CUDA jader, mohou mít ale nízkou spotřebu a mají výrazný nárůst výkonu pro AI.
 
Pracovní notebooky s profesionálními verzemi grafických karet budou moci nově využívat dvě low-endová řešení společnosti Nvidia. Ta totiž představila GPU RTX 500 a RTX 1000 Ada Generation. Tyto modely tvoří základ nabídky, nebudou tedy zrovna extrémně výkonná, přesto mají proti předchozím generacím nabídnout 2krát vyšší výkon v ray-tracinu, totéž v propustnosti Tensor Core, hrubý výkon v FP32 má vzrůst o 30 % a násobně pak v AI. Nechybí ani podpora DLSS 3 a hardwarové kódování videa AV1.
 
Nvidia RTX 500 Ada má jen 2048 CUDA jader s 16 RT Core a 64 Tensor Core, což dle výrobce stačí na hrubý výkon 9,2 TFLOPS v FP32 a 147,4 Tensor TFLOPS. Bavíme se zde tedy o výkonu někde na úrovni GeForce RTX 3050. To ale současně znamená výrazně navýšený výkon pro úlohy AI, takže generativní AI jako Stable Diffusion může být až 14krát rychlejší než na CPU, editace fotografií pomocí AI bude proti procesoru 3krát rychlejší (i moderním mnohojádrovým procesorům může AI odšumování zabrat minuty). Máme tu jen 4 GB GDDR6 VRAM, což ale pro úlohy AI nezní zrovna moc pozitivně. Tato paměť běží na 64bitové sběrnici a dosahuje propustnosti 192 GB/s. Pokud jde o spotřebu, ta je konfigurovatelná v rozsahu od 35 do 60 W.
 
Výkonnější Nvidia RTX 1000 Ada dostává 2560 CUDA jader, 20 RT Core a 80 Tensor Core, hrubý výkon v FP32 se pak dostává na 12,1 TFLOPS a 193 Tensor TFLOPS. Kapacita paměti je v tomto případě 6 GB, jde o typ GDDR6 a běží na 96bitové sběrnici, což také zvyšuje propustnost na 192 GB/s. Spotřeba je nastavitelná od příjemně nízkých 35 W až po opravdu dost vysokých 140 W. Všechny karty podporují DisplayPort 1.4a a jsou určeny pro sběrnici PCIe 4.0.
 
  RTX A500 RTX A1000 4GB RTX A1000 6GB RTX 500 Ada RTX 1000 Ada
CUDA jádra 2048 2048 2560 2048 2560
RT Core 16 16 20 16 20
Tensor Core 64 64 80 64 80
FP32 TFLOPS 7 7,5 9,3 9,2 12,1
Tensor TFLOPS 56 59,7 74,6 147,4 193
Kapacita paměti 4 GB 4 GB 6 GB 4 GB 6 GB
Sběrnice 64-bit 128-bit 96-bit 64-bit 96-bit
Propustnost 112 GB/s 224 GB/s 168 GB/s 128 GB/s 192 GB/s
Spotřeba 20-60 W 35-95 W 35-95 W 35-60 W 35-140 W