Mis on parim graafikakaart sügavaks õppimiseks?

Kui protsessor on arvuti aju, siis hing on GPU. Kuigi enamik personaalarvuteid võib töötada ilma hea GPU-ta, pole sügav õppimine ilma selleta võimalik. Seda seetõttu, et sügav õppimine nõuab keerukaid toiminguid nagu maatriksiga manipuleerimine, erakordsed arvutuslikud eeldused ja märkimisväärne arvutusvõimsus.

Kogemused on olulised oskuste arendamiseks, mis on vajalikud sügava õppe rakendamiseks uutele probleemidele. Kiire GPU tähendab kiiret praktilise kogemuse saamist kohese tagasiside kaudu. GPU-d sisaldavad paralleelsete arvutuste tegemiseks mitut südamikku. Samuti on selle teabe hõlpsaks haldamiseks ulatuslik mälu ribalaius.

Meie parim soovitus parima graafikakaardi jaoks sügavaks õppimiseks on Nvidia Geforce RTX 2080 Founders Edition. Osta see nüüd Amazonist 1940 dollari eest

Seda silmas pidades otsime vastust küsimusele: „Mis on parim graafika kaart tehisintellekti, masinõppe ja süvaõppe jaoks?”, Vaadates üle mitu graafikakaarti, mis on praegu saadaval 2021. aastal. Vaadatud kaardid:

AMD RX Vega 64

NVIDIA Tesla V100

Nvidia Quadro RTX 8000

GeForce RTX 2080 Ti

NVIDIA Titan RTX

Allpool on tulemused:

AMD RX Vega 64

Radeon RX Vega 64

Funktsioonid

Väljaandmise kuupäev: 14. august 2017
Vega arhitektuur
PCI Expressi liides
Kella kiirus: 1247 MHz
Voogprotsessorid: 4096
VRAM: 8 GB
Mälu ribalaius: 484 GB / s

Ülevaade

Kui teile ei meeldi NVIDIA GPU-d või kui teie eelarve ei võimalda teil graafikakaardile kulutada rohkem kui 500 dollarit, on AMD-l nutikas alternatiiv. Korraliku hulga RAM-i, kiire mälu ribalaiuse ja enam kui piisava voogprotsessori mahutamiseks on AMD RS Vega 64-d väga raske ignoreerida.

Vega arhitektuur on eelmiste RX-kaartide versiooniuuendus. Jõudluse poolest on see mudel lähedane GeForce RTX 1080 Ti-le, kuna mõlemal neist on sarnane VRAM. Veelgi enam, Vega toetab looduslikku pooltäpsust (FP16). ROCm ja TensorFlow töötavad, kuid tarkvara pole nii küps kui NVIDIA graafikakaartidel.

Kokkuvõttes on Vega 64 korralik GPU sügava õppimise ja tehisintellekti jaoks. See mudel maksab tublisti alla 500 USD ja saab algajatele selle töö tehtud. Professionaalsete rakenduste jaoks soovitame siiski valida NVIDIA-kaardi.

AMD RX Vega 64 Üksikasjad: Amazon

NVIDIA Tesla V100

Tesla V100

Funktsioonid:

Väljaandmise kuupäev: 7. detsember 2017
NVIDIA Volta arhitektuur
PCI-E liides
112 TFLOPS-i tensori jõudlus
640 tensori südamikku
5120 NVIDIA CUDA® südamikku
VRAM: 16 GB
Mälu ribalaius: 900 GB / s
Arvuta API-d: CUDA, DirectCompute, OpenCL ™, OpenACC®

Ülevaade:

NVIDIA Tesla V100 on puhas ja üks parimatest graafikakaartidest tehisintellekti, masinõppe ja süvaõppe jaoks. See kaart on täielikult optimeeritud ja komplektis on kõik head asjad, mida selleks vaja võib minna.

Tesla V100 on saadaval 16 GB ja 32 GB konfiguratsiooniga. Rohke VRAM-i, tehisintellekti kiirenduse, suure mälu ribalaiuse ja spetsiaalsete tenorituumade abil sügavaks õppimiseks võite olla kindel, et iga teie treeningmudel töötab sujuvalt - ja vähem aja jooksul. Täpsemalt, Tesla V100 suudab pakkuda 125TFLOPS sügavat õppimistulemust nii koolituse kui ka järelduste jaoks [3], mille võimaldas NVIDIA Volta arhitektuur.

NVIDIA Tesla V100 üksikasjad: Amazon, (1)

Nvidia Quadro RTX 8000

Nvidia Quadro Rtx 8000

Funktsioonid:

Väljalaske kuupäev: august 2018
Turingi arhitektuur
576 tensori südamikku
CUDA südamikud: 4 608
VRAM: 48 GB
Mälu ribalaius: 672 GB / s
16.3 TFLOPS-i
Süsteemi liides: PCI-Express

Ülevaade:

Spetsiaalselt sügava õppimise maatriksi aritmeetika ja arvutuste jaoks loodud Quadro RTX 8000 on tipptasemel graafikakaart. Kuna sellel kaardil on suur VRAM-maht (48 GB), on seda mudelit soovitatav kasutada eriti suurte arvutusmudelite uurimiseks. NVLinkiga koos kasutades saab mahtu suurendada kuni 96 GB VRAM-ile. Mis on palju!

72 RT ja 576 Tensori südamike kombinatsioon täiustatud töövoogude jaoks annab tulemuseks üle 130 TFLOPS-i. Võrreldes meie nimekirja kõige kallima graafikakaardiga - Tesla V100 - pakub see mudel potentsiaalselt 50 protsenti rohkem mälu ja suudab siiski vähem maksta. Isegi installitud mälus on sellel mudelil erakordne jõudlus, töötades samal ajal ühe GPU-ga suuremate partiisuurustega.

Jällegi, nagu ka Tesla V100, piirab seda mudelit ainult teie hinnakatus. See tähendab, et kui soovite investeerida tulevikku ja kvaliteetsesse andmetöötlusse, hankige RTX 8000. Kes teab, võite juhtida tehisintellekti uurimist. Tesla V100 põhineb Turingi arhitektuuril, kus V100 põhineb Volta arhitektuuril, nii et Nvidia Quadro RTX 8000 võib pidada V100-st veidi moodsamaks ja veidi võimsamaks.

Nvidia Quadro RTX 8000 Üksikasjad: Amazon

GeForce RTX 2080 Ti

Geforce RTX 2080 asutajate väljaanne

Funktsioonid:

Väljalaske kuupäev: 20. september 2018
Turingi GPU arhitektuur ja RTX-platvorm
Kella kiirus: 1350 MHz
CUDA südamikud: 4352
11 GB järgmise põlvkonna ülikiiret GDDR6-mälu
Mälu ribalaius: 616 GB / s
Võimsus: 260W

Ülevaade:

GeForce RTX 2080 Ti on eelarvevalik, mis sobib ideaalselt väikesemahuliste töökoormuste modelleerimiseks, mitte suuremahuliste koolitusarenduste jaoks. Seda seetõttu, et sellel on kaardi kohta väiksem GPU-mälu (ainult 11 GB). Selle mudeli piirangud saavad selgemaks mõne kaasaegse NLP-mudeli koolitamisel. See aga ei tähenda, et see kaart ei saaks konkureerida. RTX 2080 puhuri disain võimaldab palju tihedamaid süsteemikonfiguratsioone - kuni neli GPU-d ühes tööjaamas. Lisaks treenib see mudel närvivõrke 80 protsenti Tesla V100 kiirusega. LambdaLabsi sügava õppeedukuse võrdlusaluste järgi on RTX 2080 võrreldes Tesla V100-ga 73% FP2 ja 55% FP16 kiirus.

Vahepeal maksab see mudel ligi 7 korda vähem kui Tesla V100. Nii hinna kui ka jõudluse seisukohalt on GeForce RTX 2080 Ti suurepärane GPU sügavaks õppimiseks ja tehisintellekti arendamiseks.

GeForce RTX 2080 Ti Üksikasjad: Amazon

NVIDIA Titan RTX

NVIDIA Titan RTX graafika

Funktsioonid:

Väljaandmise kuupäev: 18. detsember 2018
Toetatud tehisintellekti jaoks mõeldud NVIDIA Turing ™ arhitektuuriga
Tehisintellekti kiirendamiseks mõeldud 576 tenorsüdamikku
130 teraFLOPS (TFLOPS) sügava õppe koolituseks
CUDA südamikud: 4608
VRAM: 24 GB
Mälu ribalaius: 672 GB / s
Soovitatav toiteallikas 650 vatti

Ülevaade:

NVIDIA Titan RTX on veel üks keskklassi graafikaprotsessor, mida kasutatakse keerukate süvaõppeoperatsioonide jaoks. Selle mudeli 24 GB VRAM on piisav enamiku partiisuurustega töötamiseks. Kui soovite koolitada suuremaid mudeleid, siduge see kaart aga NVLinki sillaga, et tegelikult oleks 48 GB VRAM-i. Sellest summast piisaks isegi suurte trafode NLP mudelite jaoks. Veelgi enam, Titan RTX võimaldab täismääraga segatäpsust treenida mudelitel (s.t.e., FP 16 koos FP32 kogunemisega). Seetõttu toimib see mudel operatsioonides, kus kasutatakse Tensori südamikke, umbes 15–20 protsenti kiiremini.

Üheks NVIDIA Titan RTX-i piiranguks on kahe ventilaatori disain. See takistab keerukamaid süsteemikonfiguratsioone, kuna seda ei saa tööjaama pakkida ilma jahutusmehhanismi oluliste muudatusteta, mida pole soovitatav.

Üldiselt on Titan suurepärane, universaalne graafikaprotsessor peaaegu kõigi sügavate õppimisülesannete täitmiseks. Võrreldes teiste üldotstarbeliste graafikakaartidega on see kindlasti kallis. Seetõttu ei soovitata seda mudelit mängijatele. Sellegipoolest hindaksid teadlased keerukate süvaõppemudelite abil täiendavat VRAM-i ja jõudluse suurendamist. Titan RTX-i hind on sisuliselt madalam kui ülaltoodud V100 ja see oleks hea valik, kui teie eelarve ei võimalda V100 hinnakujundust sügava õppimise jaoks või kui teie töökoormus ei vaja rohkem kui Titan RTX (vt huvitavaid võrdlusaluseid)

NVIDIA Titan RTX üksikasjad: Amazon

Parima graafikakaardi valimine tehisintellekti, masinõppe ja süvaõppe jaoks

Tehisintellekt, masinõpe ja sügavad õppimisülesanded töötlevad hulgaliselt andmeid. Need ülesanded võivad teie riistvarale väga nõudlikud olla. Allpool on funktsioonid, mida tuleks enne GPU ostmist meeles pidada.

Südamikud

Lihtne rusikareegel on see, et mida suurem on südamike arv, seda suurem on teie süsteemi jõudlus. Samuti tuleks arvestada südamike arvuga, eriti kui tegemist on suure hulga andmetega. NVIDIA on oma südamikud nimetanud CUDA-ks, samal ajal kui AMD kutsub nende südamikke voo protsessoriteks. Valige eelarve lubatav suurim arv töötlevaid südamikke.

Töötlusvõimsus

GPU töötlemisvõimsus sõltub süsteemis olevate südamike arvust, korrutatuna südamike käitamise taktsagedusega. Mida suurem on kiirus ja mida suurem on südamike arv, seda suurem on protsessori võimsus, mille juures teie GPU saab andmeid arvutada. See määrab ka selle, kui kiiresti teie süsteem ülesande täidab.

VRAM

Video RAM või VRAM on andmete hulga mõõtmine, mida teie süsteem korraga käsitseda saab. Kõrgem VRAM on ülitähtis, kui töötate erinevate Computer Vision mudelitega või täidate mis tahes CV Kaggle võistlusi. VRAM pole nii oluline NLP-le kui ka muude kategooriliste andmetega töötamisel.

Mälu ribalaius

Mälu ribalaius on andmete lugemise või mällu salvestamise kiirus. Lihtsamalt öeldes on see VRAM-i kiirus. Kui mõõta GB / s, tähendab suurem mälu ribalaius seda, et kaart suudab lühema aja jooksul rohkem andmeid tõmmata, mis tähendab kiiremat töötamist.

Jahutamine

GPU temperatuur võib jõudluse osas olla märkimisväärseks kitsaskohaks. Kaasaegsed GPU-d suurendavad algoritmi käitamise ajal oma kiirust maksimaalselt. Kuid niipea, kui teatud temperatuurilävi on saavutatud, vähendab GPU töötlemiskiirust ülekuumenemise eest kaitsmiseks.

Õhujahutite puhuri ventilaatori disain surub õhku süsteemist välja, samal ajal kui mitte-ventilaatorid imevad õhku sisse. Arhitektuuris, kus mitu GPU-d asetatakse üksteise kõrvale, soojendavad mitte-puhuri ventilaatorid rohkem. Kui kasutate 3–4 GPU-ga seadmes õhkjahutust, vältige ventilaatorite kasutamist.

Veel üks võimalus on vesijahutus. Ehkki see on kallis, on see meetod palju vaiksem ja tagab, et ka kõige nutikamad GPU seadistused jäävad kogu töö ajal lahedaks.

Järeldus

Enamiku kasutajate jaoks, kes on õppinud süvitsi õppima, pakuvad RTX 2080 Ti või Titan RTX teie jaoks suurimat pauku. RTX 2080 Ti ainus puudus on piiratud 11 GB suurune VRAM. Suuremate partiisuurustega treenimine võimaldab mudelitel kiiremini ja palju täpsemini treenida, säästes palju kasutaja aega. See on võimalik ainult siis, kui teil on Quadro GPU või TITAN RTX. Pooltäpsuse (FP16) kasutamine võimaldab mudelitel sobida GPU-desse, mille VRAM on ebapiisav [2]. Edasijõudnutele on Tesla V100 aga just see, kuhu peaksite investeerima. See on meie parim valik parimale graafikakaardile tehisintellekti, masinõppe ja süvaõppe jaoks. See on kõik selle artikli jaoks. Loodame, et see teile meeldis. Järgmise korrani!

Viited

Parimad GPU-d tehisintellekti, masinõppe ja süvaõppe jaoks aastal 2020
Parim süvaõppeks mõeldud GPU 2020. aastal
NVIDIA AI INFERENCE PLATFORM: tehisintellekti teenuste ja jõudluse hüppelised hüpped, andmekeskusest võrgu servani
NVIDIA V100 TENSOR CORE GPU
Titan RTXi sügava õppimise võrdlusnäitajad