Kogemused on olulised oskuste arendamiseks, mis on vajalikud sügava õppe rakendamiseks uutele probleemidele. Kiire GPU tähendab kiiret praktilise kogemuse saamist kohese tagasiside kaudu. GPU-d sisaldavad paralleelsete arvutuste tegemiseks mitut südamikku. Samuti on selle teabe hõlpsaks haldamiseks ulatuslik mälu ribalaius.
Seda silmas pidades otsime vastust küsimusele: „Mis on parim graafika kaart tehisintellekti, masinõppe ja süvaõppe jaoks?”, Vaadates üle mitu graafikakaarti, mis on praegu saadaval 2021. aastal. Vaadatud kaardid:
- AMD RX Vega 64
- NVIDIA Tesla V100
- Nvidia Quadro RTX 8000
- GeForce RTX 2080 Ti
- NVIDIA Titan RTX
Allpool on tulemused:
AMD RX Vega 64
Radeon RX Vega 64
Funktsioonid
- Väljaandmise kuupäev: 14. august 2017
- Vega arhitektuur
- PCI Expressi liides
- Kella kiirus: 1247 MHz
- Voogprotsessorid: 4096
- VRAM: 8 GB
- Mälu ribalaius: 484 GB / s
Ülevaade
Kui teile ei meeldi NVIDIA GPU-d või kui teie eelarve ei võimalda teil graafikakaardile kulutada rohkem kui 500 dollarit, on AMD-l nutikas alternatiiv. Korraliku hulga RAM-i, kiire mälu ribalaiuse ja enam kui piisava voogprotsessori mahutamiseks on AMD RS Vega 64-d väga raske ignoreerida.
Vega arhitektuur on eelmiste RX-kaartide versiooniuuendus. Jõudluse poolest on see mudel lähedane GeForce RTX 1080 Ti-le, kuna mõlemal neist on sarnane VRAM. Veelgi enam, Vega toetab looduslikku pooltäpsust (FP16). ROCm ja TensorFlow töötavad, kuid tarkvara pole nii küps kui NVIDIA graafikakaartidel.
Kokkuvõttes on Vega 64 korralik GPU sügava õppimise ja tehisintellekti jaoks. See mudel maksab tublisti alla 500 USD ja saab algajatele selle töö tehtud. Professionaalsete rakenduste jaoks soovitame siiski valida NVIDIA-kaardi.
AMD RX Vega 64 Üksikasjad: Amazon
NVIDIA Tesla V100
Tesla V100
Funktsioonid:
- Väljaandmise kuupäev: 7. detsember 2017
- NVIDIA Volta arhitektuur
- PCI-E liides
- 112 TFLOPS-i tensori jõudlus
- 640 tensori südamikku
- 5120 NVIDIA CUDA® südamikku
- VRAM: 16 GB
- Mälu ribalaius: 900 GB / s
- Arvuta API-d: CUDA, DirectCompute, OpenCL ™, OpenACC®
Ülevaade:
NVIDIA Tesla V100 on puhas ja üks parimatest graafikakaartidest tehisintellekti, masinõppe ja süvaõppe jaoks. See kaart on täielikult optimeeritud ja komplektis on kõik head asjad, mida selleks vaja võib minna.
Tesla V100 on saadaval 16 GB ja 32 GB konfiguratsiooniga. Rohke VRAM-i, tehisintellekti kiirenduse, suure mälu ribalaiuse ja spetsiaalsete tenorituumade abil sügavaks õppimiseks võite olla kindel, et iga teie treeningmudel töötab sujuvalt - ja vähem aja jooksul. Täpsemalt, Tesla V100 suudab pakkuda 125TFLOPS sügavat õppimistulemust nii koolituse kui ka järelduste jaoks [3], mille võimaldas NVIDIA Volta arhitektuur.
NVIDIA Tesla V100 üksikasjad: Amazon, (1)
Nvidia Quadro RTX 8000
Nvidia Quadro Rtx 8000
Funktsioonid:
- Väljalaske kuupäev: august 2018
- Turingi arhitektuur
- 576 tensori südamikku
- CUDA südamikud: 4 608
- VRAM: 48 GB
- Mälu ribalaius: 672 GB / s
- 16.3 TFLOPS-i
- Süsteemi liides: PCI-Express
Ülevaade:
Spetsiaalselt sügava õppimise maatriksi aritmeetika ja arvutuste jaoks loodud Quadro RTX 8000 on tipptasemel graafikakaart. Kuna sellel kaardil on suur VRAM-maht (48 GB), on seda mudelit soovitatav kasutada eriti suurte arvutusmudelite uurimiseks. NVLinkiga koos kasutades saab mahtu suurendada kuni 96 GB VRAM-ile. Mis on palju!
72 RT ja 576 Tensori südamike kombinatsioon täiustatud töövoogude jaoks annab tulemuseks üle 130 TFLOPS-i. Võrreldes meie nimekirja kõige kallima graafikakaardiga - Tesla V100 - pakub see mudel potentsiaalselt 50 protsenti rohkem mälu ja suudab siiski vähem maksta. Isegi installitud mälus on sellel mudelil erakordne jõudlus, töötades samal ajal ühe GPU-ga suuremate partiisuurustega.
Jällegi, nagu ka Tesla V100, piirab seda mudelit ainult teie hinnakatus. See tähendab, et kui soovite investeerida tulevikku ja kvaliteetsesse andmetöötlusse, hankige RTX 8000. Kes teab, võite juhtida tehisintellekti uurimist. Tesla V100 põhineb Turingi arhitektuuril, kus V100 põhineb Volta arhitektuuril, nii et Nvidia Quadro RTX 8000 võib pidada V100-st veidi moodsamaks ja veidi võimsamaks.
Nvidia Quadro RTX 8000 Üksikasjad: Amazon
GeForce RTX 2080 Ti
Geforce RTX 2080 asutajate väljaanne
Funktsioonid:
- Väljalaske kuupäev: 20. september 2018
- Turingi GPU arhitektuur ja RTX-platvorm
- Kella kiirus: 1350 MHz
- CUDA südamikud: 4352
- 11 GB järgmise põlvkonna ülikiiret GDDR6-mälu
- Mälu ribalaius: 616 GB / s
- Võimsus: 260W
Ülevaade:
GeForce RTX 2080 Ti on eelarvevalik, mis sobib ideaalselt väikesemahuliste töökoormuste modelleerimiseks, mitte suuremahuliste koolitusarenduste jaoks. Seda seetõttu, et sellel on kaardi kohta väiksem GPU-mälu (ainult 11 GB). Selle mudeli piirangud saavad selgemaks mõne kaasaegse NLP-mudeli koolitamisel. See aga ei tähenda, et see kaart ei saaks konkureerida. RTX 2080 puhuri disain võimaldab palju tihedamaid süsteemikonfiguratsioone - kuni neli GPU-d ühes tööjaamas. Lisaks treenib see mudel närvivõrke 80 protsenti Tesla V100 kiirusega. LambdaLabsi sügava õppeedukuse võrdlusaluste järgi on RTX 2080 võrreldes Tesla V100-ga 73% FP2 ja 55% FP16 kiirus.
Vahepeal maksab see mudel ligi 7 korda vähem kui Tesla V100. Nii hinna kui ka jõudluse seisukohalt on GeForce RTX 2080 Ti suurepärane GPU sügavaks õppimiseks ja tehisintellekti arendamiseks.
GeForce RTX 2080 Ti Üksikasjad: Amazon
NVIDIA Titan RTX
NVIDIA Titan RTX graafika
Funktsioonid:
- Väljaandmise kuupäev: 18. detsember 2018
- Toetatud tehisintellekti jaoks mõeldud NVIDIA Turing ™ arhitektuuriga
- Tehisintellekti kiirendamiseks mõeldud 576 tenorsüdamikku
- 130 teraFLOPS (TFLOPS) sügava õppe koolituseks
- CUDA südamikud: 4608
- VRAM: 24 GB
- Mälu ribalaius: 672 GB / s
- Soovitatav toiteallikas 650 vatti
Ülevaade:
NVIDIA Titan RTX on veel üks keskklassi graafikaprotsessor, mida kasutatakse keerukate süvaõppeoperatsioonide jaoks. Selle mudeli 24 GB VRAM on piisav enamiku partiisuurustega töötamiseks. Kui soovite koolitada suuremaid mudeleid, siduge see kaart aga NVLinki sillaga, et tegelikult oleks 48 GB VRAM-i. Sellest summast piisaks isegi suurte trafode NLP mudelite jaoks. Veelgi enam, Titan RTX võimaldab täismääraga segatäpsust treenida mudelitel (s.t.e., FP 16 koos FP32 kogunemisega). Seetõttu toimib see mudel operatsioonides, kus kasutatakse Tensori südamikke, umbes 15–20 protsenti kiiremini.
Üheks NVIDIA Titan RTX-i piiranguks on kahe ventilaatori disain. See takistab keerukamaid süsteemikonfiguratsioone, kuna seda ei saa tööjaama pakkida ilma jahutusmehhanismi oluliste muudatusteta, mida pole soovitatav.
Üldiselt on Titan suurepärane, universaalne graafikaprotsessor peaaegu kõigi sügavate õppimisülesannete täitmiseks. Võrreldes teiste üldotstarbeliste graafikakaartidega on see kindlasti kallis. Seetõttu ei soovitata seda mudelit mängijatele. Sellegipoolest hindaksid teadlased keerukate süvaõppemudelite abil täiendavat VRAM-i ja jõudluse suurendamist. Titan RTX-i hind on sisuliselt madalam kui ülaltoodud V100 ja see oleks hea valik, kui teie eelarve ei võimalda V100 hinnakujundust sügava õppimise jaoks või kui teie töökoormus ei vaja rohkem kui Titan RTX (vt huvitavaid võrdlusaluseid)
NVIDIA Titan RTX üksikasjad: Amazon
Parima graafikakaardi valimine tehisintellekti, masinõppe ja süvaõppe jaoks
Tehisintellekt, masinõpe ja sügavad õppimisülesanded töötlevad hulgaliselt andmeid. Need ülesanded võivad teie riistvarale väga nõudlikud olla. Allpool on funktsioonid, mida tuleks enne GPU ostmist meeles pidada.
Südamikud
Lihtne rusikareegel on see, et mida suurem on südamike arv, seda suurem on teie süsteemi jõudlus. Samuti tuleks arvestada südamike arvuga, eriti kui tegemist on suure hulga andmetega. NVIDIA on oma südamikud nimetanud CUDA-ks, samal ajal kui AMD kutsub nende südamikke voo protsessoriteks. Valige eelarve lubatav suurim arv töötlevaid südamikke.
Töötlusvõimsus
GPU töötlemisvõimsus sõltub süsteemis olevate südamike arvust, korrutatuna südamike käitamise taktsagedusega. Mida suurem on kiirus ja mida suurem on südamike arv, seda suurem on protsessori võimsus, mille juures teie GPU saab andmeid arvutada. See määrab ka selle, kui kiiresti teie süsteem ülesande täidab.
VRAM
Video RAM või VRAM on andmete hulga mõõtmine, mida teie süsteem korraga käsitseda saab. Kõrgem VRAM on ülitähtis, kui töötate erinevate Computer Vision mudelitega või täidate mis tahes CV Kaggle võistlusi. VRAM pole nii oluline NLP-le kui ka muude kategooriliste andmetega töötamisel.
Mälu ribalaius
Mälu ribalaius on andmete lugemise või mällu salvestamise kiirus. Lihtsamalt öeldes on see VRAM-i kiirus. Kui mõõta GB / s, tähendab suurem mälu ribalaius seda, et kaart suudab lühema aja jooksul rohkem andmeid tõmmata, mis tähendab kiiremat töötamist.
Jahutamine
GPU temperatuur võib jõudluse osas olla märkimisväärseks kitsaskohaks. Kaasaegsed GPU-d suurendavad algoritmi käitamise ajal oma kiirust maksimaalselt. Kuid niipea, kui teatud temperatuurilävi on saavutatud, vähendab GPU töötlemiskiirust ülekuumenemise eest kaitsmiseks.
Õhujahutite puhuri ventilaatori disain surub õhku süsteemist välja, samal ajal kui mitte-ventilaatorid imevad õhku sisse. Arhitektuuris, kus mitu GPU-d asetatakse üksteise kõrvale, soojendavad mitte-puhuri ventilaatorid rohkem. Kui kasutate 3–4 GPU-ga seadmes õhkjahutust, vältige ventilaatorite kasutamist.
Veel üks võimalus on vesijahutus. Ehkki see on kallis, on see meetod palju vaiksem ja tagab, et ka kõige nutikamad GPU seadistused jäävad kogu töö ajal lahedaks.
Järeldus
Enamiku kasutajate jaoks, kes on õppinud süvitsi õppima, pakuvad RTX 2080 Ti või Titan RTX teie jaoks suurimat pauku. RTX 2080 Ti ainus puudus on piiratud 11 GB suurune VRAM. Suuremate partiisuurustega treenimine võimaldab mudelitel kiiremini ja palju täpsemini treenida, säästes palju kasutaja aega. See on võimalik ainult siis, kui teil on Quadro GPU või TITAN RTX. Pooltäpsuse (FP16) kasutamine võimaldab mudelitel sobida GPU-desse, mille VRAM on ebapiisav [2]. Edasijõudnutele on Tesla V100 aga just see, kuhu peaksite investeerima. See on meie parim valik parimale graafikakaardile tehisintellekti, masinõppe ja süvaõppe jaoks. See on kõik selle artikli jaoks. Loodame, et see teile meeldis. Järgmise korrani!
Viited
- Parimad GPU-d tehisintellekti, masinõppe ja süvaõppe jaoks aastal 2020
- Parim süvaõppeks mõeldud GPU 2020. aastal
- NVIDIA AI INFERENCE PLATFORM: tehisintellekti teenuste ja jõudluse hüppelised hüpped, andmekeskusest võrgu servani
- NVIDIA V100 TENSOR CORE GPU
- Titan RTXi sügava õppimise võrdlusnäitajad