Hvad er det bedste grafikkort til dyb læring?

Hvis en CPU er hjernen på en pc, så er en GPU sjælen. Selvom de fleste pc'er kan fungere uden en god GPU, er dyb læring ikke mulig uden en. Dette skyldes, at dyb læring kræver komplekse operationer som matrixmanipulation, ekstraordinære beregningsmæssige forudsætninger og betydelig computerkraft.

Erfaring er afgørende for at udvikle de færdigheder, der er nødvendige for at anvende dyb læring på nye spørgsmål. En hurtig GPU betyder en hurtig gevinst i praktisk erfaring gennem øjeblikkelig feedback. GPU'er indeholder flere kerner til håndtering af parallelle beregninger. De indeholder også omfattende hukommelsesbåndbredde for let at håndtere disse oplysninger.

Vores mest anbefalede valg til bedste grafikkort til dyb læring er Nvidia Geforce RTX 2080 Founders Edition. Køb det nu for $ 1.940 USD på Amazon

Med dette i tankerne søger vi at besvare spørgsmålet: Hvad er det bedste grafikkort til AI, maskinlæring og dyb læring? ved at gennemgå flere grafikkort, der aktuelt er tilgængelige i 2021. Kort anmeldt:

AMD RX Vega 64

NVIDIA Tesla V100

Nvidia Quadro RTX 8000

GeForce RTX 2080 Ti

NVIDIA Titan RTX

Nedenfor er resultaterne:

AMD RX Vega 64

Radeon RX Vega 64

Funktioner

Udgivelsesdato: 14. august 2017
Vega Arkitektur
PCI Express -interface
Urhastighed: 1247 MHz
Stream -processorer: 4096
VRAM: 8 GB
Hukommelsesbåndbredde: 484 GB/s

Anmeldelse

Hvis du ikke kan lide NVIDIA GPU'erne, eller dit budget ikke tillader dig at bruge op til $ 500 på et grafikkort, så har AMD et smart alternativ. AMDs RS Vega 64 er meget svær at ignorere med en anstændig mængde RAM, en hurtig hukommelsesbåndbredde og mere end nok streamprocessorer.

Vega -arkitekturen er en opgradering fra de tidligere RX -kort. Med hensyn til ydeevne er denne model tæt på GeForce RTX 1080 Ti, da begge disse modeller har en lignende VRAM. Desuden understøtter Vega native halvpræcision (FP16). ROCm og TensorFlow fungerer, men softwaren er ikke så moden som på NVIDIA -grafikkort.

Alt i alt er Vega 64 en anstændig GPU til dyb læring og AI. Denne model koster langt under $ 500 USD og får jobbet udført for begyndere. Til professionelle applikationer anbefaler vi dog at vælge et NVIDIA -kort.

AMD RX Vega 64 Detaljer: Amazon

NVIDIA Tesla V100

Tesla V100

Funktioner:

Udgivelsesdato: 7. december 2017
NVIDIA Volta -arkitektur
PCI-E-interface
112 TFLOPS Tensor ydeevne
640 Tensor farver
5120 NVIDIA CUDA® -farver
VRAM: 16 GB
Hukommelsesbåndbredde: 900 GB/s
Compute API'er: CUDA, DirectCompute, OpenCL ™, OpenACC®

Anmeldelse:

NVIDIA Tesla V100 er en behemoth og et af de bedste grafikkort til AI, maskinlæring og dyb læring. Dette kort er fuldt optimeret og leveres pakket med alle de godbidder, man kan have brug for til dette formål.

Tesla V100 kommer i 16 GB og 32 GB hukommelseskonfigurationer. Med masser af VRAM, AI -acceleration, høj hukommelsesbåndbredde og specialiserede tensorkerner til dyb læring kan du være sikker på, at alle dine træningsmodeller kører problemfrit - og på kortere tid. Specifikt kan Tesla V100 levere 125TFLOPS dyb læringspræstationer til både træning og slutning [3], muliggjort af NVIDIAs Volta -arkitektur.

NVIDIA Tesla V100 Detaljer: Amazon , ( 1 )

Nvidia Quadro RTX 8000

Nvidia Quadro Rtx 8000

Funktioner:

Udgivelsesdato: august 2018
Turing Arkitektur
576 Tensorfarver
CUDA farver: 4.608
VRAM: 48 GB
Hukommelsesbåndbredde: 672 GB/s
16.3 TFLOPS
Systemgrænseflade: PCI-Express

Anmeldelse:

Quadro RTX 8000 er specielt designet til matematikregning og dyb læringsmatrix og er et top-of-the-line grafikkort. Da dette kort leveres med stor VRAM-kapacitet (48 GB), anbefales denne model til forskning i ekstra store beregningsmodeller. Når den bruges i par med NVLink, kan kapaciteten øges til op til 96 GB VRAM. Som er meget!

En kombination af 72 RT og 576 Tensor -kerner til forbedrede arbejdsgange resulterer i over 130 TFLOPS ydelse. Sammenlignet med det dyreste grafikkort på vores liste - Tesla V100 - tilbyder denne model potentielt 50 procent mere hukommelse og klarer stadig at koste mindre. Selv på installeret hukommelse har denne model enestående ydeevne, mens den arbejder med større batchstørrelser på en enkelt GPU.

Igen, ligesom Tesla V100, er denne model kun begrænset af dit pris tag. Når det er sagt, hvis du vil investere i fremtiden og i computere af høj kvalitet, får du en RTX 8000. Hvem ved, kan du lede forskningen om AI. Tesla V100 er baseret på Turing -arkitektur, hvor V100 er baseret på Volta -arkitektur, så Nvidia Quadro RTX 8000 kan betragtes som lidt mere moderne og lidt mere kraftfuld end V100.

Nvidia Quadro RTX 8000 Detaljer: Amazon

GeForce RTX 2080 Ti

Geforce RTX 2080 Founders Edition

Funktioner:

Udgivelsesdato: 20. september 2018
Turing GPU -arkitektur og RTX -platformen
Urhastighed: 1350 MHz
CUDA farver: 4352
11 GB næste generations, ultrahurtig GDDR6-hukommelse
Hukommelsesbåndbredde: 616 GB/s
Effekt: 260W

Anmeldelse:

GeForce RTX 2080 Ti er en budgetmulighed, der er ideel til modellering af mindre arbejdsbelastninger frem for store træningsudviklinger. Det skyldes, at den har en mindre GPU -hukommelse pr. Kort (kun 11 GB). Denne models begrænsninger bliver mere tydelige, når man træner nogle moderne NLP -modeller. Det betyder dog ikke, at dette kort ikke kan konkurrere. Blæserdesignet på RTX 2080 giver mulighed for langt tættere systemkonfigurationer - op til fire GPU'er inden for en enkelt arbejdsstation. Plus, denne model træner neurale netværk med 80 procent hastighederne på Tesla V100. Ifølge LambdaLabs 'benchmarks for dybe læringspræstationer er RTX 2080 i forhold til Tesla V100 73% hurtigheden på FP2 og 55% hastigheden på FP16.

I mellemtiden koster denne model næsten 7 gange mindre end en Tesla V100. Fra både pris og ydeevne er GeForce RTX 2080 Ti en fantastisk GPU til dyb læring og AI -udvikling.

GeForce RTX 2080 Ti Detaljer: Amazon

NVIDIA Titan RTX

NVIDIA Titan RTX -grafik

Funktioner:

Udgivelsesdato: 18. december 2018
Drevet af NVIDIA Turing ™ -arkitektur designet til AI
576 Tensorkerner til AI -acceleration
130 teraFLOPS (TFLOPS) til dyb læringstræning
CUDA farver: 4608
VRAM: 24 GB
Hukommelsesbåndbredde: 672 GB/s
Anbefalet strømforsyning 650 watt

Anmeldelse:

NVIDIA Titan RTX er en anden mellemklasse GPU, der bruges til komplekse deep learning-operationer. Denne models 24 GB VRAM er nok til at fungere med de fleste batchstørrelser. Hvis du ønsker at træne større modeller, skal du dog parre dette kort med NVLink -broen for effektivt at have 48 GB VRAM. Dette beløb ville være nok, selv for store transformer NLP -modeller. Desuden giver Titan RTX mulighed for fuld hastighed blandet præcisionstræning for modeller (dvs. FP 16 sammen med FP32-akkumulering). Som et resultat udfører denne model cirka 15 til 20 procent hurtigere i operationer, hvor Tensor Cores bruges.

En begrænsning af NVIDIA Titan RTX er design med to blæsere. Dette hæmmer mere komplekse systemkonfigurationer, fordi det ikke kan pakkes ind i en arbejdsstation uden væsentlige ændringer af køle -mekanismen, hvilket ikke anbefales.

Samlet set er Titan en fremragende, universel GPU til næsten enhver dyb læringsopgave. Sammenlignet med andre generelle grafikkort er det bestemt dyrt. Derfor anbefales denne model ikke til gamere. Ikke desto mindre vil ekstra VRAM og præstationsforøgelse sandsynligvis blive værdsat af forskere, der anvender komplekse deep learning -modeller. Prisen på Titan RTX er meningsfuldt mindre end den V100, der blev vist ovenfor, og ville være et godt valg, hvis dit budget ikke tillader, at V100 -prissætning gør dyb læring, eller din arbejdsbyrde ikke har brug for mere end Titan RTX ( se interessante benchmarks )

NVIDIA Titan RTX detaljer: Amazon

Valg af det bedste grafikkort til AI, maskinlæring og dyb læring

AI, maskinlæring og dybe læringsopgaver behandler masser af data. Disse opgaver kan være meget krævende for din hardware. Nedenfor er de funktioner, du skal huske på, før du køber en GPU.

Farver

Som en tommelfingerregel, jo større antal kerner, jo højere bliver ydeevnen på dit system. Antallet af kerner bør også tages i betragtning, især hvis du har at gøre med en stor mængde data. NVIDIA har navngivet sine kerner til CUDA, mens AMD kalder deres kerner for streamprocessorer. Vælg det højeste antal behandlingskerner, dit budget tillader.

Forarbejdningskraft

Processorstyrken i en GPU afhænger af antallet af kerner inde i systemet ganget med de urhastigheder, hvormed du kører kernerne. Jo højere hastighed og jo højere antal kerner, desto højere bliver processorkraften, hvormed din GPU kan beregne data. Dette bestemmer også, hvor hurtigt dit system vil udføre en opgave.

VRAM

Video RAM, eller VRAM, er en måling af mængden af data, dit system kan håndtere på én gang. Højere VRAM er afgørende, hvis du arbejder med forskellige Computer Vision -modeller eller udfører nogen CV Kaggle -konkurrencer. VRAM er ikke så vigtigt for NLP eller for at arbejde med andre kategoriske data.

Hukommelsesbåndbredde

Hukommelsesbåndbredden er den hastighed, hvormed data læses eller gemmes i hukommelsen. Enkelt sagt er det hastigheden på VRAM. Målt i GB/s betyder mere hukommelsesbåndbredde, at kortet kan trække flere data på kortere tid, hvilket betyder hurtigere drift.

Afkøling

GPU -temperaturen kan være en betydelig flaskehals, når det kommer til ydeevne. Moderne GPU'er øger deres hastighed til et maksimum, mens de kører en algoritme. Men så snart en bestemt temperaturgrænse er nået, reducerer GPU'en behandlingshastigheden for at beskytte mod overophedning.

Blæserventilatorens design til luftkølere skubber luft uden for systemet, mens ventilatorerne uden blæser suger luft ind. I arkitektur, hvor flere GPU'er er placeret ved siden af hinanden, vil blæsere, der ikke er blæsere, varme mere op. Hvis du bruger luftkøling i et setup med 3 til 4 GPU'er, skal du undgå blæsere uden blæser.

Vandkøling er en anden mulighed. Selvom den er dyr, er denne metode meget mere lydløs og sikrer, at selv de sødeste GPU -opsætninger forbliver kølige under hele driften.

Konklusion

For de fleste brugere, der går på dyb læring, giver RTX 2080 Ti eller Titan RTX det største bang for pengene. Den eneste ulempe ved RTX 2080 Ti er en begrænset VRAM -størrelse på 11 GB. Træning med større batchstørrelser giver modeller mulighed for at træne hurtigere og meget mere præcist, hvilket sparer meget af brugerens tid. Dette er kun muligt, når du har Quadro GPU'er eller en TITAN RTX. Brug af halvpræcision (FP16) giver modeller mulighed for at passe i GPU'erne med utilstrækkelig VRAM-størrelse [2]. For mere avancerede brugere er Tesla V100 imidlertid, hvor du skal investere. Det er vores bedste valg til det bedste grafikkort til AI, maskinlæring og dyb læring. Det er alt for denne artikel. Vi håber du kunne lide det. Indtil næste gang!

Hvad er det bedste grafikkort til dyb læring?

Funktioner

Anmeldelse

Funktioner:

Anmeldelse:

Funktioner:

Anmeldelse:

Funktioner:

Anmeldelse:

Funktioner:

Anmeldelse:

Valg af det bedste grafikkort til AI, maskinlæring og dyb læring

Farver

Forarbejdningskraft

VRAM

Hukommelsesbåndbredde

Afkøling

Konklusion

Referencer

Kategori

Populære Indlæg