Andmeteadus

10 parimat Pythoni masinõppe raamatukogu

10 parimat Pythoni masinõppe raamatukogu

Mida soovite luua? Oluline küsimus!

Olete tulnud siia, et kasutada masinõpet (ML) . Kas olete hoolikalt kaalunud, mille jaoks? Masinõppekogu valimisel peate alustama sellest, kuidas kavatsete seda kasutada. Isegi kui olete lihtsalt õppimisest huvitatud, peaksite kaaluma, kus masinõpet kasutatakse ja mis on teie põhihuvile kõige lähemal. Samuti peaksite kaaluma, kas soovite keskenduda sellele, et midagi teie kohalikus masinas toimiks või kui olete huvitatud oma arvutisüsteemi levitamisest paljudele serveritele.

Alguses alustage sellest, et midagi toimiks.

Kus kasutatakse masinõpet

Võite leida palju projekte, mis kasutavad ML-i, tegelikult nii palju, et iga kategooria on lehekülgede pikk. Lühike versioon on "kõikjal", see pole tõsi, kuid tuleb mõelda. Ilmselged on soovituste mootorid, piltide tuvastamine ja rämpsposti tuvastamine. Kuna olete juba Pythonis programmeerinud, on teid huvitatud ka The Kite koodi lõpuleviimise tarkvara. See on Muud kasutusalad suuremate tehaste ja muude tööstusharude käsitsi andmete sisestamisel, meditsiinilisel diagnoosimisel ja hooldamisel esinevate vigade tuvastamiseks

Raamatukogud lühidalt:

  1. Scikit-õppida, Alates scikit; Rutiinid ja teegid NumPy, SciPy ja Matplotlibi peal. See raamatukogu tugineb otse Pythoni emakeelsete matemaatiliste teekide rutiinidele. Scikit-learn installitakse tavalise Pythoni paketihalduriga. Scikit-learn on väike ja ei toeta GPU arvutusi, see võib teile küll öelda, kuid see on teadlik valik. See pakett on väiksem ja sellega on lihtsam alustada. Suuremates kontekstides töötab see endiselt üsna hästi, kuigi hiiglasliku arvutusklastri tegemiseks vajate muid pakette.
  2. Scikit-pilt Eriline piltide jaoks! Scikit-pildil on pildianalüüsi ja manipuleerimise algoritmid. Saate seda kasutada nii kahjustatud piltide parandamiseks kui ka värvi ja muude pildi atribuutidega manipuleerimiseks. Selle paketi peamine mõte on teha kõik pildid NumPy jaoks kättesaadavaks, et saaksite nendega ndarrays toiminguid teha. Nii on teil pildid mis tahes algoritmide käitamiseks andmetena saadaval.
  3. Šogun: C ++ baas, millel on selged API liidesed Pythoni, Java, Scala jms jaoks. Paljud, võib-olla enamik katsetamiseks saadaolevaid algoritme. See on efektiivsuse huvides kirjutatud C ++ keeles, on ka viis pilves proovida. Shogun kasutab SWIG-i paljude programmikeelte, sealhulgas Pythoni liidestamiseks. Shogun hõlmab enamikku algoritme ja seda kasutatakse laialdaselt akadeemilises maailmas. Paketil on tööriistakast, mis on saadaval aadressil https: // www.shogun-tööriistakast.org.
  4. Säde MLlib: Põhiliselt Java jaoks, kuid on Python arendajatele saadaval NumPy teegi kaudu. Spark MLlib on välja töötatud Apache'i meeskonna poolt, nii et see on suunatud hajutatud arvutuskeskkondadele ja seda tuleb käitada koos kapteni ja töötajatega. Seda saate teha eraldiseisvas režiimis, kuid Sparki tegelik jõud on võime jaotada töökohti paljude masinate vahel. Sparki hajutatud olemus muudab selle populaarseks paljude suurettevõtete seas, näiteks IBM, Amazon ja Netflix. Peamine eesmärk on kaevandada “Big Data”, mis tähendab kõiki neid riivsaiu, mille jätate seljataha, kui surfate ja poete veebis. Kui soovite töötada masinõppega, on Spark MLlib alustamiseks hea koht. Algoritmid, mida see toetab, on hajutatud kogu ulatuses. Kui alustate hobiprojektiga, ei pruugi see olla parim idee.
  5. H2O: On suunatud äriprotsessidele, seega toetab ennustusi soovituste ja pettuste ennetamiseks. Äri, H20.ai eesmärk on leida ja analüüsida hajutatud failisüsteemide andmekogumeid. Saate seda käitada enamikus tavapärastes operatsioonisüsteemides, kuid peamine eesmärk on toetada pilvepõhiseid süsteeme. See sisaldab enamikku statistilisi algoritme, nii et seda saab kasutada enamiku projektide jaoks.
  6. Mahout: On loodud hajutatud masinõppe algoritmide jaoks. See on Apache osa arvutuste hajutatud olemuse tõttu. Mahouti idee seisneb selles, et matemaatikud rakendaksid oma algoritme. See pole mõeldud algajale, kui te alles õpite, siis on parem kasutada midagi muud. Seda öeldes saab Mahout luua ühenduse paljude taustaga, nii et kui olete midagi loonud, vaadake, kas soovite kasutada Mahouti oma esiosa jaoks.
  7. Cloudera Oryx: Kasutatakse peamiselt reaalajas andmete masinõppeks. Oryx 2 on arhitektuur, mis kihistab kogu töö reaalajas andmetele reageerida suutva süsteemi loomiseks. Kihid töötavad ka erinevates ajaraamides, partiikihiga, mis ehitab põhimudeli, ja kiiruskihiga, mis muudab mudelit uute andmete saabumisel. Oryx on ehitatud Apache Sparki peale ja loob kogu arhitektuuri, mis rakendab rakenduse kõiki osi.
  8. Theano: Theano on PyPoni raamatukogud, mis on integreeritud NumPy-ga. See on Pythonile kõige lähemal kui võimalik. Theano kasutamisel soovitatakse teil installida gcc. Selle põhjuseks on see, et Theano suudab teie koodi kompileerida võimalikult sobivaks koodiks. Kuigi Python on suurepärane, on mõnel juhul C kiirem. Nii saab Theano teisendada C-ks ja kompileerida, muutes teie programmi kiiremaks. Soovi korral saate lisada GPU tuge.
  9. Tensorivoog: Nimes olev tensor osutab matemaatilisele tensorile. Sellisel tenoril on maatriksis 'n' kohta, kuid Tenor on mitmemõõtmeline massiiv. TensorFlow'l on algoritme Tensorsi arvutuste tegemiseks, seega nimi, saate neid kutsuda Pythoni kaudu. See on ehitatud C ja C ++ keeles, kuid sellel on Pythoni jaoks eesliides. See muudab selle kasutamise hõlpsaks ja kiire töötamise. Tensorflow võib töötada protsessoril, GPU-l või jaotada võrkude kaudu. Selle saavutab täitemootor, mis toimib kihina teie koodi ja protsessori vahel.
  10. Matplotlib: Kui olete tulnud välja probleemiga, mille saate masinõppega lahendada, soovite suure tõenäosusega oma tulemusi visualiseerida. Siin tuleb sisse matplotlib. See on loodud mis tahes matemaatiliste graafikute väärtuste näitamiseks ja seda kasutatakse akadeemilises maailmas palju.

JÄRELDUS

See artikkel on andnud teile idee selle kohta, mida on masinõppes võimalik programmeerida. Vajaliku selge pildi saamiseks peate alustama mõne programmi koostamisest ja nägema, kuidas need toimivad. Enne kui teate, kuidas asju saab teha, saate oma järgmise projekti jaoks ideaalse lahenduse leida.

Kuidas FPS-i suurendada Linuxis?
FPS tähistab Kaadrit sekundis. FPS-i ülesanne on mõõta kaadrisagedust video taasesitamisel või mängude esitamisel. Lihtsamalt öeldes nimetatakse iga s...
Parimad Oculus App Lab mängud
Kui olete Oculuse peakomplekti omanik, peate olema teadlik külglaadimisest. Kõrvalaadimine on protsess, millega installitakse peakomplekti mitte-poesi...
10 parimat mängu, mida Ubuntu kaudu mängida
Windowsi platvorm on olnud üks mängude domineerivaid platvorme, kuna tohutu protsent mänge areneb täna Windowsi loomupäraseks toetamiseks. Kas keegi s...