Andmeteadus

Python Plotly juhendaja

Python Plotly juhendaja
Plotly on analüüsiettevõte, mis on tuntud veebipõhiste rakenduste ja iseseisvate Pythoni skriptide jaoks reaalajas analüüsi-, statistika- ja graafikutööriistade väljatöötamise poolest. Selles õppetükis vaatame Plotly abil põhinäiteid ja koostame lihtsad ja intuitiivsed aegridade andmegraafikud, mis on 100% interaktiivsed ja ometi lihtsad. Neid graafikuid saab kasutada esitlustes, kuna need on täielikult interaktiivsed ja valmis mängima.

Graafiku kujundus on võimalik ka võrguühenduseta salvestada, et neid saaks hõlpsasti eksportida. Teegi kasutamise hõlbustavad paljud muud funktsioonid:

Plotly paketi kasutamise alustamiseks peame registreeruma eelnevalt mainitud veebisaidil konto saamiseks, et saada kehtiv kasutajanimi ja API-võti, millega saame selle funktsioone kasutada. Õnneks on Plotly jaoks saadaval tasuta hinnakava, mille abil saame piisavalt funktsioone tootmisklassi graafikute koostamiseks.

Plotly installimine

Enne alustamist võite lihtsalt märkida, et saate selle õppetunni jaoks kasutada virtuaalset keskkonda, mille saame teha järgmise käsuga:

python -m virtualenv kavalalt
allikas numpy / bin / aktiveeri

Kui virtuaalne keskkond on aktiivne, saate installida Plotly teegi virtuaalsesse env-sse, et saaksime järgmiselt loodud näited täita:

pip paigaldada kavalalt

Selles tunnis kasutame Anaconda ja Jupyterit. Kui soovite selle oma arvutisse installida, vaadake õppetundi, mis kirjeldab artiklit „Kuidas Anaconda Pythoni installida Ubuntu 18.04 LTS ”ja jagage oma tagasisidet, kui teil on probleeme. Placi installimiseks koos Anacondaga kasutage Anaconda terminalis järgmist käsku:

conda install -c kavalalt kavalalt

Ülaloleva käsu täitmisel näeme midagi sellist:

Kui kõik vajalikud paketid on installitud ja tehtud, saame Plotly teegi kasutamist alustada järgmise impordilausega:

importida krimpselt

Kui olete Plotly's konto teinud, vajate kahte asja - konto kasutajanime ja API-võtit. Igale kontole võib kuuluda ainult üks API-võti. Nii et hoidke seda kusagil turvalises kohas, nagu kaotaksite selle, peate võtme uuesti genereerima ja kõik vanu võtmeid kasutavad rakendused lakkavad töötamast.

Plotlyga töötamise alustamiseks mainige kõigis teie Pythoni programmides mandaate järgmiselt:

kavalalt.tööriistad.set_credentials_file (kasutajanimi = 'kasutajanimi', api_key = 'teie-api-võti')

Alustame selle raamatukoguga kohe.

Plotlyga alustamine

Kasutame oma programmis järgmist importi:

impordi pandad kui pd
impordi numpy kui np
impordi scipy nagu sp
importida krimpselt.kavalalt kui py

Kasutame:

Mõne näite jaoks kasutame Plotly enda andmebaase, mis on saadaval Githubis. Lõpuks pidage meeles, et saate Plotly jaoks lubada ka võrguühenduseta režiimi, kui peate Plotly skripte käivitama ilma võrguühenduseta:

impordi pandad kui pd
impordi numpy kui np
impordi scipy nagu sp
importida krimpselt
kavalalt.võrguühenduseta.init_notebook_mode (ühendatud = True)
importida krimpselt.offline kui py

Plotly installimise testimiseks võite käivitada järgmise lause:

trükk (kavalalt.__versioon__)

Ülaloleva käsu täitmisel näeme midagi sellist:

Lõpuks laadime andmekogumi koos Pandadega alla ja visualiseerime selle tabelina:

importida krimpselt.joonis_tehas nagu ff
df = pd.read_csv ("https: // toores.githubusercontent.com / plotly / datasets / master / school_
sissetulek.csv ")
tabel = ff.create_table (df)
py.iplot (tabel, failinimi = 'tabel')

Ülaloleva käsu täitmisel näeme midagi sellist:

Ehitagem nüüd a Tulpdiagramm andmete visualiseerimiseks:

importida krimpselt.graph_objs kui minna
andmed = [mine.Baar (x = df.Kool, y = df.Naised)]
py.iplot (andmed, failinimi = 'naiste riba')

Ülaloleva koodilõigu käivitamisel näeme midagi sellist:

Kui näete Jupyteri sülearvutiga ülaltoodud diagrammi, kuvatakse teile diagrammi konkreetse jaotise suumimise ja vähendamise erinevad valikud, Box & Lasso valik ja palju muud.

Grupeeritud baari graafikud

Plotlyga saab võrreldavuse huvides mitu tulpdiagrammi grupeerida. Kasutame selleks sama andmekogumit ja näitame varieeruvat meeste ja naiste kohalolekut ülikoolides:

naised = mine.Baar (x = df.Kool, y = df.Naised)
mehed = mine.Baar (x = df.Kool, y = df.Mehed)
andmed = [mehed, naised]
paigutus = mine.Paigutus (barmode = "rühm")
fig = mine.Joonis (andmed = andmed, paigutus = paigutus)
py.iplot (joonis)

Ülaloleva koodilõigu käivitamisel näeme midagi sellist:

Kuigi see näeb hea välja, pole paremas ülanurgas olevad sildid õiged! Parandame need:

naised = mine.Baar (x = df.Kool, y = df.Naised, nimi = "Naised")
mehed = mine.Baar (x = df.Kool, y = df.Mehed, nimi = "Mehed")

Graafik näeb nüüd palju kirjeldavam välja:

Proovime baarmoodi vahetada:

paigutus = mine.Paigutus (barmode = "suhteline")
fig = mine.Joonis (andmed = andmed, paigutus = paigutus)
py.iplot (joonis)

Ülaloleva koodilõigu käivitamisel näeme midagi sellist:

Pirukad koos Plotlyga

Nüüd proovime koostada Plotly abil sektordiagrammi, mis määrab naiste ülikoolide protsentuaalse erinevuse kõigis ülikoolides. Ülikoolide nimeks saavad sildid ja terviku protsendi arvutamiseks kasutatakse tegelikke numbreid. Siin on sama koodilõik:

jälg = mine.Pirukas (sildid = df.Kool, väärtused = df.Naised)
py.iplot ([jälg], failinimi = 'pie')

Ülaloleva koodilõigu käivitamisel näeme midagi sellist:

Hea on see, et Plotlyl on palju suumimise ja vähendamise funktsioone ning palju muid tööriistu koostatud diagrammiga suhtlemiseks.

Aegridade andmete visualiseerimine Plotly abil

Aegridade andmete visualiseerimine on üks olulisemaid ülesandeid, mis tuleb ette siis, kui olete andmeanalüütik või andmetöötlusinsener.

Selles näites kasutame samas GitHubi hoidlas eraldi andmekogumit, kuna varasemad andmed ei hõlmanud spetsiaalselt ajatempliga andmeid. Nagu siin, joonistame ka Apple'i turuvaru variatsiooni aja jooksul:

rahaline = pd.read_csv ("https: // toores.githubusercontent.com / plotly / datasets / master /
rahandus-graafikud-õun.csv ")
andmed = [mine.Hajumine (x = rahaline.Kuupäev, y = rahaline ['AAPL.Sulge'])]
py.iplot (andmed)

Ülaloleva koodilõigu käivitamisel näeme midagi sellist:

Kui hõljutate kursorit graafiku variatsioonijoone kohal, saate täpsustada punktide üksikasju:

Saame kasutada suumimis- ja vähendamisnuppe, et näha ka igale nädalale omaseid andmeid.

OHLC diagramm

OHLC (Open High Low close close) diagrammi kasutatakse üksuse variatsiooni kuvamiseks kogu ajavahemiku jooksul. PyPloti abil on seda lihtne üles ehitada:

alates datetime impordi datetime
avatud_andmed = [33.0, 35.3, 33.5, 33.0, 34.1]
suured_andmed = [33.1, 36.3, 33.6, 33.2, 34.8]
madalad andmed = [32.7, 32.7, 32.8, 32.6, 32.8]
sule_andmed = [33.0, 32.9, 33.3, 33.1, 33.1]
kuupäevad = [kuupäev (aasta = 2013, kuu = 10, päev = 10),
kuupäevaaeg (aasta = 2013, kuu = 11, päev = 10),
kuupäevaaeg (aasta = 2013, kuu = 12, päev = 10),
kuupäevaaeg (aasta = 2014, kuu = 1, päev = 10),
kuupäevaaeg (aasta = 2014, kuu = 2, päev = 10)]
jälg = mine.Ohlc (x = kuupäevad,
avatud = avatud_andmed,
kõrge = suur_andmed,
madal = madal_andmed,
lähedal = lähedal_andmed)
andmed = [jälg]
py.iplot (andmed)

Siin oleme esitanud mõned prooviandmete punktid, mida võib järeldada järgmiselt:

Käivitame nüüd ülaltoodud koodilõigu. Ülaloleva koodilõigu käivitamisel näeme midagi sellist:

See on suurepärane võrdlus selle kohta, kuidas luua üksuse ajalisi võrdlusi oma omadega ning võrrelda seda tema kõrgete ja madalate saavutustega.

Järeldus

Selles tunnis vaatasime veel üht visualiseerimisraamatukogu, Plotly, mis on suurepärane alternatiiv Matplotlibile tootmisklassi rakendustes, mis on avatud veebirakendustena. Plotly on väga dünaamiline ja funktsioonirikas raamatukogu, mida saab tootmiseks kasutada, nii et see on kindlasti oskus, mis meil peab olema vöö all.

Githubist leiate kõik selles õppetükis kasutatud lähtekoodi. Palun jagage oma tagasisidet õppetunni kohta Twitteris @sbmaggarwal ja @LinuxHint.

Kuidas kasutada AutoKeyt Linuxi mängude automatiseerimiseks
AutoKey on Linuxi ja X11 töölaua automatiseerimise utiliit, mis on programmeeritud Python 3, GTK ja Qt. Selle skriptimise ja MACRO funktsionaalsuse ab...
Kuidas näidata FPS-loendurit Linuxi mängudes
Linuxi mängimine sai suure tõuke, kui Valve teatas Steam-kliendi ja nende mängude Linuxi toest 2012. aastal. Sellest ajast peale on paljud AAA- ja ind...
Sid Meieri Civilization VI allalaadimine ja mängimine Linuxis
Sissejuhatus mängu Civilization 6 on kaasaegne kontseptsioon, mis tutvustati Age of Empires mängude sarjas. Idee oli üsna lihtne; alustaksite kõige põ...