Pythoni meresündinu õpetus

Selles Pythoni Seaborni teegi õppetükis vaatleme selle andmevisualiseerimise teegi erinevaid aspekte, mida saame Pythoniga kasutada ilusate ja intuitiivsete graafikute loomiseks, mis suudavad andmeid visualiseerida ettevõttele soovitud kujul. Selle õppetunni lõpetamiseks käsitleme järgmisi jaotisi:

Mis on Python Seaborn?
Kruntide tüübid, mida saame koostada Seaborniga
Mitme krundiga töötamine
Mõned alternatiivid Python Seabornile

See näeb välja palju, mida katta. Alustame kohe.

Mis on Pythoni Seaborni raamatukogu?

Seaborn raamatukogu on Pythoni pakett, mis võimaldab meil statistiliste andmete põhjal teha infograafikat. Kuna see on valmistatud matplotlibi peal, on see oma olemuselt sellega ühilduv. Lisaks toetab see NumPy ja Pandas andmestruktuuri, nii et joonistamist saab teha otse nendest kogudest.

Keeruliste andmete visualiseerimine on üks olulisemaid asju, mida Seaborn hoolitseb. Kui võrrelda Matplotlibi Seaborniga, suudab Seaborn need asjad hõlpsaks muuta, mida Matplotlibiga on raske saavutada. Siiski on oluline seda märkida Seaborn pole Matplotlibile alternatiiv, vaid selle täiend. Selle õppetunni vältel kasutame Matplotlibi funktsioone ka koodijuppides. Seaborniga töötamiseks valite järgmistel juhtudel:

Teil on graafilised statistilised aegridade andmed, mis näitavad prognooside ebakindlust
Andmete kahe alamhulga vahe visuaalseks tuvastamiseks
Ühemuutujate ja kahemõõtmeliste jaotuste visualiseerimiseks
Paljude visuaalsete kiindumuste lisamine paljude sisseehitatud teemadega matplotlibi süžeedele
Masinõppemudelite sobitamine ja visualiseerimine läbi lineaarse regressiooni sõltumatute ja sõltuvate muutujatega

Enne alustamist tuleb märkida, et selle õppetunni jaoks kasutame virtuaalset keskkonda, mille tegime järgmise käsuga:

python -m virtualenv meresündinud
allikas meresündinud / prügikast / aktiveeri

Kui virtuaalne keskkond on aktiivne, saame installida Seaborni teegi virtuaalsesse keskkonda, et saaksime järgmiselt loodud näited täita:

pip paigaldada meresündinud

Nende näidete käitamiseks võite kasutada ka Anaconda, mis on lihtsam. Kui soovite selle oma arvutisse installida, vaadake õppetundi, mis kirjeldab artiklit „Kuidas Anaconda Pythoni installida Ubuntu 18.04 LTS ”ja jagage tagasisidet. Nüüd liigume edasi erinevat tüüpi kruntide juurde, mida saab Python Seaborniga konstrueerida.

Pokemoni andmekogumi kasutamine

Selle õppetunni praktiliseks hoidmiseks kasutame Pokemoni andmekogumit, mille saab alla laadida Kaggle'ist. Selle andmekogumi oma programmi importimiseks kasutame Pandase teeki. Siin on kõik meie programmis tehtud impordid:

impordi pandad kui pd
matplotlibilt impordi püplot plt-na
importida meresündinud sns

Nüüd saame andmekogumi oma programmi importida ja näidata osa Panda näidisandmetest järgmiselt:

df = pd.read_csv ('Pokemon.csv ', index_col = 0)
df.pea ()

Pange tähele, et ülaltoodud koodilõigu käivitamiseks peaks CSV-andmekogum olema samas kataloogis kui programm ise. Kui ülaltoodud koodilõik on käivitatud, näeme järgmist väljundit (Anaconda Jupyteri märkmikus):

Lineaarse regressiooni kõvera joonistamine

Seaborni üks parimaid asju on selle pakutavad intelligentsed joonistusfunktsioonid, mis mitte ainult ei visualiseeri talle pakutavat andmekogumit, vaid konstrueerivad selle ümber ka regressioonimudeleid. Näiteks on võimalik konstrueerida lineaarne regressiooniagramm ühe koodireaga. Seda saate teha järgmiselt

sns.lmplot (x = 'rünnak', y = 'kaitse', andmed = df)

Kui ülaltoodud koodilõik on käivitatud, näeme järgmist väljundit:

Märkasime ülaltoodud koodijupis vähe olulisi asju:

Seabornis on saadaval spetsiaalne joonestamisfunktsioon
Kasutasime Seaborni sobitamise ja joonistamise funktsiooni, mis andis meile lineaarse regressioonijoone, mille ta ise modelleeris

Ärge kartke, kui arvate, et meil pole selle regressioonijooneta süžeed. Me saame ! Proovime nüüd uut koodilõiku, mis sarnaneb viimasega:

sns.lmplot (x = 'Rünnak', y = 'Kaitse', data = df, fit_reg = Vale)

Seekord ei näe me oma maatükil regressioonijoont:

Nüüd on see palju selgem (kui me ei vaja lineaarset regressioonijoont). Kuid see pole veel veel läbi. Seaborn võimaldab meil seda süžeed teistmoodi teha ja seda me ka teeme.

Boksi kruntide ehitamine

Seaborni üks suurimaid omadusi on see, kuidas ta aktsepteerib andmete kavandamiseks hõlpsasti Pandas Dataframes'i struktuuri. Me võime lihtsalt edastada Dataframe'i Seaborni raamatukogule, et see saaks sellest karbi koostada:

sns.boxplot (andmed = df)

Kui ülaltoodud koodilõik on käivitatud, näeme järgmist väljundit:

Esimese lugemise saame eemaldada, kuna see näib veidi kohmakas, kui siin tegelikult veerge koostame:

stats_df = df.langus (['kokku'], telg = 1)
# Uus kastiplaan, kasutades statistikat_df
sns.boxplot (andmed = stats_df)

Kui ülaltoodud koodilõik on käivitatud, näeme järgmist väljundit:

Sülemitükk koos Seaborniga

Saame Seaborniga konstrueerida intuitiivse kujundusega Sülemitüki. Kasutame jällegi varem laaditud pandade andmekaadrit, kuid seekord helistame Matplotlibi näitefunktsiooniga, et näidata tehtud süžeed. Siin on koodilõik:

sns.set_context ("paber")
sns.sülearvuti (x = "Rünnak", y = "Kaitse", andmed = df)
plt.näita ()

Kui ülaltoodud koodilõik on käivitatud, näeme järgmist väljundit:

Seaborni konteksti abil lubame Seabornil lisada süžee jaoks isikupärase kujunduse ja voolava kujunduse. Selle graafiku lugemise hõlbustamiseks on seda graafikut võimalik veelgi kohandada, kasutades graafikul olevate siltide kohandatud fondisuurust. Selleks edastame funktsioonile set_context rohkem parameetreid, mis toimivad täpselt nagu nad kõlavad. Näiteks siltide fondisuuruse muutmiseks kasutame fonti.suuruse parameeter. Siin on koodilõik muutmise tegemiseks:

sns.set_context ("paber", font_scale = 3, rc = "font.suurus ": 8", kirved.sildi suurus ": 5)
sns.sülearvuti (x = "Rünnak", y = "Kaitse", andmed = df)
plt.näita ()

Kui ülaltoodud koodilõik on käivitatud, näeme järgmist väljundit:

Sildi fondi suurust muudeti meie esitatud parameetrite ja fondiga seotud väärtuse põhjal.suuruse parameeter. Üks asi, mida Seaborn oskab, on muuta süžee praktiliseks kasutamiseks väga intuitiivseks ja see tähendab, et Seaborn pole lihtsalt harjutus Pythoni pakett, vaid tegelikult midagi, mida saame oma tootmispaigaldistes kasutada.

Pealkirja lisamine süžeedele

Meie kruntidele on lihtne pealkirju lisada. Peame lihtsalt järgima telgede taseme funktsioonide lihtsat protseduuri, kus seda nimetame set_title () toimida nii, nagu näitame siin koodilõigus:

sns.set_context ("paber", font_scale = 3, rc = "font.suurus ": 8", kirved.sildi suurus ": 5)
my_plot = sns.sülearvuti (x = "Rünnak", y = "Kaitse", andmed = df)
my_plot.set_title ("LH sülemitükk")
plt.näita ()

Kui ülaltoodud koodilõik on käivitatud, näeme järgmist väljundit:

Nii saame oma kruntidele lisada palju rohkem teavet.

Seaborn vs Matplotlib

Selle tunni näiteid vaadates võime tuvastada, et Matplotlibi ja Seabornit ei saa otseselt võrrelda, kuid neid võib vaadelda üksteist täiendavatena. Üks omadusi, mis seaborni ühe sammu võrra ees viib, on viis, kuidas Seaborn saab andmeid statistiliselt visualiseerida.

Seaborni parameetrite parimate saavutamiseks soovitame tungivalt tutvuda Seaborni dokumentatsiooniga ja saada teada, milliseid parameetreid kasutada, et oma maatükk oleks võimalikult lähedane ettevõtte vajadustele.

Järeldus

Selles tunnis vaatasime selle andmevisualiseerimise teegi erinevaid aspekte, mida saame Pythoniga kasutada ilusate ja intuitiivsete graafikute loomiseks, mis suudavad andmeid visualiseerida ettevõttele soovitud kujul. Seaborm on andmetöötluse ja andmete esitamise kõige visuaalsemates vormides üks olulisemaid visualiseerimisraamatukogusid, mis on kindlasti oskus, mis meil peab olema vöö all, kuna see võimaldab meil ehitada lineaarseid regressioonimudeleid.

Palun jagage oma tagasisidet õppetunni kohta Twitteris @sbmaggarwal ja @LinuxHint.