pandad

Kuidas kasutada Pythonis Boxploti

Kuidas kasutada Pythonis Boxploti
Andmekogumite kokkuvõtmiseks kasutatakse kasti graafikut, kasutades kasti ja vuntside joonise meetodit. See funktsioon aitab kasutajatel andmete kokkuvõttest õigesti aru saada. Lahtritükid võivad olla väga kasulikud, kui tahame teada, kuidas andmeid levitatakse ja levitatakse. Andmete joonistamiseks kasutatakse kasti joonisel kolme tüüpi kvartileid. Need väärtused hõlmavad keskmise, maksimaalse, minimaalse, ülemise kvartiili ja alumise kvartiili statistilisi väärtusi. Kastgraafik võtab need andmed kokku 25-sth, 50th, ja 75th protsentiilid. See õpetus näitab teile, kuidas luua andmekogumi põhjal kasti graafikuid, kasutades pandad ja meresündinud Pythoni raamatukogud.

Eelduseks

Kui olete uus Pythoni kasutaja, peate kõigepealt seadistama keskkonna, et näidata kasti graafiku väljundit. Koodi täitmiseks võite kasutada mis tahes Pythoni tõlki. Selles õpetuses kasutan spyder3 koodi täitmiseks. Kui te pole seda installinud pandad ja meresündinud enne teeke, peaksite nende teekide installimiseks terminalist käivitama järgmise käsu:

$ pip3 installige pandad meresündinud

Pandatega boksi krundid

The boxplot () meetod pandad kasutatakse andmekaadri põhjal kasti graafikute jooniste genereerimiseks. See meetod sisaldab palju argumente; mõnda neist argumentidest kasutatakse allpool toodud näidetes. Selles õpetuse osas on kaks näidet, mis näitavad, kuidas kasti jooniseid luua pandad. Kastipildi loomiseks võite kasutada NumPy teegi juhuslikult genereeritud andmeid või CSV-faili andmeid pandad.

Näide 1: Juhuslike väärtuste põhjal koostatavad lahtrid

Järgmise näite lahtrid koostati kasutades NumPy ja pandad. NumPy teeki kasutatakse skriptis andmeraami objekti loomiseks, genereerides juhuslike väärtuste kahemõõtmelise massiivi, mis sisaldab 5 rida ja 5 veergu. Andmeraami sisu prinditakse kasutades pea() meetod. Järgmine boxplot () meetodit kasutatakse sinise värvi, fondisuuruse 10 ja 30-kraadise pöördenurgaga kastikuvandite loomiseks veeruväärtuste kuvamiseks.

#!/ usr / bin / env python3
# Import pandade raamatukogu
impordi pandad kui pd
# Massiivi juhuslike arvude loomiseks importige NumPy teek
impordi numpy kui np
"
Looge andmekogum juhuslikult loodud NumPy massiivi põhjal
ja viis veeru väärtust
"
andmekaader = pd.DataFrame (np.juhuslik.randn (5,5), veerud = ['2016', '2017', '2018',
"2019", "2020"])
 
# Printige andmekaadri väärtused
print (andmekaader.pea ())
# Kuva kasti graafik, tuginedes andmekaadri väärtustele
andmekaader.boxplot (ruudustik = 'false', color = 'blue', fontsize = 10, rot = 30)

Väljund

Pärast koodi käivitamist ilmub järgmine väljund.

Näide 2: CSV-andmetel põhinevad lahtrid

Järgmise näite lahtrid koostati CSV andmetest. Looge CSV-fail nimega pank.csv kasutades järgmisi andmeid.

pank.csv

SL, kliendi_nimi, konto_Tüüp, sugu, saldo
1, Maria Hernandez, Saving, naine, 120000
2, Mary Smith, praegune, naine, 40000
3, David Smith, praegune, mees, 379000
4, Maria Rodriguez, Saving, naine, 56000
5, Mark Lee, Saving, mees, 93500
6, Jonathan Bing, praegune, mees, 5900
7, Daniel Williams, Saving, mees, 2300
8, Mike Brown, praegune, mees, 124888
9, Paul Smith, praegune, mees, 59450
10, Maria Lopez, Saving, naine, 487600

Järgmises skriptis on matplotlib teeki kasutati kasti joonise suuruse seadistamiseks ja väljundi tekstisisese kuvamiseks. Kõik dokumendid Pank.csv fail laaditi kasutades read_csv () meetod pandad. Seejärel trükiti andmeraami esimesed 8 kirjet, kasutades pea () meetod. The boxplot () meetodit kasutati järgmises lauses kasti joonise joonistamiseks, kasutades punast värviKonto tüüp' veeruga nimega 'Tasakaal."

#!/ usr / bin / env python3
# Impordi pandasid kasti krundi genereerimiseks
impordi pandad kui pd
# Impordi matplotlib kasti joonise suuruse seadistamiseks
import matplotlib.püplot nagu plt
# Impordi get_ipython väljundisiseseks vormindamiseks
IPythonist importige get_ipython
get_ipython ().run_line_magic ('matplotlib', 'inline')
# Seadistage joonise suurus
plt.rcParams ['joonis.figsize '] = (8,4)
# Laadige andmekogum CSV-failist
df = pd.read_csv ("pank.csv ")
# Printige laaditud andmete esimesed 8 rida
print (df.pea (8))
# Kuva kasti graafikud kasutatud parameetri põhjal
df.boxplot (by = 'Account_Type', ruudustik = 'True', veerg = ['Saldo'], color = 'red')

Väljund

Pärast koodi käivitamist ilmub järgmine väljund.

Karbitükid koos meresündinutega

Teine Pythoni teek, mida tavaliselt kasutatakse kastikavandite joonistamiseks, on teek meresündinud.  Selle teegi üks oluline omadus on see, et selles on paljude ülesannete testimiseks palju sisseehitatud näidisandmekogumeid. Järgmised kaks näidet hõlmavad kahe erineva näidisandmekomplekti kasutamist kastiplaanide joonistamiseks, kasutades meresündinud raamatukogu.

Näide 3: kastiplaanid x parameetri põhjal

Järgmises näites kasutatakse näidisandmekogumit nimegateemandid, " alates meresündinud raamatukogu kasti joonise genereerimiseks. Siin määratletakse ruudustiku stiil, kasutades set_style () meetod. The load_dataset () meetodit kasutatakse andmete laadimiseksteemandid andmekogum. Esimesed viis kirjet prinditakse andmestikust ja boxplot () meetodit kasutatakse kasti joonise joonistamiseks veeru põhjal nimega 'sügavus,sinise värviga.

# Karbi krundi loomiseks importige mereandide raamatukogu
importida meresündinud sns
# Impordi matplotlib kasti joonise suuruse seadistamiseks
import matplotlib.püplot nagu plt
# Impordi get_ipython väljundisiseseks vormindamiseks
IPythonist importige get_ipython
get_ipython ().run_line_magic ('matplotlib', 'inline')
# Seadistage ruudustiku stiil
sns.set_style ("whitegrid")
# Seadistage joonise suurus
plt.rcParams ['joonis.figsize '] = (8,4)
# Laadige näidisandmekogum
teemant_andmekogum = sns.load_dataset ('teemandid')
# Kuvage andmekogumi 5 esimest kirjet
print (teemant_andmekogum.pea ())
# Joonista kasti joonised
sns.boxplot (x = teemandi_andmekogum ['sügavus'], värv = 'sinine')

Väljund

Pärast koodi käivitamist ilmub järgmine väljund.

Näide 4: kasti joonised x ja y parameetrite põhjal

Järgmises näites kasutatakse valimi andmekogumit nimega 'lennud', et joonistada kasti joonis. Siin on nii x kui ka y parameetrid kasti joonis () Joonise joonistamiseks kasutatakse meetodit. Ülejäänud väited sarnanevad eelmise näitega.

# Karbi krundi loomiseks importige mereandide raamatukogu
importida meresündinud sns
# Impordi matplotlib kasti joonise suuruse seadistamiseks
import matplotlib.püplot nagu plt
# Impordi get_ipython väljundisiseseks vormindamiseks
IPythonist importige get_ipython
get_ipython ().run_line_magic ('matplotlib', 'inline')
 
# Seadistage ruudustiku stiil
sns.set_style ("darkgrid")
# Seadistage joonise suurus
plt.rcParams ['joonis.figsize '] = (12,4)
 
# Laadige näidisandmekogum
flight_dataset = sns.load_dataset ('lennud')
# Kuvage andmekogumi 5 esimest kirjet
print (lennu_andmete komplekt.pea ())
 
# Joonista kasti joonised joonis
sns.boxplot (x = 'kuu', y = 'reisijad', andmed = lennu_andmete komplekt, värv = 'sinine')

Väljund

Pärast koodi käivitamist ilmub järgmine väljund.

Järeldus

Suure andmemahuga töötades võiksite andmed kokku võtta skeemi, näiteks kastikraani abil. Selles õpetuses kasutati mitmeid näiteid, kuidas genereerida kahe Pythoni teegiga kastiplaanid.

Kommertsmängumootorite avatud lähtekoodiga sadamad
Tasuta, avatud lähtekoodiga ja platvormidevaheliste mängumootorite puhkusereise saab kasutada nii vanade kui ka mõnede üsna hiljutiste mängude pealkir...
Parimad Linuxi käsurea mängud
Käsurida pole Linuxi kasutamisel lihtsalt teie suurim liitlane - see võib olla ka meelelahutusallikas, sest saate seda kasutada paljude lõbusate mängu...
Parimad Linuxi mängupuldi kaardistamise rakendused
Kui teile meeldib mängida Linuxis mänge tavalise klaviatuuri ja hiire sisestussüsteemi asemel mängupuldiga, on teie jaoks mõned kasulikud rakendused. ...