Štatistika v Exceli ako prechádzka záhradou?

článok na blog uverejnený: 12. júna 2020

Už samotné slovo štatistika odrádza ľudí od používania. Neznie dôveryhodne. (Veríte štatistikám?) Neznie ani ľahko. Má korene kdesi v latinčine… Hoci jej výsledky človeku často pomôžu takmer bez námahy k lepšiemu životu, v prípade firmy k lepším hospodárskym výsledkom. Spraviť dnes jednoduchú a výpovednú štatistiku, ktorá posunie vpred, nie je náročné. Najmä vďaka príťažlivým postupom v Exceli (to píšem ako človek, ktorý sa so štatistikou od vysokej školy naozaj nekamarátil). V Exceli som už dlho doma, ale tejto oblasti som sa úspešne desaťročia vyhýbal. Na svoju škodu.

Štúdijný priemer, priemerný zárobok, priemerný vek obyvateľstva, maximálna teplota, minimálna mzda,… Pojmy, s ktorými sa stretávame v bežnom živote od základnej školy. Používame ich bez toho, aby sme si uvedomovali, že pracujeme so štatistickými údajmi.

Podnikáte a už pár rokov stagnujete? Občas vytiahnete z vrecka peniaze a stávkujete? Investujete do fondov? Na FOREXe? Ste úspešný? Mohli by ste získať viac? Chcelo by to možno len trošku iný pohľad na údaje charakteristické pre váš biznis. Či už vaše alebo konkurenčné. Čo myslíte, prečo takmer všetky významné firmy platia vlastné tímy analytikov? Prečo spracovávajú big data a prečo sú pozície Data Science a Data Analytic veľmi dobre platené? Data Science, Big Data alebo Data Analytics hovoria aj o dosiahnutých výsledkoch, ale súčasne môžu odhaliť veľa o skrytých rezervách. Vo firme i doma, kde nepotrebujete big data. Ich základom je štatistika.

Kolega Laco Šipeky pripravil kurz, ktorý ma naozaj zaujal. Preto som sa naň prihlásil. A poctivo ho absolvoval. Toto je reportáž o kurze štatistiky v IT Learningu, ktorý mi dal iný pohľad na (neobľúbenú) štatistiku.

štatistika v Exceli - úvod školenia - lektor Mgr. art. Ladislav Šipeky, PhD.

Základy štatistiky – s čím a ako

Množstvo digitálnych údajov, ktoré sa ukladajú o ľudskej činnosti, rastie šialene – približne raz za dva roky sa zdvojnásobuje. Odhad hovorí, že v roku 2020 sa v súvislosti s každým človekom tejto planéty zaznamenáva každú sekundu okolo 1,7 megabajtu nových informácií. Naozaj šialené číslo, súhlasíte?
Ich analýza pomáha rozumieť potrebám ľudí, uspokojovať ich, odhaľovať chyby (a podvody), nachádzať rezervy, plánovať trendy. Umožňuje konať strategicky a s vysokou pravdepodobnosťou vidieť našu budúcnosť. Sci-fi?

Či už chceme vedieť priemer známok, ktorý sme sa naučili vypočítať už na základnej škole, alebo nás zaujímajú štatistické údaje súvisiace s naším životom, podnikaním, potrebujeme štatistiku.

Na analýzu údajov používame jej postupy, nástroje. Či použijeme popisnú (deskriptívnu), alebo induktívnu, závisí od údajov, ktoré máme k dispozícii a od cieľov. Oblasti, ktorým sa štatistika venuje v širšom slova zmysle a celý postup od zdrojových údajov k prezentácii výsledkov, vidíme na obrázku.

štatistika v Exceli - jednotlivé fázy procesu analýzy údajov od prípravy a zberu cez samotnú analýzu až po interpretáciu a prezentáciu výsledkov

Štatistika v Exceli

Na to, aby sme Excel mohli používať, nepotrebujeme vedieť celú štatistickú terminológiu, ale s pár výrazmi nás lektor hneď na začiatku s ľahkosťou zoznámil. Očakával som, že hneď vytiahne termíny ako štatistický súbor, štatistická jednotka, štatistický znak, hodnoty a rozsah znaku, alebo absolútnu či relatívnu početnosť jednotlivých hodnôt znaku – proste veci, ktoré sa mi na štatistike nepáčia. Nie, pekne ľudsky vysvetlil čo je čo, s čím budeme pracovať (i ako to štatistici označujú). To mi odľahlo. Inak by som mu asi nerozumel.

Začal opakovaním – pripomenutím, aké nástroje by sme mali už z Excelu poznať na to, aby sa nám komfortne pracovalo. Spolu s aktívnou ukážkou, takou bleskovkou na osvieženie vedomostí. Lebo ťažko človek porozumie takémuto zápisu funkcie

=COUNT(VYSKY[Vyska]),

ak nevie, čo znamená pojem rozsah formátovaný nástrojom Tabuľka. Skrátene sa tomu hovorí aj formátovaná tabuľka, alebo tabuľka Excel. Má svoje meno i pomenovania stĺpcov, s ktorými vieme efektívne pracovať. Znalosť obsahu kurzu Excel II pre mierne pokročilých sa tu ukázala naozaj žiadúca. Na kurze nebol časový priestor na vysvetľovanie rozdielov medzi vizuálnym a funkčným formátovaním, lektor len v úvode spomenul, že to preberáme na kurze Excel I 🙂

štatistika v Exceli - kurz - analýza a rozptyly

Popisná štatistika v praxi

Po zopakovaní nás lektor zoznámil s podrobnejším popisom procesu štatistického spracovania údajov sprevádzaným ľahko pochopiteľnými príkladmi, špeciálne s prehľadom deskriptívnej štatistiky. Naschvál to sem píšem, pretože samotný výraz „deskriptívna“ znie dosť znechucujúco. Lektor to vycítil a ozrejmil, že sa jedná o oblasť obsahujúcu normálne každodenné výrazy, len si to neuvedomujeme. Deskriptívny znamená po slovensky popisný. Tým, že skupinu čísel, alebo údajov popíšeme pár charakteristikami, robíme v skutočnosti popisnú – deskriptívnu štatistiku na vzorke (skupine). Napríklad uvedieme údaje ako súčet, priemer, počet čísel vo vzorke, maximum a pod. Jedným číslom alebo údajom (môže to byť napríklad meno najčastejšie nakupujúceho zákazníka) popisujeme skupinu údajov. Jasné, nie?

Taktiež nás prehľadne zoznámil s kategóriami používanými pri vlastnej analýze údajov. Poukázal na spôsoby analýzy zdrojových údajov i na rozdiel medzi interpretáciou a prezentáciou výsledkov. A ako spolu súvisia…

Základy štatistiky pre analýzu údajov

A po takomto úvode, nahliadnutí do problematiky v jej šírke, sme začali veľmi konkrétne. Základmi popisných štatistických údajov a štatistickými nástrojmi v Exceli, ktoré nám umožňujú rýchlo sa prepracovať k výsledkom.

Štatistika v praxi vie človeka prekvapiť. Nielen výsledkami, ale aj požiadavkami, postupom. Zvolíme si nevhodné údaje alebo nevhodný spôsob výslednej zostavy a sme… na začiatku. Preto je fajn, keď zdrojovým údajom rozumieme. Aby ich vedel Excel zobraziť tak ako potrebujeme, treba ich vhodne usporiadať. A podľa cieľa vybrať správny nástroj. Údajom je potrebné rozumieť aj na konci, keď sú už výsledky zobrazené. Ako ich správne interpretovať, ak nerozumieme o čom to celé je?

Úplné základy štatistiky v Exceli v skutočnosti pozná každý trolinku zorientovaný používateľ. Skrývajú sa za nástrojom označeným symbolom Σ (súčet, priemer, počet, maximum, minimum) a vidno ich tiež na stavovom riadku pri označení rozsahu. Pokročilejšie štatistické funkcie treba hľadať inde – nájdeme ich v Exceli na karte Vzorce v knižnici funkcií (na obr.).

štatistika v Exceli - kurz - začiatok prehľadu štatistických funkcií v knižnici funkcií v Exceli

Je ich tam celkom pekná kôpka, čo poviete? A to ich vidno iba po C… K dátumu písania tohoto článku ich bolo spolu 111. Prehľad štatistických funkcií v Exceli si môžete stiahnuť tu alebo na konci.

Jasné, že k stovke prebraných sme sa ani zďaleka nepriblížili. Okrem základných už spomínaných popisných štatistických funkcií lektor vybral niektoré časté. Taký priemer – pamätáte si možno zo školy, že je aritmetický, geometrický, harmonický. Kedy ktorý použiť by mal každý analytik určite vedieť.  Potešil aj výklad k pojmu smerodajná odchýlka a ako ju počítať, tiež rozptyl, modus, vysvetlenie kvantilov a ich najznámejšie podoby (medián, kvartil, percentil) a súvisiace excelovské funkcie. No a štatistika bez poetiky by bola suchá, takže došlo i na strmosť a šikmosť, a nakoniec v tejto časti ostala triedna početnosť a štandardizácia.

Ešte dopoludnia sme sa dozvedeli viac o tom, čo je histogram a Paretov graf a niečo viac o ich obsahu a špecifikách v Exceli. S odkazom na kurz Excel – grafy I, kde sa o nich (a ďalších vizualizačných prostriedkoch Excelu) dá dozvedieť viac.

Popoludní sa na rad dostala korelácia aj kovariencia, aj intervaly spoľahlivosti. Znie to možno trochu desivo. No keď vám to niekto vysvetlí spôsobom, ktorému naozaj rozumiete, máte pocit, že ste sa práve naučili jazyk mimozemšťana a zistili, že býva len pár galaxií ďalej…

Nemenej zaujímavá bola aj analýza časových radov a lineárna regresia, ktoré umožňujú odhadovať budúcnosť. To je niečo!
A v rámci hodnotenia skúmaného súboru lektor spomenul ešte aj analýzu rozptylu. To bol kopec informácií!
Vďaka jasnému podaniu lektora a skvele voleným príkladom to bola našťastie prechádzka záhradou.

No ešte nebol koniec. Nie. Naostatok sme sa venovali analytickému nástroju Data Analysis s jeho širokými možnosťami (treba ho doinštalovať cez Doplnky v časti Súbor > Možnosti). Objaví sa na karte Údaje vpravo na paneli Analysis. Podobne ako všetky funkcie nie je do slovenčiny preložený, takže po spustení sa objavia anglické štatistické výrazy.

Štatistika v Exceli naozaj nie je nuda!

štatistika v Exceli - okno pre výber typu analýzy dát - Data Analysis

Data Analysis

Po kliknutí na nástroj Data Analysis na karte Údaje sa objaví okienko, ktoré vidíme tu naľavo. Podľa toho, aký druh štatistickej analýzy chceme robiť, si z ponuky vyberieme (áno, je tam napríklad aj histogram, nástroje na Fourierovu analýzu, tri druhy Anova atď.).

Deskriptívna štatistika

My sme vybrali Descriptive Statistics – popisné štatistiky. Vzápätí sa objaví nové okno rozdelené na dve hlavné oblasti – vstup (Input) a možnosti výstupu (Output options). V prípade nejasnosti anglických  popisov pohľadajte na internete českú verziu okienka, našiel som ich niekoľko – jednu nájdete aj s dobrým popisom napríklad v dokumente Popisná štatistika v programe MS Excel (na str. 16).
V prípade, že do rozsahu zdrojových údajov zahŕňame aj hlavičku, stačí začiarknuť chcekbox Labels in First Row. A ešte označiť Summary Statistics – to je to, čo chceme.

štatistika v Exceli - okno pre nastavenie parametrov v Exceli pre výsledky Popisná štatistika

Po nastavení rozsahu vstupnej oblasti a požadovaných popisných štatistických údajov Excel vygeneruje tabuľku so základnými štatistickými charakteristikami. Výstup obsahuje údaje – stredná hodnota, štandardná chyba, medián, modus, štandardná odchýlka, rozptyl, špicatosť, šikmosť, rozsah (rozdiel max-min), minimum, maximum, súčet a počet údajov.

štatistika v Exceli - kurz - analýza údajov, popisná (deskriptívna) štatistika - výstup v angličtine

Pozor, výsledné údaje Excel počíta z výberového súboru! Mierne sa líšia od tých, ktoré spočítame pre celý výber pomocou funkcií (na obrázku ich vidíme vpravo, aj s použitými vzorcami – Histogram vo vzorci je názov hárka so zdrojovými údajmi, nedajte sa zmiasť 🙂 ).

…a všelijaké iné veci sa človek dozvie na kurze štatistiky v IT Learningu.

štatistika v Exceli - kurz - analýza a rozptyly, súvislosť s histogramom

Pred záverom

Čo spraví triezvy človek, keď uvažuje o zmene zamestnania? Keď uvažuje o lepšom plate, bývaní, či o inom pohľade na svoj život? Spravidla si spraví hodnotenie minulosti (akúsi štatistiku) a hľadá rezervy. V prípade, že sú ľahko dostupné, zavedie ich okamžite do života, ak sú vzdialené, zvažuje ich použitie. Ocení svoje silné a zhodnotí slabé stránky, možnosti v prostredí, kde sa nachádzal doteraz (robia to aj podniky, nazýva sa to SWOT analýza :)) A rozhoduje, kam sa uberať ďalej (SPACE analýza). A ako…
Mimochodom – SWOT, ani SPACE nepatria do štatistiky, pracujú s jej výsledkami.

Ak máte chuť pozerať sa na svet okolo seba cez jeho charakteristiky, pracovať s nimi, hľadať v nich súvislosti a skryté možnosti, začnite štatistikou. Keď sa pohrabete v kopách učebníc základov štatistiky na internete, zistíte, že už len terminológia vás dokáže znechutiť. Databázisti a analytici používajú svoj vlastný jazyk, ktorý znie síce slovensky (s množstvom anglických termínov, ktoré sa ani nesnažia prekladať), ale môže byť ťažký na trávenie. Na kurze sa môžete spýtať lektora. Aj tri-štyri razy. Odpovie. Aj my sme sa pýtali 🙂

Medzi nami – vyštudovaného matematika a pedagóga, akým je kolega Laco, len tak nezaskočíte. Na všetko vedel odpovedať. A ľudsky, zrozumiteľne.
Ani ďalšieho „štatistického“ kolegu, ktorý vedie tento kurz, by sme asi nezaskočili. Ako napísala jedna z účastníčok, ktorá bola na kurze, na jeho adresu: „Keď zistíte na kurze, že vám prednáša lektor, ktorý pracoval na štatistickom úrade a je génius na Excel, máte fakt dobrý pocit. Dostala som presne to, čo som očakávala.“

Záver

Moje pocity po kurze?
Rozumel som 99 %. Kurz potešil okrem mňa i dve začínajúce analytičky, aj dvoch štatistikov so skúsenosťami, ktorí sa potrebovali podľa mňa len pozrieť na svoje metódy iným pohľadom.

Na kurze štatistiky v Exceli (oficiálne sa kurz volá Excel – štatistické výpočty a analýzy) nás lektor uviedol do problematiky ľahkým krokom, miestami i skvelým humorom. Od toho, čo sme poznali, cez vhodne vybrané príklady zo života až do oblastí, ktoré otvárajú nové možnosti videnia sveta. Školenie som absolvoval v učebni v novembri, ešte pre cornavírusom. Po pár dňoch po ňom som sám pre seba skonštatoval, že štatistika je celkom zaujímavá oblasť a začína sa mi páčiť.

Doma som si totiž vďaka poznatkom zo školenia spravil pokročilejšie investičné analýzy, prepočítal z iných pohľadov perspektívy hypotéky a porovnal s údajmi, ktoré som som už poznal. A začal zvažovať zmenu stratégie. Našiel som na internete teploty a zrážky v oblasti, kam som sa chystal na zimnú dovolenku, vypočítal aké sú priemerné, maximálne a minimálne a tiež mieru ich neistoty. Posledná charakteristika rozhodla. Vďaka nej som zmenil na poslednú chvíľu dovolenkovú destináciu. Ani sekundu som to neskôr neoľutoval.
Taká štatistika je dobrá vec nielen vo firmách…

Pán kolega, dodatočne ešte raz za všetkých účastníkov – páčilo sa nám, ďakujeme!

na stiahnutie

prehľad štatistických funkcií v Exceli 2019 (rev. 2020) s popisom a linkami priamo do Pomocníka

autorom článku je: Ján Tóth
- absolvent FEI STU a FM UK. Po ukončení štúdia pracoval rok vo vydavateľstve ako vedúci IT, následne na vedúcich pozíciách súkromných firiem a tiež ako riaditeľ slovenského zastúpenia nadnárodnej spoločnosti. Autor a spoluautor kníh z oblasti IT, článkov z oblasti zdravia a kozmetiky, prekladateľ, prednášateľ, v súčasnosti pracuje ako lektor a konzultant na voľnej nohe.

Páčil sa vám článok? Pošleme vám podobné.
Aktivujte si okamžité zasielanie noviniek a článkov – už vám od nás nikdy nič neunikne. Môžeme vás okamžite informovať o aktuálnej akcii, novinke, špeciálnej kampani či zľave alebo novom článku na našom blogu. Akonáhle sa u nás v novinkách niečo zmení alebo pridá, do pár minút vám automaticky posielame email s odkazom na novinku na našu stránku. A odhlásiť sa môžete kedykoľvek. Nič neriskujete.


Nikam neodchádzajte, pozrite si naše novinky, akcie alebo si
prečítajte ďalšie podobné články:

Podobné články z kategórie
Excel, funkcie v exceli, Kancelária a MS Office, štatistika