Miary Rozproszenia

Udostępnij na:

Miary rozproszenia (dyspersji) to kolejna podstawowa grupa statystyk opisowych, obok miar tendencji centralnej i miar kształtu rozkładu. O ile miary tendencji centralnych pozwolą nam wskazać miejsce największej koncentracji wyników w naszym zbiorze danych, miary symetrii rozkładu opisać kształt rozkładu naszych zmiennych, tak miary rozproszenia (dyspersji) pozwolą nam odpowiedzieć na pytanie: „jak bardzo uzyskane przez nas wyniki rozrzucone są wokół centralnego punktu rozkładu?”. Dla osób lubujących się we wszelkiego rodzaju definicjach podajemy krótką, zgrabną formułkę: „miary rozproszenia (dyspersji) to miary wykorzystywane do określenia rozkładu wartości zmiennej wokół wartości centralnej np. średniej. Do miar rozproszenia zaliczamy takie statystyki jak: rozstęp, odchylenie standardowe, wariancję, współczynnik zmienności”. Tyle teorii. Zobaczmy teraz jak każda z tych miar rozproszenia (rozstęp, odchylenie standardowe, wariancja, współczynnik zmienności) sprawdza się w praktyce i czemu właściwie służy.

Standardowo wcielmy się w rolę właściciela sieci butików z ekskluzywną odzieżą. Chcemy porównać zyski ze sprzedaży w dwóch naszych sklepach.

Obliczając średnią arytmetyczną warto również wyliczyć wartości dla miar rozproszenia (dyspersji)

W minionym miesiącu w sklepie na ulicy Przeciętnej sprzedaliśmy 5 sztuk odzieży w cenie: 40 zł, 40 zł, 50 zł, 60 zł i 60 zł. W drugim butiku, przy ulicy Rozwarstwienie, też sprzedaliśmy 5 ubrań, ale po następujących cenach 20 zł, 20 zł, 50 zł, 80 zł, 80 zł.  W obu sklepach sprzedaliśmy taką samą liczbę sztuk odzieży. Na prędze liczymy średnią cenę sprzedanych ubrań w obu butikach i okazuje się, iż w obu przypadkach średnia cena sprzedanych ubrań wyniosła 50 zł, ale gdy przypatrzymy się uważniej tym dwóm zbiorom  liczb (podsumowaniom sprzedaży w butiku na ul. Przeciętnej i Rozwarstwienie) zobaczymy, że te dwa zbiory znacząco różnią się od siebie. W sklepie na ulicy Przeciętnej sprzedaliśmy więcej ubrań, których cena była zbliżona do średniej ceny – 50 zł, na ulicy Rozwarstwienie częściej sprzedawaliśmy ubrania droższe (po 80 zł), poza tym  klienci częściej kupowali też  tańsze ubrania (po 20 zł). Wyobraźmy sobie teraz, że porównywana sprzedaż między dwoma butikami nie dotyczy 5 sprzedanych ubrań, ale 50. W takiej sytuacji wychwycenie „na oko” wskazanego powyżej zróżnicowania wyników wokół średniej byłoby bardzo trudne i tu z pomocą przychodzą właśnie miary rozproszenia (dyspersji), czyli rozstęp, odchylenie standardowe, wariancja i współczynnik zmienności.

Najprostszą i najbardziej intuicyjną miarą rozproszenia wyników jest rozstęp. I to właśnie od rozstępu rozpoczniemy swoją przygodę z miarami rozproszenia. Rozstęp to po prostu różnica pomiędzy największą i najmniejszą wartością występująca w danym zbiorze. Jedna z najprostszych statystyk opisowych.

Rozstęp to różnica pomiędzy największą i najmniejszą wartością występująca w danym zbiorze

Rozstęp dla ceny sprzedanych ubrań w butiku przy ul. Przeciętnej wynosi 20 zł (60 zł – 40 zł), przy ul. Rozwarstwienie 60 zł (80 zł – 20 zł). Już za pomocą tak prostej miary rozproszenia jak rozstęp możemy zidentyfikować znaczącą różnicę w dwóch analizowanych przez nas zbiorach danych, ale  miara ta  – rozstęp może okazać się zawodna.

Wyobraźmy sobie bowiem, że sprzedaż w minionym miesiącu w dwóch naszych butikach wyglądała w sposób następujący: przy ulicy Przeciętnej: 20 zł, 40 zł, 40 zł, 50 zł, 60 zł, 60 zł, 80 zł, przy ulicy Rozwarstwienia: 20 zł, 20 zł, 20 zł,  50 zł, 80 zł, 80 zł, 80 zł. Zarówno średnia arytmetyczna, jak i rozstęp dla obu tych zbiorów jest taki sam. Rozstęp wynosi 60 zł, średnia arytmetyczna 50 zł. Jednak po raz kolejny widzimy, że przy ulicy Rozwarstwienie częściej sprzedawaliśmy najtańsze (20 zł), jak i najdroższe (80 zł) ubrania z naszej kolekcji. Na pewno też po raz kolejny ciężko byłoby nam dostrzec taką różnicę, gdybyśmy w minionym miesiącu sprzedali więcej sztuk odzieży np. 50. I tu z pomocą poprzychodzą kolejne miary rozproszenia np. wariancja.

Wariancja to suma kwadratów odchyleń wyników od średniej podzielona przez liczbę wyników minus jeden. U wielu z Was pewnie włos zjeżył się teraz na głowie. Brzmi strasznie. Nie taki diabeł jednak straszny jak go malują. Wystarczy, że zajrzycie do linku „Wariancja”, który umieszczony jest w zakładce „Miary rozproszenia” a dowiedziecie się dokładnie, czym jest owa miara rozproszenia oraz jak ją obliczyć. Obliczając wariancję cen sprzedanych ubrań przy ulicy Przeciętnej (20 zł, 40 zł, 40 zł, 50 zł, 60 zł, 60 zł, 80 zł) powinniście uzyskać następujący wynik 366, 66 zł2, zaś w przypadku butiku przy ulicy Rozwarstwienie (20 zł, 20 zł, 20 zł,  50 zł, 80 zł, 80 zł, 80 zł) 900 zł2.

Im większa wartość wariancji, tym większe rozproszenie wyników wokół średniej

Porównując wyniki obu wartości wariancji można stwierdzić, iż w przypadku butiku przy ulicy Rozwarstwienie mamy do czynienia z większym rozproszeniem wyników wokół średniej (wyższa wartość wariancji)  – sprzedawaliśmy zarówno ubrania bardzo tanie, jak i bardzo drogie, w przypadku butiku przy ulicy Przeciętnej to zróżnicowanie jest już mniejsze. Z interpretacją wariancji jest jednak pewien problem. Jak pewnie zużyliście wartość wariancji podawana jest w jednostkach kwadratowych [zł2], aby więc uniknąć wszelkiego rodzaju nieporozumień, lepiej posługiwać się odchyleniem standardowym, kolejną miarą rozproszenia.

Odchylenie standardowe to pierwiastek kwadratowy z wariancji. Dzięki zastosowanemu pierwiastkowaniu  odchylenie standardowe jest wyrażane w tych samych jednostkach, co wartość zmiennej (w naszym przypadku w  zł). Odchylenie standardowe  dla cen sprzedanych ubrań w butiku przy ul. Przeciętnej wynosi 19,14 zł (√366,66 zł2), a w butiku przy ul. Rozwarstwienie 30 zł (√900 zł2).

Odchylenie standardowe to pierwiastek kwadratowy z wariancji

Oznacza to, iż w obu butikach średnia cena sprzedawanych ubrań wynosi 50 zł, ale w butiku przy ul. Przeciętnej zakupy poszczególnych klientów odchylają się od tej kwoty o +/- 19, 14 zł, a w przypadku klientów z ul. Rozwarstwienie aż o +/- 30 zł.

Warto zapamiętać, iż wariancja i odchylnie standardowe to miary rozproszenia, które dostarczają nam tę samą informację. Znając wariancję, znamy odchylenie standardowe i odwrotnie. Ze względu jednak na „przyjazność” interpretacji lepiej jest się posługiwać odchyleniem standardowym.

Na koniec została nam jeszcze jedna miara rozproszenia. Ponieważ w dzisiejszych czasach wiele wartości podawanych jest %, warto pamiętać o  współczynniku zmienności, którego wartość podawana jest właśnie w %. Współczynnik zmienności to iloraz odchylenia standardowego i średniej arytmetycznej przemnożony przez 100% (SD/ M*100%). Ceny sprzedanych ubrań przy ul. Przeciętnej będą charakteryzować się następującym współczynnikiem ziemności 38,28%, przy ul. Rozwarstwienie zaś 60%. Jest to kolejna miara rozproszenia, która informuje nas o tym, iż zróżnicowanie cenowe sprzedawanych ubrań na ul. Przeciętnej jest mniejsze niż w przypadku ubrań sprzedawanych na ul. Rozwarstwienie. Szczegółową interpretację współczynnika zmienności znajdziecie w zakładce „Miary rozproszenia” pod linkiem „Współczynnik zmienności”.

Tych kilka pobieżnych analiz, obliczenie rozstępu dla analizowanych przez nas zbiorów danych, wariancji, odchylenia standardowego, a także współczynnika zmienności każe nam przypuszczać, iż mimo, że średnia cena sprzedawanych ubrań w obu naszych butikach jest taka sama (50 zł), to w obu sklepach mamy do czynienia z różnymi typami klienta. Do sklepu na ul. Przeciętnej przychodzą raczej klienci średniozamożni, którzy kupują ubrania po cenie zbliżonej do średniej ceny sprzedawanych produktów – 50 zł, sklep na ul. Rozwarstwienie odwiedzają zarówno klienci o mniej zasobnych portfelach, jak i nieco bardziej zamożni, kupowane są tu produkty bardzo drogie, ale i bardzo tanie. To bardzo cenna informacja dla każdego przedsiębiorcy, a uzyskana dzięki niezastąpionym miarą rozproszenia.

Udostępnij na:

Comments are closed.