Wariancja

Udostępnij na:

Wariancja to obok rozstępu, odchylenia standardowego i współczynnika zmienności jedna z podstawowych miar rozproszenia (dyspersji). Informuje nas o tym jak bardzo wartości analizowanego przez nas zbioru rozrzucone są wokół średniej. Interpretacja wariancji jest następująca: im wyższa wartość wariancji, tym większe rozproszenie wyników. Symbol wariancji to SD2. Gdybyśmy chcieli zdefiniować wariancję, moglibyśmy powiedzieć, że jest to suma kwadratów odchyleń wyników od średniej dzielona przez liczbę wyników minus jeden. Brzmi strasznie i z pewnością dla wielu z Was dość enigmatycznie. Spójrzmy więc na wariancję oczami praktyka. Odwołajmy się do konkretnego przykładu i zobaczmy po co w ogóle obliczmy taką statystykę jak wariancję.

Jesteśmy właścicielami sieci sklepów z ekskluzywną odzieżą, w której zostawiamy dużą dowolność sprzedawcom w przyznawaniu rabatów dla stałych klientów. Postanowiliśmy jednak porównać wysokość rabatów przyznawanych w  dwóch różnych butikach należących do naszej sieci. W sklepie A w minionym miesiącu przyznano 5 rabatów: 4%, 4%, 5%, 6% i 6%. W sklepie B odnotowano zaś  takie rabaty: 2%, 2%, 5%, 5%, 8%, 8%. W obu przypadkach średni poziom zniżki jaki został udzielony stałemu klientowi wynosi 5%. Przyglądając się jednak bliżej dwóm analizowanym zbiorom danych (zestawieniom rabatów ze sklepu A i B) bez trudu zobaczymy, że w sklepie A wszystkie przyznane rabaty zbliżone są do średniej – 5%, w sklepie B można zaś było otrzymać nawet 8% rabat, ale i zdarzały się obniżki o zaledwie 2%. W tym przypadku zróżnicowanie rabatów jest dużo większe. Dostrzeżenie, tej jakże ważnej różnicy, byłoby bardzo trudne, gdybyśmy analizowali większe zbiory danych np. gdyby w każdym z analizowanych przez nas sklepów w minionym miesiącu przyznano aż 50 rabatów. I tu z pomocą przychodzą właśnie miary rozproszenia, w tym wariancja, które pokazują nam jak bardzo wartości naszej zmiennej rozrzucone są wokół średniej.

Obliczając średnią arytmetyczną dla danego zbioru warto również policzyć wariancję - zróżnicowanie wyników

Zobaczmy więc jaka jest wariancja (zróżnicowanie, rozproszenie) wysokości rabatów przyznawanych w sklepie A i w sklepie B. Jaki jest wzór na wariancję? Jak obliczyć tę statystykę?

W pierwszym kroku od każdego wyniku wchodzącego w skład analizowanego przez nas zbioru musimy odjąć średnią [X- M]. W przypadku sklepu A, musimy więc wykonać 5 następujący działań: 4%- 5%, 4%- 5%, 5%- 5%, 6%-5%, 6%-5%. Wyniki tych 5 działań są następujące: (-1%), (-1%), (0%), (1%), (1%). Następnie każdą z otrzymanych różnic podnosimy do kwadratu (X – M)2, czyli (-1%)2, (-1%)2, (0%)2, (1%)2, (1%)2. W wyniku potęgowania otrzymujemy następujące wyniki: 1%2, 1%2, 0%2, 1%2, 1%2. Teraz dodajemy do siebie te wyniki. Suma wynosi 4%2. Poniżej tabelka, gdzie możecie prześledzić raz jeszcze poszczególne obliczenia.

Obliczenie wariancji krok po kroku

Ostatnim działaniem jakie musimy przeprowadzić, to podzielenie otrzymanej sumy przez liczbę wyników (w naszym przypadku 5; 5 przyznanych rabatów) pomniejszoną przez jeden (n-1), czyli 4%2/ 5 -1. Wynik tego działania, a jednocześnie wynik wariancji, to 1%2.

Wariancja to suma kwadratów odchyleń wyników od średniej dzielona przez liczbę wyników minus jeden

Czy taka wartość wariancji świadczy o dużym, małym rozproszeniu wyników ciężko powiedzieć. Z interpretacją wariancji jest pewien problem. Jak pewnie zauważyliście jej wartość podawana jest w jednostkach kwadratowych, co może wprowadzać pewną niejasność, dlatego też lepiej jest posługiwać się inną miarą rozproszenia – odchyleniem standardowym, które jest pierwiastkiem kwadratowym z wariancji, czyli √SD2. Odchylenie standardowe wynosi w naszym przypadku wynosi 1%, oznacza to że w sklepie A średni poziom przyznawanych rabatów to 5%, ale większość klientów otrzymało rabaty w wysokości 5% +/- 1%. A jak to wygląda w przypadku sklepu B?

Skorzystajmy z tego samego wzoru na wariację, co powyżej. W wyniku przeprowadzania kolejnych działań powinniśmy otrzymać następujący wynik – 7%2, to wartość wariancji dla wysokości rabatów przyznanych w sklepie B. Wartość wariancji jest w tym przypadku o wiele większa niż w sklepie A (1%2). Biorąc więc pod uwagę,  że im wyższa wartość wariancji, tym większe rozproszenie wyników, możemy stwierdzić, iż zróżnicowanie wysokości rabatów przyznawanych w sklepie B jest większe niż w sklepie A. Na koniec możemy jeszcze policzyć odchylenie standardowe wysokości rabatów w sklepie B, czyli √7%2. Odchylenie standardowe w tym przypadku to 3%. Podsumowując, w sklepie B średni poziom przyznawanych rabatów to również 5%, ale większość klientów otrzymywało rabaty w wysokości 5% +/- 3%, tymczasem w przypadku sklepu A rabaty oscylowały w wysokości 5% +/- 1%.

Udostępnij na:

Dodaj komentarz

Twój adres e-mail nie zostanie opublikowany. Pola, których wypełnienie jest wymagane, są oznaczone symbolem *