Miary Tendencji Centralnej

Udostępnij na:

Miary Tendencji Centralnej to jedna z trzech podstawowych grup statystyk opisowych. Dwie pozostałe to miary rozproszenia (dyspersji) i miary symetrii rozkładu. Za pomocą każdej z tych grup możemy dokonać „liczbowej charakterystyki” rozkładu wartości interesującej nas zmiennej, grupy wyników. Co to znaczy?

Wyobraźmy sobie, że jesteśmy producentem eleganckiej odzieży eksportującym swój towar do dwóch krain: Krainy Krasnali  i Krainy Wielkoludów. Zebraliśmy właśnie dane na temat liczby sprzedanych rozmiarów ( S, M, L) w tych dwóch krainach. Wiemy, że w minionym miesiącu w Krainie Krasnali sprzedaliśmy 13 sztuk ubrań w rozmiarze „S”, 5 w rozmiarze „M” i 1 w rozmiarze „L”, natomiast w Krainie Wielkoludów sprzedano 5 ubrań w rozmiarze „S”, 3 w rozmiarze „M” i „14” w rozmiarze L.

Do miar tendencji centralnych zaliczamy dominantę, medianę i średnią

Oczywiście możemy porównać sprzedaż w Krainie Krasnali i Wielkoludów „na oko” i na tej podstawie stworzyć strategię rozwoju naszej firmy, ale zdecydowanie lepszym  rozwiązaniem będzie posłużenie się pewnymi wielkościami służącymi do charakterystyki analizowanych grup wyników. Do tego służą właśnie statystyki opisowe: miary tendencji centralnej, miary rozproszenia (dyspersji) i miary symetrii rozkładu. Dlaczego wyróżniamy aż trzy grupy statystyk opisowych? Bo tak jak w przypadku eleganckiej sukni możemy ją opisać pod kątem ceny, jakości wykonania i stylu, tak otrzymane wyniki możemy scharakteryzować pod kątem różnych aspektów: miejsca największej koncentracji wyników (miary tendencji centralnej), zróżnicowania w rozrzucie wyników wokół centralnego punktu rozkładu (miary rozproszenia), czy kształtu rozkładu (miary symetrii rozkładu).

W tym artykule scharakteryzujmy otrzymane przez nas wyniki przez pryzmat miar tendencji centralnej, czyli opiszemy miejsce największej koncentracji wyników.  Możemy to zrobić za pomocą: dominanty (nazywaną również modalną, modą), mediany i średniej.

Najprostszą miarą tendencji centralnej jest wartość najczęściej występująca, czyli  właśnie dominanta. Dla nas jako producentów eleganckiej odzieży bardzo ważne jest ustalenie, który z rozmiarów jest najczęściej kupowany zarówno w Krainie Krasnali i Krainie Wielkoludów.  Biorąc pod uwagę uzyskane powyżej wyniki nie powinniśmy mieć z tym żadnego problemu. W Krainie Krasnali najczęściej zakupywanym rozmiarem jest „S”, a więc Mo (dominata) = „S”, w Krainie Wielkoludów Mo (dominata) = „L”.

Najprostszą miarą tendencji centralnej jest wartość najczęściej występująca, czyli dominanta

Najłatwiej jest odczytać wartość dominaty za pomocą wykresów słupkowych. Co istotne, dominantę możemy wyznaczyć dla różnego rodzaju zmiennych np. nominalnych (kolor zakupywanej odzieży), porządkowych (rozmiar zakupywanej odzieży), czy ilościowych (cena zakupywanej odzieży).

Kolejną istotną dla nas kwestią jest ustalenie, jaką przeciętną kwotę mieszkańcy Krainy Krasnali płacili za ubrania w rozmiarze „S”, najpopularniejszy rozmiar. Możemy to zrobić za pomocą mediany (nazywanej także wartością środkową, przeciętną, lub drugim kwartylem) . Załóżmy, że tych 13 ubrań  w rozmiarze „S”, zostało sprzedanych po następujących cenach (wyrażonych w złotych kamieniach): 1,1,1,1, 1, 2, 2, 2, 3, 3, 3,4, 5. Mediana, która jest wartością dzielącą uszeregowany zbiór danych „na pół” (poniżej i powyżej mediany znajduje się 50% wszystkich obserwacji) pokazuje, że przeciętny koszt zakupu eleganckiej odzieży w rozmiarze „S” przez mieszkańców Krainy Krasnali to 2 złote kamienie (7 element zbioru).

Mediana jest wartością dzielącą uszeregowany zbiór danych „na pół” (poniżej i powyżej mediany znajduje się 50% wszystkich obserwacji)

W trzynastoelementowym zbiorze łatwo jest wyznaczyć medianę, ale co w sytuacji kiedy nasz zbiór składa się z większej liczby elementów? Wtedy warto posłużyć się wzorem na pozycję mediany:

Wzór na pozycję mediany

gdzie „n” to liczba elementów w zbiorze. W naszym przykładzie pod „n” wstawiamy więc 13 i przeprowadzamy następujące obliczenia: (13+1)/ 2. Wynik jaki otrzymujemy – „7” wskazuje na element zbioru, którego wartość będzie równa wartości mediany. W tym przypadku jest to element „7”, któremu przypisana jest wartość „2”, czyli mediana dla naszego zbioru wynosi dwa złote kamienie. Co ważne, za każdym razem, kiedy będziemy chcieli wyznaczyć w naszym zbiorze medianę musimy pamiętać, aby zebrane przez nas dane uszeregować od najmniejszych po największe, albo od największych po najmniejsze. Dlatego też mediany nie wyznaczymy dla zmiennych nominalnych np. kolorów zakupywanych ubrań, gdyż takiego zbioru jak: zielony, czerwony, fioletowy, niebieski itd. nie jesteśmy w stanie uszeregować od wartości najmniejszych po największe, czy od największych po najmniejsze.

Na koniec, chcemy ustalić ile średnio ubrań w rozmiarze „S”, „M” i „L” sprzedaliśmy w obu krainach w minionym miesiącu. W tym przypadku musimy skorzystać ze średniej arytmetycznej, kolejnej miary tendencji centralnej. Jak wyliczyć średnią liczbę sprzedanych ubrań w rozmiarze „S” przez naszą firmę? Sumujemy liczbę ubrań sprzedanych w Krainie Krasnali i Krainie Wielokoludów (13 +5) i dzielimy przez liczbę wyników (dwie krainy = dwa wyniki), czyli

Przykład obliczeń dla średniej arytmetycznej

Wyniki średniej arytmetycznej wskazują, iż w minionym miesiącu średnia sprzedaż ubrań w rozmiarze „S” to 9 sztuk. Analogicznie postępujemy w przypadku wyliczenia średniej liczby sprzedanych ubrań w rozmiarze „M” i rozmiarze „L”. Tu wyniki przedstawiają się następująco: średnia sprzedaż ubrań w rozmiarze „M” w minionym miesiącu  to 4 sztuki, w rozmiarze „L” – 7,5 sztuki. Przy liczeniu średniej arytmetycznej musimy pamiętać, iż  jest ona najbardziej „ekskluzywną” miarą tendencji centralnej i możemy ją policzyć tylko i wyłącznie dla zmiennych ilościowych, czyli np. liczby sprzedanych ubrań, czy ich ceny. Średniej arytmetycznej nie policzymy dla zmiennych porządkowych (rozmiar ubrań), czy zmiennych nominalnych (kolor ubrań).

Korzystając z trzech miar tendencji centralnej (dominanty, mediany, średniej arytmetycznej), które pozwalają opisać miejsce największej koncentracji wyników, pokazaliśmy ile cennych informacji możemy uzyskać na temat analizowanego przez nas zbioru danych. Ale możemy dowiedzieć się o nim jeszcze więcej, analizując go przez pryzmat dwóch pozostałych grup statystyk opisowych tj. miar rozproszenia (dyspersji) i miary symetrii rozkładu.

Udostępnij na:

Comments are closed.