Archive for admin

Obraz1

Skośność – jak policzyć w Excelu?

Skośność jest statystyką, za pomocą której określamy asymetrię rozkładu analizowanej zmiennej. Dzięki skośności dowiemy się jak wyniki naszej zmiennej kształtują się wokół średniej. Czy ich rozkład zbliżony jest do rozkładu normalnego (współczynnik skośności „0”),  czy też może mamy do czynienia z rozkładem dodatnioskośnym – prawoskośnym (współczynnik skośności „> 0”) lub ujemnoskośnym – lewoskośnym (współczynnik skośności „< 0”). Dokładne informacje na temat skośności: jakich informacji dostarcza, jak interpretować tę statystykę możecie przeczytać w artykuleSkośność w boksie „Miary Kształtu Rozkładu”. Dzięki temu artykułowi zaś dowiedzie się jak policzyć skośność w Excelu?  Jest to bardzo proste.

Zacznijmy od przygotowania odpowiedniej bazy w Excelu, na której pokażemy jak krok po kroku wyliczyć skośność. Jako właściciele dwóch sklepów z ekskluzywną odzieżą chcemy sprawdzić jakie są rozkłady rozmiarów sprzedanych przez nas ubrań w dwóch sklepach: sklepie A i sklepie B. W minionym miesiącu w sklepie A sprzedano 6 sztuk odzieży w następujących rozmiarach: 38,34, 38, 38, 42 i 32. W sklepie B również sprzedano 6 ubrań, ale w następujących rozmiarach: 34. 34, 44, 34, 44, 43. Baza danych w Excelu z tymi zmiennymi powinna wyglądać tak:

Skośność 1

Baza danych gotowa, można rozpoczynać obliczenia. Zacznijmy od obliczenia współczynnika skośności dla rozmiarów sprzedanych ubrań w sklepie A. W dowolnej pustej komórce arkusza kalkulacyjnego Excel musimy wpisać odpowiednią formułę:

Skośność 2

 

A2 i A7 to pierwsza i ostania  komórka Excela, gdzie zakodowane zostały rozmiary sprzedanych ubrań w sklepie A. Gdyby nasze dane zostały zakodowane np. w kolumnie „F” wtedy należałoby wpisać następującą formułę: =skośność(F2:F6). W arkuszu kalkulacyjnym Excel wpisana formuła będzie wyglądać tak:

Skośność 3

Teraz wystarczy wcisnąć Enter, a program Excel błyskawicznie wyliczy dla nas wartość współczynnika skośności.

Skośność 4

Współczynnik skośności w tym przypadku wynosi -0,16. Jest ujemny, „< 0”, co oznacza, że w przypadku rozmiarów ubrań w sklepie A mamy do czynienia z rozkładem lewoskośnym – więcej jest wyników powyżej średniej.

Policzmy teraz współczynnik skośności dla sprzedanych ubrań w sklepie B. Zrobimy to dokładnie tak samo jak w przypadku sklepu A, z tym że tu wpisana do arkusza kalkulacyjnego Excel  formuła będzie wyglądała tak: =skośność(B2:B7). Wartość współczynnika skośności w tym przypadku wynosi 0,02. Rozkład jest lekko prawoskośny, dodatni („> 0”),  co oznacza, że w przypadku rozmiarów ubrań w sklepie B  więcej jest wyników poniżej średniej.

Skośność 5

Na koniec  mamy dla Was krótki filmik, który pozwoli Wam jeszcze raz prześledzić sposób obliczenia skośności w Excelu.

Wariancja – jak policzyć w Excelu?

Wariancja to suma kwadratów odchyleń wyników od średniej podzielona przez liczbę wyników pomniejszoną o  jeden. Brzmi strasznie i dla wielu z Was pewnie bardzo enigmatycznie. O czym tak właściwie informuje nas wariancja?  Po co ją liczymy? Wariancja pokazuje nam jak bardzo wartości naszego zbioru rozrzucone są wokół średniej. Im wyższa wartość statystyki, tym większe rozproszenie wyników wokół średniej. O tym jak istotna jest to statystyka opisowa możecie przeczytać w artykule Wariancja w boksie „Miary Rozproszenia”. Tam też dowiedzie się jak policzyć wariancję krok po kroku. Ale wariancję możecie też obliczyć w Excelu! I jest to niezwykle proste.

Na początek stwórzmy bazę z danymi w Excelu, na podstawie których obliczymy wariancję. Weźmy konkretny przykład. Jesteśmy właścicielami sieci sklepów z ekskluzywną odzieżą. Swoim sprzedawcą zostawiamy dużą dowolność w przyznawaniu rabatów na sprzedawane towary. Po miesiącu chcemy porównać wysokość przyznawanych rabatów w dwóch naszych sklepach. W sklepie A  przyznano 5 takich rabatów w następującej wysokości: 4%, 4%, 5%, 5%, 6%, 6%. W sklepie B także przyznano 5 rabatów, ale następujących: 2% 2%, 5%, 5%, 8%,8%. W obu przypadkach średnia przyznanych rabatów to 5%. Rzut oka jednak wystarczy by zobaczyć, iż w sklepie A większość przyznanych rabatów jest zbliżona do średniej, w sklepie B można było uzyskać i 8% rabat, ale i zdarzały się tylko 2% obniżki. Dostrzeżenie tej jakże ważnej różnicy jest niezwykle proste w przypadku tak małego zbioru danych  jak zbiór  6 – elementowy. A co w sytuacji, kiedy nasze zbiory składałby się  z np. 50 elementów tzn. w każdym ze sklepów A i B udzielono by 50  rabatów? Dostrzeżenie tej różnicy „na oko” byłoby już niemożliwe.  I tu z pomocą przychodzi nam taka statystyka jak wariancja, a także taki program jak Excel. Tworzymy więc bazę danych dla naszych dwóch zbiorów w Excelu. Baza danych powinna wyglądać tak:

Wariancja 1

Baza danych gotowa. Możemy przystąpić do obliczenia wariancji. Najpierw dla sklepu A. W tym celu do dowolnej, pustej komórki arkusza kalkulacyjnego Excel należy wpisać odpowiednią formułę:

=wariancja(A2:A7)

 

A2 i A7 to oznaczenia pierwszej i ostatniej komórki Excela, gdzie zakodowane zostały rabaty przyznane dla sprzedanych ubrań w sklepie A. Gdyby nasze dane zostały zakodowane np. w kolumnie „G” wtedy nasza formuła wyglądałaby następująco: =wariancja(G2:G6).

Wariancja 2

Po wpisaniu formuły do arkusza, klikamy Enter, a program Excel błyskawicznie wyliczy dla nas wartość wariancji:

Wariancja 3

Wynik wariancji w tym przypadku to 1. Obliczmy teraz wariancję dla wyników w sklepie B. Posłużmy się dokładnie tę samą formułą. W tym przypadku wartość wariancji to 7:

Wariancja 4

Wartość wariancji w przypadku  rabatów przyznanych w sklepie B jest o wiele większa niż w przypadku sklepu A. Świadczy to o wiele większym rozproszeniu wyników w sklepie B, gdzie można było uzyskać i bardzo wysokie i bardzo niskie obniżki, co zauważaliśmy już wcześniej przeglądając zbiór „na oko”, a wyniki otrzymane w Excelu tylko nam to potwierdziły. Na koniec przygotowaliśmy dla Was krótki filmik, który pozwoli Wam jeszcze raz prześledzić sposób obliczenia wariancji w Excelu.

 

Rozstęp – jak policzyć w excelu?

Rozstęp to jedna z najprostszych, najbardziej intuicyjnych statystyk opisowych. Rozstęp to po prostu różnica między największą i najmniejszą wartością danego zbioru. Jak cennych informacji dostarcza nam poznanie wartości rozstępu w analizowanym przez nas zbiorze możecie przeczytać w artykule „Rozstęp”, który znajdziecie w boksieMiary Rozproszenia. Obliczenie rozstępu w przypadku zbiorów kliku elementowych jest niezwykle proste. Po odszukaniu największej i najmniejszej wartości naszego zbioru wystarczy odjąć te dwie wartości od siebie. Obliczony wynik to wartość rozstępu. Problem pojawia się, kiedy mamy do czynienia z większymi zbiorami, wieloelementowymi, wtedy zlokalizowanie największej i najmniejszej wartości może być już problemem. Na szczęście obliczenie rozstępu można zautomatyzować posługując się programem Excel. Jak obliczyć rozstęp w Excelu?

Przede wszystkim musimy przygotować sobie odpowiednią bazę. Wyobraźmy sobie, że jako właściciele sklepów z ekskluzywną odzieżą  chcemy porównać sprzedaż rozmiarów ubrań w dwóch różnych punktach sprzedaży. W butiku na ulicy Przeciętnej w minionym miesiącu sprzedaliśmy ubrania w następującej rozmiarówce: 38, 34, 38, 38, 42. W butiku na ulicy Rozwarstwienie sprzedane ubrania miały następujące rozmiary: 34, 34, 44, 34, 44. Baza w Excelu dla tych dwóch zbiorów wyglądałaby tak:

Rozstęp 1

W obu przypadkach średni rozmiar sprzedanych przez nas ubrań to 38, ale rzut oka na oba zbiory  (rozmiary ubrań sprzedane w obu sklepikach) pokazuje jak złą decyzją byłoby zamówienie w przyszłym miesiącu na ulicę Rozwarstwienie samych ubrań w rozmiarze 38 (ani jeden dotychczasowy klient tego butiku nie nosi tego rozmiaru). I tu z pomocą przychodzi właśnie rozstępstatystyka, która informuje nas jak bardzo wyniki naszego zbioru są rozproszone wokół średniej (im większa wartość rozstępu, tym większe rozproszenie wyników).

W pierwszej kolejności aby obliczyć rozstęp w Excelu musimy znaleźć najmniejszą i największą wartość naszego zbioru. Możemy zrobić to na dwa sposoby.

Zaznaczamy  wszystkie interesujące nas wartości danego zbioru i  klikamy lewy przycisk myszy. Zaznaczamy opcje „Sortuj”, a następnie „Sortuj od najmniejszych do największych”:

Rozstęp 2

Wybór tej opcji spowoduje, że wartości naszego zbioru – rozmiary ubrań sprzedane na ul. Przeciętnej zostaną uporządkowane od najmniejszej do największej.

Rozstęp 3

 W arkuszu Excela, w komórce A2 będziemy mieli najmniejszy rozmiar sprzedanego przez nas ubrania na ul. Przeciętnej – 34, w komórce A6 największy rozmiar sprzedanego ubrania – 42. Teraz, kiedy zlokalizowaliśmy już najmniejszą i największą wartość naszego zbioru, wystarczy odjąć te dwie wartości od siebie. W ten sposób obliczymy rozstęp dla rozmiarów sprzedanych ubrań na ul. Przeciętnej.

Aby odjąć od największej wartości najmniejszą wartość zbioru wystarczy, że w dowolnej pustej komórce Excela wpiszemy następującą formułę:

Rozstęp 4

W arkuszu kalkulacyjnym będzie wyglądać to tak:

Rozstęp 5

Teraz wystarczy kliknąć Enter, a program Excel automatycznie wyliczy nam wartość tego odejmowania, czyli de facto wartość rozstępu. W przypadku sklepu na ulicy Przeciętnej różnica pomiędzy największym i najmniejszym rozmiarem sprzedanych ubrań wynosi 8.

Rozstęp możemy również policzyć posługując się odpowiednimi formułami Excel umożliwiającymi nam zlokalizowanie najmniejszej  i największej wartości naszego zbioru.

Aby odnaleźć najmniejszą wartość zbioru, wystarczy że w dowolnej pustej komórce programu Excel wpiszemy następującą formułę:

Rozstęp 6

Wartości B2 i B6 to pierwsza i ostatnia komórka zbioru rozmiaru ubrań sprzedanych na ulicy Rozwarstwienie. Gdyby wartości tego zbioru zakodowane byłby w kolumnie „Z”, wtedy nasza formuła wyglądała by następująco: =min(Z2:Z6).  Po wpisaniu formuły i naciśnięciu przycisku Enter program Excel automatycznie wskaże nam najmniejszą wartość analizowanego zbioru, w tym przypadku jest to 34.

Rozstęp 7

Analogicznie postępujemy wyznaczając największą wartość naszego zbioru. W tym celu wpiszemy tylko nieco zmienioną formułę. Słowo „min” zamieniamy na „max”. Tym razem nasza formuła będzie wyglądać następująco:

Rozstęp 8

Po jej wpisaniu program Excel automatycznie wskaże nam największą wartość naszego zbioru. W tym przypadku jest to 44.

Rozstęp 9

Znając największą i najmniejszą wartość zbioru rozmiarów sprzedanych ubrań na ul. Rozwarstwienie bez przeszkód możemy obliczyć rozstęp. Wystarczy, że od największej wartości naszego  zbioru (44) odejmiemy wartość najmniejszą (34), czyli zastosujemy formułę: =A8-A7. Wynik naszego działania to 10. Rozstęp dla rozmiarów ubrań sprzedanych na ul. Rozwarstwienie wynosi 10 i jest większy niż w przypadku rozmiarówki z ul. Przeciętnej. Wyniki w przypadku rozmiarówki na ul. Rozwarstwienie są bardziej rozproszone wokół średniej.

Na koniec krótki filmik, który pomoże Wam zapamiętać to wszystko o czym mieliście okazję przeczytać w artykule.

Odchylenie standardowe – jak policzyć w Excelu?

Odchylenie standardowe to miara rozproszenia (dyspersji), która umożliwia scharakteryzowanie danego zbioru pod kątem zróżnicowania wyników wokół centralnego punktu rozkładu. Dzięki odchyleniu standardowemu wiemy jak bardzo wartości naszej zmiennej są rozrzucone wokół średniej. Interpretacja odchylenia standardowego jest następująca: im większa wartość odchylenia standardowego, tym większe rozproszenie wartości danej zmiennej wokół średniej. Jak obliczyć odchylenie standardowe krok po kroku, możecie przeczytać w artykule Odchylenie standardowe w boksie „Miary rozproszenia”. Statystykę tą możemy też wyliczyć w  Excelu.

Jako właściciele marki z ekskluzywną odzieżą chcemy dowiedzieć się ile średnio w miesiącu młodzi ludzie wydają na zakup ubrań. Pod lupę bierzemy zakupy trzech osób (oczywiście nie jest to reprezentatywna próba dla populacji młodych ludzi J, ale na tak małej liczbie danych łatwiej będzie nam omówić cały przykład). W minionym miesiącu Kasia na zakup ubrań przeznaczyła 100 zł, zaś Marysia i Tomek o 20 zł więcej – 120 zł. Średnio każde z nich na zakup odzieży przeznaczyło 113 zł i 33 gr, ale przecież ani Kasia, ani Marysia i Tomek nie wydali dokładnie takiej kwoty. Kasia przeznaczyła na zakupy mniej pieniędzy, Marysia i Tomek wydali więcej. Wyliczenie samej średniej (jak ją wyliczyć możecie przeczytać w artykule „Średnia arytmetyczna” i „Średnia arytmetyczna – jak policzyć w Excelu?”) jest więc czasem bardzo mylące. Wtedy z pomocą przychodzi właśnie odchylenie standardowe.

Jak je obliczyć w programie Excel? Najpierw musimy odpowiednio zakodować nasze dane. Gotowa baza do obliczeń powinna wyglądać tak:

Przykład bazy danych w Excelu do wyliczenia odchylenia standardowego

Aby obliczyć odchylenie standardowe w Excelu należy posłużyć się odpowiednią formułą. W dowolnej, pustej komórce arkusza kalkulacyjnego należy wpisać:

Aby obliczyć odchylenie standardowe w Excelu należy wpisać odpowiednią formułę

B2 i B4 to komórki pierwszej i ostatniej wartości analizowanego zbioru (wartość zakupów Kasi i Tomka). Jeśli wartości naszego zbioru znajdowałby się np. w kolumnie „Z” wtedy wpisywana przez nas w Excelu formuła wyglądałaby następująco: =odch.standarowe(Z2:Z4). Wartości naszego zbioru możemy zaznaczyć przeciągając kursor myszy od pierwszej po ostatnią komórkę, dla której chcemy obliczyć odchylenie standardowe. O to jak to zrobić:

Wyliczanie odchylenia standardowego w Excelu krok po kroku

Na koniec wystarczy zamknąć nawias w wpisanej formule i program Excel automatycznie wyliczy nam wartość odchylenia standardowego.

Obliczone odchylenie standardowe w Excelu

Odchylenie standardowe w naszym przykładzie wynosi 11 zł i 55 gr. Co to oznacza? Miesięcznie, średnio młodzi ludzie na zakup odzieży przeznaczają 113 zł i 33 gr., ale  wydatki poszczególnych osób odchylają się od tej kwoty  średnio o +/- 11 zł i 55 gr.  Dla nas producentów markowej odzieży to cenna informacja. W swojej kolekcji nie powinniśmy mieć ubrań w cenie powyżej 130 zł, gdyż popyt na tego typu ubrania będzie bardzo mały. Ceny sprzedawanych przez nas towarów powinny oscylować na poziomie 113 zł i 33 gr +/- 11 zł i 55 gr. Wszystko to wiemy dzięki kilku kliknięciom w Excelu i wyliczeniu odchylenia standardowego.

Na koniec krótki filmik pokazujący raz jeszcze jak obliczyć odchylenie standardowe posługując się programem Excel.

Średnia arytmetyczna – jak policzyć w Excelu?

Średnia arytmetyczna to suma wartości wszystkich zmiennych danego zbioru podzielona przez liczbę tych zmiennych. Wzór na średnią arytmetyczną jest następujący: a1+a2+…+an/n. Jeśli chcesz dowiedzieć się jak obliczyć tą statystykę krok po kroku warto, żebyś przeczytał artykuł Średnia Arytmetyczna umieszczony w boksie Miary Tendencji Centralnych. Średnią arytmetyczną możesz też policzyć w Exelu. Jest to bardzo, bardzo proste.

Wcielmy się ponownie w rolę właściciela sklepu, który w minionym tygodniu sprzedał 13 ubrań w swoim butiku. Ceny sprzedanych ubrań były następujące: 50 zł, 50 zł, 75 zł, 85 zł, 85 zł, 90 zł, 90 zł, 120 zł, 250 zł, 250 zł, 350 zł, 50 zł, 75 zł. Teraz właściciel sklepu chce się dowiedzieć jaka była średnia cena sprzedanych przez niego towarów, czyli de facto chce wyznaczyć średnią arytmetyczną. Żeby to zrobić w Exelu, najpierw musimy stworzyć bazę kodując wszystkie wartości. Baza w Exelu powinna wyglądać tak:

Przykład bazy do obliczenia średniej w excelu

 

Kiedy baza będzie już gotowa, wystarczy wpisać odpowiednią formułę, a program błyskawicznie wyliczy nam średnią arytmetyczną dla naszego zbioru. W dowolnej, pustej komórce arkusza kalkulacyjnego Exel wpisujemy:

Aby obliczyć średnią arytmetyczną w Excelu, należy wpisać odpowiednią formułę

B2 i B14 to pierwsza i ostania komórka naszego zbioru. Jeśli nasze zmienne zakodowane byłby w kolumnie A, to formuła wyglądałaby następująco: =średnia(A2:A14). Wszystkie wartości danego zbioru możemy zaznaczyć przeciągając kursor myszy od pierwszej do ostatniej pozycji naszego zbioru, tak jak to jest pokazane poniżej:

Aby obliczyć średnią w Excelu należy wpisać odpowiednią formułę, po czym zaznaczyć wszystkie interesujące nas wartości

Teraz wystarczy zamknąć nawias i kliknąć ENTER. Program Excel automatycznie wyliczy nam średnia arytmetyczną dla naszego zbioru.

Obliczenie średniej arytmetycznej w Excelu

Średnia arytmetyczna dla naszego zbioru wynosi 124 zł i 62 gr. Co to oznacza? Gdybyśmy chcieli ujednolić ceny wszystkich 13 ubrań sprzedanych w minionym tygodniu w butiku naszego sklepikarza i jednocześnie utrzymać nasz utarg na poziomie 1620 zł.  każda sprzedana rzecz musiałaby kosztować 124 zł i 62 gr. 124 zł 62 gr.  w  przypadku  koszulki, który normalnie kosztuje 250 zł, to super okazja, ale w przypadku krawatu, czy rękawiczek cena ta już nie jest tak atrakcyjna. Jak zwodniczą miarą  jest średnia arytmetyczna możecie przeczytać w artykule „Średnia arytmetyczna”, czy Odchylenie standardowe.

Na koniec jeszcze rada dla „leniwców” J Jeśli szybko chcecie poznać wartość średniej arytmetycznej, niekoniecznie musicie wpisywać całą formułę do Exela. Wystarczy, że zaznaczycie wszystkie interesujące Was wartości. Na pasku po prawej stronie wyświetlą Wam się wtedy trzy informacje: liczba zmiennych w zaznaczonym zbiorze, suma wartości zmiennych i średnia arytmetyczna właśnie.

Wynik średniej arytmetycznej na pasku w Excelu

Dla tych, którzy chcą natomiast dokładnie zapamiętać sposób liczenia średniej arytmetycznej w Exelu przy użyciu formuły, tutorial  w ramach powtórki.

Dominanta – jak policzyć w Excelu?

Dominanta czyli moda, modalna to wartość, która w danym zbiorze występuje najczęściej. Przy kliku elementowych zbiorach niezwykle łatwo jest wskazać taką wartość. W zbiorze: 1,2,2,3 bez trudu możemy wyznaczyć dominantę. Jest to „2”.  Przy analizie większych zbiorów rzut oka na zbiór już nie wystarczy by wskazać wartość modalną. Wtedy najlepiej posłużyć się wykresem słupkowym. Za jego pomocą bardzo szybko poznamy dominantę naszego zbioru. O dominacie i sposobach jej wyznaczania krok po kroku możecie przeczytać  w artykule „Dominanta” w boskie Miary Tendencji Centralnych . Dominantę możemy też obliczyć w Excelu. Jak?

Posłużmy się przykładem. Standardowo już wcielmy się w role sprzedawcy butiku z odzieżą, który w minionym miesiącu sprzedał 5 markowych koszulek w następujących cenach: 100 zł, 120 zł, 120 zł, 120 zł, 180 zł. Teraz chce się dowiedzieć: „które koszulki, po jakiej cenie, sprzedawały się najczęściej?”. W tym celu musi obliczyć właśnie dominantę.

W pierwszym kroku nasz sprzedawca powinien przygotować sobie bazę w Excelu. Zakodować wszystkie wartości, jakie chce poddać analizie. Opracowana baza powinna wyglądać tak:

Przykład baz danych do obliczenia dominaty w Excelu

Kiedy baza już jest gotować, można przystąpić do obliczeń. Aby obliczyć  dominantę trzeba zastosować odpowiednią formułę w programie Excel. W dowolnej, pustej komórce arkusza kalkulacyjnego nasz sprzedawca wpisuje:

Formuła pozwalająca wyliczyć dominatę w Excelu

B2 i B6 to komórki pierwszej i ostatniej wartości naszego zbioru. Jeśli wartości naszego zbioru zostałyby zapisane np. w kolumnie C wtedy zastosowana przez nas formuła wyglądałaby następująco: =wyst.najczęściej(C2:C6). Wszystkie wartości naszego zbioru możemy zaznaczyć przeciągając kursor myszki od pierwszej (B2) do ostatniej (B6)  wartości analizowanego zbioru.  Przykład poniżej:

Aby obliczyć dominatę w excelu należy wpisać odpowiednią formułę, a następnie zaznaczyć wartości, dla których chcemy obliczyć statystykę

Teraz wystarczy zamknąć nawias i wcisnąć ENTER. Program Excel automatycznie obliczy wartość dominaty naszego zbioru.

Wartość dominaty to 120 zł. Co to oznacza? Spośród 5 sprzedanych markowych koszulek najczęściej nabywców znajdywały te w cenie 120 zł.

Obliczenie dominaty w Excelu

Na koniec zobaczmy  raz jeszcze cały proces wyliczania  dominanty w Excelu. Poniżej krótki tutorial.

Mediana – jak policzyć w Excelu ?

Mediana to wartość środkowa dzieląca zbiór danych „na pół”. Poniżej i powyżej wartości wskazanej przez tą statystykę znajduje się 50% wyników danego zbioru. Wzór na pozycję mediany jest następujący: pozMe= (n+1)/2. Przed wyznaczeniem jednak pozycji mediany należy uszeregować wartości naszego zbioru od najmniejszych do największych lub od  największych do najmniejszych. Więcej informacji na temat tego jak obliczyć medianę krok po kroku możecie znaleźć w artykule Mediana w boksie „Miary Tendencji Centralnych”. Ale medianę możemy obliczyć też w Excelu. Jak? Bardzo prosto.

Otóż, weźmy sprawdzony przez nas przykład właściciela sklepu z ekskluzywną odzieżą, który w minionym miesiącu sprzedał 13 sztuk odzieży w następujących cenach: 50 zł, 50 zł, 75 zł, 85 zł, 85 zł, 90 zł, 90 zł, 120 zł, 250 zł, 250 zł, 350 zł, 50 zł, 75 zł,  a teraz chce dowiedzieć się jaka jest przeciętna cena sprzedanych przez niego ubrań, czyli de facto chce wyznaczyć wartość mediany. Nasz sprzedawca chcąc przeprowadzić całą analizę w Excelu, najpierw musi wartości wszystkich sprzedanych przez siebie ubrań zakodować w programie. Gotowa baza w Exelu powinna wyglądać tak:

Przykładowa baza danych w Excelu do obliczenia mediany

Teraz aby obliczyć  medianę należy zastosować odpowiednią formułę w programie Excel. W dowolnej, pustej komórce arkusza kalkulacyjnego wpisujemy:

Aby obliczyć medianę w Excelu należy wpisać odpowiednią formułę

B2 i B14 to komórki pierwszej i ostatniej wartości naszego zbioru. Jeśli wartości naszego zbioru znajdują się np. w kolumnie A wtedy zastosowana przez nas formuła będzie wyglądać następująco: =mediana(A2:A14). Wszystkie wartości danego zbioru możemy zaznaczyć przeciągając kursor myszki od pierwszej do ostatniej wartości analizowanego zbioru, tak jak jest to pokazano poniżej:

Aby obliczyć medianę w Excelu należy wpisać odpowiednią formułę i zaznaczyć wszystkie interesujące nas wartości

Teraz wystarczy zamknąć nawias w naszej formule i nacisnąć ENTER. Program Excel błyskawicznie wyliczy nam wartość mediany naszego zbioru.

Obliczenie mediany w Excelu

Wartość mediany to 85 zł. Co to oznacza? Spośród 13 sprzedanych ubrań przez naszego sprzedawcę 50% to ubrania sprzedane za 85 zł i mniej, a 50% to ubrania sprzedane za 85 zł i więcej.

Na koniec prześledźmy raz jeszcze cały proces obliczenia mediany w Excelu w krótkim tutorialu zamieszczonym poniżej.

Skośność

Skośność to statystyka określająca asymetrię rozkładu analizowanej zmiennej, jedna z dwóch (obok kurtozy) miar kształtu rozkładu. Skośność informuje nas o tym jak wyniki danej zmiennej kształtują się wokół średniej. Współczynnik skośności dla rozkładu normalnego przyjmuje wartość „0” – brak asymetrii rozkładu, rozkład jest idealnie symetryczny. Współczynnik skośności powyżej „0” świadczy, że rozkład jest prawoskośny (dodatnioskośny), a wyniki poniżej „0” mówią nam, że mamy do czynienia z rozkładem lewoskośnym (ujemnoskośnym). Ale co to właściwie znaczy rozkład lewoskośny, prawoskośny? Po co właściwie wyliczamy współczynnik skośności? Jak zwykle odwołamy się do konkretnego przykładu, ale na początek przypomnijmy sobie jeszcze czym jest rozkład normalny.

Współczynnik skośności dla rozkładu normalnego przyjmuje wartość zero (K=0)

Tak jak pisaliśmy w artykule „Miary kształtu rozkładu” rozkład normalny to wzorzec, matryca, do której „przykładamy” uzyskane wyniki. Rozkład normalny jest idealnie symetryczny względem pionowej osi przebiegającej dokładnie w punkcie, w którym mieści się wartość średniej. Gdybyśmy złożyli kartkę ze schematem rozkładu normalnego wzdłuż tej osi, to dwie części rozkładu pokryłby się ze sobą idealnie, niczym dwie połówki rozkrojonych jabłek. W rzeczywistości jednak taki rozkład wyników właściwie nie istnieje.

Wcielamy się już po raz kolejny w rolę właściciela sklepu z ekskluzywną odzieżą, który analizuje sprzedaż ubrań w minionym miesiącu. Średnia cena sprzedanej sukni w sklepie w ostatnim miesiącu wyniosła 250 zł. Z artykułu o średniej arytmetycznej wiemy, że wcale nie oznacza to, iż wśród sprzedanych sukien znalazła się taka, która musiała kosztować właśnie 250 zł. Ułudą jest też zakładanie, iż jeśli średnia cena sprzedanej sukienki w zeszłym miesiącu w naszym sklepie wyniosła 250 zł, to sprzedaliśmy taką samą liczbę sukienek w cenie poniżej 250 zł i powyżej 250 zł. Równie dobrze mogliśmy sprzedać 5 sukienek za ponad 600 zł, a 25 poniżej 250 zł. Już na podstawie tej informacji możemy zauważyć, iż rozkład naszej zmiennej będzie cechować się znaczną asymetrią.

W naszym przykładzie większość wyników to wyniki poniżej średniej. Gdybyśmy naszkicowali rozkład tych wyników zauważylibyśmy, iż znacząco różni się od kształtu rozkładu normalnego, naszej matrycy, wzorca. Prawe ramie rozkładu byłoby zdecydowanie dłuższe od lewego, dlatego też rozkład ten nazywamy rozkładem prawoskośnym. Możemy też się z spotkać z taką nomenklaturą jak rozkład dodatnioskośny. W naszym przykładzie widać wyraźnie, iż więcej jest wyników niskich (cena sukien poniżej 250 zł) niż wysokich (cena sukien powyżej 250 zł). Bardziej strome ramię rozkładu obejmuje wyższe wyniki. O rozkładzie prawowoskośnym, dodatnioskośnym świadczy współczynnik skośności powyżej „0”. Poza tym, prawoskośność rozkładu możemy zdiagnozować za każdym razem, kiedy dostrzeżemy następującą zależność:

No dobrze, a co w sytuacji kiedy w minionym miesiącu średnia cena sprzedanej przez nas sukni nadal wynosiłaby 250 zł, ale sprzedalibyśmy 25 sukienek powyżej 250 zł, a tylko 5 sukienek za mniej niż 250 zł? W takiej sytuacji mamy więcej wyników powyżej średniej. Szkicujemy ponownie rozkład uzyskanych wyników i widzimy, że tym razem to lewe ramie rozkładu jest zdecydowanie dłuższe od prawego. W tym przypadku mamy do czynienia z rozkładem lewoskośnym. Mamy dużo wyników wysokich (cena sukienki powyżej 250 zł), mało niskich (cena sukienki poniżej 250 zł). Inna nazwa tego rozkładu to rozkład ujemnoskośny. O rozkładzie lewoskośnym, ujemnoskośnym świadczy współczynnik skośności mniejszy od  „0”. Poza tym, lewoskośność możemy zdiagnozować za każdym razem, kiedy dostrzeżemy następującą zależność:

Tak jak wspominaliśmy na początku: założenie mówiące, iż wszystkie zmienne ilościowe w populacji (grupie obiektów należących do danej kategorii) będą miały rozkład normalny (współczynnik skośności = „0”) jest założeniem idealistycznym. Otrzymane przez nas współczynniki skośności zawsze będą  większe, mniejsze od zera. Im większa będzie wartość bezwzględna współczynnika skośności, tym  bardziej skośny będzie rozkład, czyli tym bardziej będzie odbiegał od rozkładu normalnego (jedno z ramion rozkładu będzie dłuższe). Znak  współczynnika skośności („+”, „-”) informować  nas będzie natomiast, czy mamy do czynienia z rozkładem dodatnioskośnym (prawoskośnym), czy ujemnoskośnym (lewoskośnym), czyli które ramie rozkładu jest dłuższe.

Na koniec warto jeszcze pamiętać, że skośność może zostać policzona i co ważniejsze rozsądnie zinterpretowana tylko w przypadku zmiennych ilościowych, gdyż tylko w przypadku zmiennych ilościowych możemy odwoływać się do rozkładu normalnego.

Współczynnik zmienności

Współczynnik zmienności to kolejna miara rozproszenia (dyspersji) obok rozstępu, wariancji i odchylenia standardowego. Oznaczany symbolem V. Jest ilorazem zmienności danej cechy – odchylenia standardowego i średniej wartości tej cechy. Najczęściej wyrażany w procentach. Współczynnik zmienności jest bardzo przydatny, kiedy chcemy porównać zróżnicowanie jakieś cechy, zmiennej z dwóch różnych zbiorów, rozkładów. No właśnie, zobaczmy jak wygląda zastosowanie współczynnika zmienności w praktyce, jaki obliczyć współczynnik zmienności  oraz jak interpretować uzyskane wartości.

Jako właściciele sieci sklepów z elegancką odzieżą postanowiliśmy poszerzyć swój asortyment o ręcznie tkane krawaty i szaliki. Ruszyła produkcja nowego towaru. Po miesiącu postanowiliśmy skontrolować nasze wyroby.

Do obliczenia współczynnika zmienności potrzebne jest wartość średniej i odchylenia standardowego

Okazało się, że średnia długość ręcznie wytwarzanych przez nas krawatów to M = 45 cm, a odchylenie standardowe to SD = 1 cm. Oznacza to, iż średnia długość tkanych przez nas ręcznie krawatów wynosi 45 cm, większość jednak ma długość 45 cm +/- 1 cm. W przypadku szalików średnia długość to 150 cm, a odchylenie standardowe wynosi 1,5 cm. W obu przypadkach wartość odchylenia standardowego jest  bardzo podobna i dość niska. Jesteśmy jednak  firmą, która bardzo dba o standardy produkcji. Zależy nam, żeby każdy z klientów otrzymywał dokładnie ten sam towar, postanowiliśmy więc obliczyć jeszcze współczynnik zmienności dla wytwarzanych przez nas towarów. Jak informuje nas definicja współczynnik zmienności to iloraz zmienności danej cechy  oraz średniej wartości tej cechy. Wzór na współczynnik zmienności będzie więc następujący:

Współczynnik zmienności to iloraz zmienności danej cechy  oraz średniej wartości tej cechy

Obliczmy najpierw współczynnik zmienności dla długości krawatów. 1/45*100% = 2,22%. Analogiczne działanie przeprowadźmy w odniesieniu do szalików. 1,5/ 150*100%=1%. W tym przypadku współczynnik zmienności jest ponad dwukrotnie niższy. Mimo, iż odchylenie standardowe dla długości  krawatów i szalików było bardzo podobne, to wyliczone wartości współczynnika zmienności pokazują, iż standard wykonania szalików jest ponad dwukrotnie wyższy (współczynnik zmienności jest niższy) niż standard produkcji krawatów. Jako właściciele sieci sklepów z ekskluzywną odzieżą musimy zwrócić większą uwagę na produkcję krawatów, podjąć działania mające na celu zmniejszenie zróżnicowania w produkcji tego towaru. Choć biorąc pod uwagę „statystyczne standardy” nie ma powodów by bić na alarm. Interpretacja współczynnika zmienności jest bowiem następująca:

  • V < 50% – mała zmienność
  • 50% <V<100% – umiarkowana zmienność
  • V > 100% – duża zmienność

Możecie też spotkać się z taką interpretacją:

  • V < 20% – mała zmienność
  • 20% < V < 40% – przeciętna zmienność
  • 40% <V < 100% – duża zmienność
  • 100% < V<150% – bardzo duża zmienność
  • V > 150% – skrajnie duża zmienność

Którąkolwiek byście nie wybrali, obliczone przez nas wartości współczynnika zmienności wskazują na małą zmienność analizowanej przez nas cechy – długości krawatów, jak i szalików. Należy jednak pamiętać, że standardy statystyczne różnią się od standardów wymagającego świata mody 🙂