Zagłębianie się w analizę statystyczną należy zacząć od zapoznania się z podstawowymi definicjami. Dla wielu z was może to być tylko powtórka. Niektórzy być może odnajdą tu nowe przydatne informację. Każdy z wpisów postaram się opatrzyć stosownym kodem w Pythonie.
Średnia arytmetyczna to z definicji miara wartości środkowej w próbce statystycznej dla populacji opisanej rozkładem normalnym.
Ale w takim razie co to jest próbka statystyczna? W prostych słowach to ograniczony zbiór niezależnych obserwacji na podstawie, których możemy wnioskować o danej populacji. Każda z obserwacji ma także jednakową szansę wystąpienia. Co to oznacza w praktyce? Przyjrzyjmy się poniższemu przykładowi.
Z pudełka zawierającego 100 kul z jedną z cyfr: 1 lub 2. Każda z kul ma jednakową szansę bycia wylosowaną. Próbką statystyczną będzie więc np. wylosowanie 10 kul. Każde wyciągnięcie kuli będzie jedną obserwacją. Populacja w tym przykładzie to nasze pudełko z kulami.
Skoro już wiemy, co to populacja i próbka statystyczna wróćmy do definicji średniej. Załóżmy, że wyciągnęliśmy z pudełka 10 kul oznaczonych cyframi: 1, 2, 1, 1, 1, 2, 2, 1, 2, 1. Aby obliczyć średnią korzystamy ze wzoru:
$$ \bar{x} = \frac { \displaystyle \sum_{i=1}^{n} x_i}{n} = \frac {1+2+1+1+1+2+2+1+2+1}{10} = 1,4$$
Otrzymaliśmy w ten sposób informację o wartości średniej populacji. Dlaczego jednak wartość średniej arytmetycznej próbki statystycznej różni się od wartości rzeczywistej μ (zwanej też średnią arytmetyczną populacji), która dla naszego przykładu wynosi 1,5? Dzieje się tak za sprawą występowania błędów losowych. Zmniejszyć błąd losowy możemy poprzez zwiększenie liczby obserwacji. Jednak bardzo często jest to nieuzasadnione ekonomicznie. Każda obserwacja to pewien wydatek czasu i pieniędzy, który musi ponieść laboratorium. Dlatego też przy badaniach należy znaleźć złoty środek i dostępnymi metodami i środkami scharakteryzować jak najlepiej badaną populację.
Teraz przyjrzyjmy się jak można obliczyć średnią arytmetyczną używając Pythona. Oto prosta funkcja obliczająca średnią:
Teraz przyjrzyjmy się jak można obliczyć średnią arytmetyczną używając Pythona. Oto prosta funkcja obliczająca średnią:
def avg(x):
suma = 0
for i in x:
suma = suma + i
return suma/len(x)
Zasada działania tej funkcji jest prosta. W pierwszej kolejności zmiennej suma przypisujemy wartość 0. Następnie sumujemy każdy element podany jako argument funkcji. Na koniec funkcja zwraca obliczoną sumę podzieloną przez ilość liczb.
Aby funkcja zadziałała potrzebne są jeszcze dane. Te zapisujemy jako listę pod zmienną, na przykład a. Ostatnia linijka kodu powinna zawierać wywołanie funkcji. Całość prezentuje się następująco:
a = [21.2, 22.5, 27.1, 25.8, 22.4, 26.7, 22.3, 24.6]
def avg(x):
suma = 0
for i in x:
suma = suma + i
return suma/len(x)
print ("Średnia arytmetyczna wynosi: " + str(avg(a)))
Zachęcam do testowania funkcji i śledzenia dalszych wpisów.
Brak komentarzy:
Prześlij komentarz