Dłuższy czas milczałem. Dużo się działo. Dużo się dzieje. W końcu znalazłem odrobinę czasu na mały wpis dotyczący wykrywania błędów grubych.
Dlaczego wykonując
serię pomiarów tej samej cechy nie udaje nam się uzyskać identycznych wyników?
Dlaczego niektóre wyniki bardzo różnią się od pozostałych? Nawet ten sam
analityk wykonując ten sam pomiar w krótkim odstępie czasu uzyska zbiór
wyników, które będą mniej lub bardziej do siebie podobne. Dzieje się tak
dlatego, że każdy pomiar obarczony jest błędem. Wynika to z wielu przyczyn,
m.in. z niedoskonałości przyrządów pomiarowych, niedbałości analityka lub
zmienności warunków w jakich przeprowadzane jest badanie. Nie znaczy to, że
uzyskane wyniki nie powiedzą nam nic o badanym obiekcie. Wręcz przeciwnie. Im
więcej pomiarów wykonamy tym bliżej będziemy wartości prawdziwej. A co jeżeli
wśród wyników znajdzie się jeden odstający, który znacząco zmienia wartość
średnią? Przecież niekoniecznie musi on wynikać z naszego niedbalstwa czy
nieuwagi. Na szczęście statystyka dostarcza nam niezbędnych narzędzi do
wykrycia i wyeliminowania błędów grubych.
Metod jest kilka. Do najpopularniejszych należą:
Metod jest kilka. Do najpopularniejszych należą:
- Test Grubbsa
- Test Q-Dixona
Oto procedura, którą należy stosować przy wyznaczaniu parametrów testu:
- Wyniki pomiarów układamy w ciąg niemalejący. Oznacza to, że każdy kolejny wyraz ciągu ma być większy lub równy wyrazowi poprzedniemu.
Przykład:
Mierząc przewodność elektrolityczną właściwą w roztworze wodnym uzyskaliśmy wyniki: 0,72; 0,78; 0,68; 0,68; 0,71; 0,70
Układając wyniki w ciąg niemalejący otrzymamy: 0,68; 0,68; 0,70; 0,71; 0,72; 0,78 - Obliczamy rozstęp pomiędzy wynikiem najwyższym (ostatni wyraz ciągu) a wynikiem najniższym (pierwszy wyraz ciągu)
Przykład:
R = 0,78 - 0,68 = 0,10 - Obliczamy parametry Q1 i Qn
$$ Q_{1} = \frac {x_{2} - x_{1}}{R} $$
$$ Q_{n} = \frac {x_{n} - x_{n-1}}{R} $$
Przykład:
$$ Q_{1} = \frac {0,68 - 0,68}{0,10} = 0 $$
$$ Q_{n} = \frac {0,78 - 0,72}{0,10} = 0,60 $$ - Porównujemy otrzymane parametry z wartością krytyczną dla danego poziomu istotności oraz dla zadanej liczby stopni swobody. W laboratorium najczęściej przyjmuje się poziom istotności równy: $$ \alpha = 0,05 $$
Liczba stopni swobody dla tego testu równa jest ilości wyrazów w ciągu. Tabele z wartościami krytycznymi możemy znaleźć w internecie lub publikacjach dotyczących statystyki.
Przykład:
$$ \alpha = 0,05$$
$$f = 6$$
$$Q_{kr} = 0,56$$ - Jeżeli Q1 lub Qn są większe niż Qkr wtedy należy uznać iż wynik najniższy lub najwyższy jest błędem grubym. Taki wynik należy odrzucić ponownie obliczyć wartość średnią i odchylenie standardowe.
Przykład:
$$Q_{1} = 0,00 < 0,56 = Q_{kr}$$Wynik najmniejszy nie jest błędem grubym
$$Q_{n} = 0,60 > 0,56 = Q_{kr}$$Wynik największy jest błędem grubym
$$ \alpha = 0,1 \quad Q_{kr} = 0,482$$
$$ \alpha = 0,05 \quad Q_{kr} = 0,560$$
$$ \alpha = 0,01 \quad Q_{kr} = 0,698$$
Dla ostatniego poziomu istotności w przedstawionym przykładzie nie ma błędów grubych.
Na dziś to już wszystko moi mili. Następnym razem odpowiem na pytanie dlaczego użycie Pythona jest efektywniejsze niż zastosowanie Excela oraz przedstawię stosowny kod w Pythonie.
Do następnego razu.
Do następnego razu.
Dziękuję bardzo za świetnie przedstawione zagadnienie :)
OdpowiedzUsuńMam jeszcze pytanie co do jednej kwestii, od czego zależy ustalenie poziomu istotności, mianowicie mam 11 wyników, które muszę przeanalizować.
Czy powinienem zastosować poziom istotności równy 0,05. Pozdrawiam
Czesto fejn!
OdpowiedzUsuń