Eliminacja błędów grubych - Test Q-Dixona


Dłuższy czas milczałem. Dużo się działo. Dużo się dzieje. W końcu znalazłem odrobinę czasu na mały wpis dotyczący wykrywania błędów grubych.


Dlaczego wykonując serię pomiarów tej samej cechy nie udaje nam się uzyskać identycznych wyników? Dlaczego niektóre wyniki bardzo różnią się od pozostałych? Nawet ten sam analityk wykonując ten sam pomiar w krótkim odstępie czasu uzyska zbiór wyników, które będą mniej lub bardziej do siebie podobne. Dzieje się tak dlatego, że każdy pomiar obarczony jest błędem. Wynika to z wielu przyczyn, m.in. z niedoskonałości przyrządów pomiarowych, niedbałości analityka lub zmienności warunków w jakich przeprowadzane jest badanie. Nie znaczy to, że uzyskane wyniki nie powiedzą nam nic o badanym obiekcie. Wręcz przeciwnie. Im więcej pomiarów wykonamy tym bliżej będziemy wartości prawdziwej. A co jeżeli wśród wyników znajdzie się jeden odstający, który znacząco zmienia wartość średnią? Przecież niekoniecznie musi on wynikać z naszego niedbalstwa czy nieuwagi. Na szczęście statystyka dostarcza nam niezbędnych narzędzi do wykrycia i wyeliminowania błędów grubych.

Metod jest kilka. Do najpopularniejszych należą:
  • Test Grubbsa
  • Test Q-Dixona
Ze względu na swoją prostotę w laboratoriach stosuje się przeważnie test Q-Dixona. Test jest bardzo prosty. Polega on na obliczeniu dwóch parametrów Q1 i Qn i porównaniu ich z wartością krytyczną.
Oto procedura, którą należy stosować przy wyznaczaniu parametrów testu:
  1. Wyniki pomiarów układamy w ciąg niemalejący. Oznacza to, że każdy kolejny wyraz ciągu ma być większy lub równy wyrazowi poprzedniemu.
    Przykład:
    Mierząc przewodność elektrolityczną właściwą w roztworze wodnym uzyskaliśmy wyniki: 0,72; 0,78; 0,68; 0,68; 0,71; 0,70
    Układając wyniki w ciąg niemalejący otrzymamy: 0,68; 0,68; 0,70; 0,71; 0,72; 0,78
  2. Obliczamy rozstęp pomiędzy wynikiem najwyższym (ostatni wyraz ciągu) a wynikiem najniższym (pierwszy wyraz ciągu)
    Przykład:
    R = 0,78 - 0,68 = 0,10
  3. Obliczamy parametry Q1 i Qn
    $$ Q_{1} = \frac {x_{2} - x_{1}}{R} $$
    $$ Q_{n} = \frac {x_{n} - x_{n-1}}{R} $$
    Przykład:
    $$ Q_{1} = \frac {0,68 - 0,68}{0,10} = 0 $$
    $$ Q_{n} = \frac {0,78 - 0,72}{0,10} = 0,60 $$
  4. Porównujemy otrzymane parametry z wartością krytyczną dla danego poziomu istotności oraz dla zadanej liczby stopni swobody. W laboratorium najczęściej przyjmuje się poziom istotności równy: $$ \alpha = 0,05 $$
    Liczba stopni swobody dla tego testu równa jest ilości wyrazów w ciągu. Tabele z wartościami krytycznymi możemy znaleźć w internecie lub publikacjach dotyczących statystyki.
    Przykład:
    $$ \alpha = 0,05$$
    $$f = 6$$
    $$Q_{kr} = 0,56$$
  5. Jeżeli Q1 lub Qn są większe niż Qkr wtedy należy uznać iż wynik najniższy lub najwyższy jest błędem grubym. Taki wynik należy odrzucić ponownie obliczyć wartość średnią i odchylenie standardowe.
    Przykład:
    $$Q_{1} = 0,00 < 0,56 = Q_{kr}$$Wynik najmniejszy nie jest błędem grubym
    $$Q_{n} = 0,60 > 0,56 = Q_{kr}$$Wynik największy jest błędem grubym
Jak widzimy na przedstawionym przykładzie wyeliminowanie błędu grubego testem Q-Dixona nie jest trudne. Duży wpływ na wynik testu ma założony poziom istotności. Odnosząc się do naszego przykładu dla 6 stopni swobody:
$$ \alpha = 0,1 \quad Q_{kr} = 0,482$$
$$ \alpha = 0,05 \quad Q_{kr} = 0,560$$
$$ \alpha = 0,01 \quad Q_{kr} = 0,698$$
Dla ostatniego poziomu istotności w przedstawionym przykładzie nie ma błędów grubych.
Na dziś to już wszystko moi mili. Następnym razem odpowiem na pytanie dlaczego użycie Pythona jest efektywniejsze niż zastosowanie Excela oraz przedstawię stosowny kod w Pythonie.
Do następnego razu.

2 komentarze:

  1. Dziękuję bardzo za świetnie przedstawione zagadnienie :)
    Mam jeszcze pytanie co do jednej kwestii, od czego zależy ustalenie poziomu istotności, mianowicie mam 11 wyników, które muszę przeanalizować.
    Czy powinienem zastosować poziom istotności równy 0,05. Pozdrawiam

    OdpowiedzUsuń