Menu Zamknij

Czy dobrze liczysz swoją liniowość?

Wyobraź sobie następującą sytuację. Testujesz liniowość metody analitycznej, powiedzmy HPLC. Współczynnik liniowości R=0,999, współczynnik determinacji R^2 = 0,999. Sytuacja idealna. Kryteria spełnione, walidacja zakończona sukcesem. Teraz tylko raport i do domu. Nic bardziej mylnego. W naszych danych może być ukryty chochlik, którego na pierwszy rzut oka nie widać. Pomoże nam w tym jednak analiza resztkowa.

Analiza resztkowa w wyznaczaniu liniowości
Residal analysis in linearity determination

Liniowość a dopasowanie modelu regresji

W 2023 roku ICH opublikowało nową wytyczną ICH Q2 – walidacja metod analitycznych. Jedna ze zmian dotyczyła właśnie wyznaczania liniowości. Ich w nowych wytycznych uwzględniła metody biologiczne takie jak ELISA czy testy cytotoksyczności. Te metody często oparte są o nieliniowe modele kalibracji. W związku z tym niemożliwe jest wyznaczenie dla nich liniowości.

Z tego właśnie powodu w nowym ICH Q2 liniowość została zastąpiona dopasowaniem modelu regresji. Nie zmienia to faktu, że dla metod z natury liniowych dalej można się posługiwać terminem linowość.

Jak działa regresja liniowa?

W  celu wyznaczenia stężenia wykonuje się krzywą kalibracyjną. Kilka roztworów o znanym stężeniu poddaje się analizie a na podstawie uzyskanych wyników generuje się wykres funkcji liniowej zależności sygnału od stężenia. Oczywiście wartości zmierzone mogą nie pokrywać się idealnie z przebiegiem krzywej. Stosuje się więc zabieg interpolacji, w którym linia wykresu przebiega pomiędzy zmierzonymi punktami. Przebieg nie jest przypadkowy a wyznacza się go tak by suma kwadratów błędów pomiaru była najmniejsza.

Współczynnik liniowości a współczynnik determinacji

Przy wyznaczaniu liniowości i odczytywaniu wyników możemy się spotkać z dwiema wartościami: współczynnikiem liniowości – R, oraz współczynnikiem determinacji – R^2. Czym się różnią?

Współczynnik liniowości  (R) – tożsamy ze współczynnikiem korelacji Pearsona. Mówi o tym czy zależność pomiędzy danymi jest liniowa i w jakim stopniu. Im bliżej wartości 1 tym silniejsza korelacja.

Współczynnik determinacji (R2) – Wyznacza się go poprzez podniesienie wartości R do kwadratu. Wskazuje on na dopasowanie modelu regresji, czyli tego jak dobrze można wyznaczyć stężenie na podstawie pomiaru sygnału.

No dobra nasze dane są idealne: współczynnik liniowości R = 0,9999, współczynnik determinacji R2 = 0,9999? No cóż. Teoretycznie model jest idealnie dopasowany. Być może nawet dokładność nie pokazałaby, że jest jakiś problem. Możliwe jednak, że coś źle liczymy a nasza metoda jest jeszcze bardziej dokładna niż nam się wydaje.

Analiza resztkowa – czyli czy model naprawdę jest liniowy?

Analiza resztkowa jest jednym z etapów oceny modelu regresji. Polega on na badaniu różnic (reszt, rezyduów)  między wartościami zaobserwowanymi (zmierzonymi) a wartościami odczytanymi z modelu regresji. Reszty (e) reprezentują błędy modelu. Ich położenie na wykresie zależności od stężenia może nam wskazać, czy model jest odpowiednio dopasowany.

Analiza wykresu zależności stężenia od wartości reszt może pomóc w ustaleniu następujących rzeczy:

  1. Weryfikacja poprawności modelu
  2. Weryfikacja jednorodności wariancji (homoskedastyczność)
  3. Identyfikacja obserwacji odstających

Dla wyjaśnienia analizy resztkowej posłużymy się zestawem danych:

StężenieSygnał
50110,2483571
75159,9308678
100210,3238443
125260,7615149
150309,8829233
Liniowość R2=1

Sygnał ti wartości zmierzone. By wyliczyć reszty musimy wyznaczyć sobie wartości oczekiwane na podstawie równania krzywej y=ax +b.

StężenieSygnał (y)wartości oczekiwane (ŷ)
50110,2483571110,2095456
75159,9308678160,2195235
100210,3238443210,2295015
125260,7615149260,2394794
150309,8829233310,2494574

Następnie wykorzystując odejmując wartości zmierzone od oczekiwanych wyznaczamy reszty

StężenieSygnał (y)wartości oczekiwane (ŷ)Reszty (e)
50110,2483571110,20954560,038811
75159,9308678160,2195235-0,28866
100210,3238443210,22950150,094343
125260,7615149260,23947940,522035
150309,8829233310,2494574-0,36653
    
Wykres analizy resztkowej

Generalnie:

  • Wartości reszt powinny równomiernie układać się po obu stronach poziomej linii 0
  • Brak wyraźnego trendu, kształtu oznacza dobre dopasowanie modelu liniowego
  • Można zaobserwować wartości odstające

Analiza przypadku

By pokazać prawdziwą moc analizy resztkowej posłużę się zestawem trzech danych.

Przypadek 1Przypadek 2Przypadek 3
StężenieSygnałResztySygnałResztySygnałReszty
50110,24835710,0388115114,95317262,345937031109,80000-0,440000
75159,9308678-0,288655683161,5658426-1,031487151160,400000,400000
100210,32384430,094342782210,1534869-2,433936904209,20000-0,560000
125260,76151490,522035486261,1561051-1,421412863261,200001,680000
150309,8829233-0,366534085315,1085122,540899887308,20000-1,080000

Wykresy reszt dla tych przypadków wyglądają następująco:

Co możemy wywnioskować na podstawie wykresów:

Przypadek 1:

Punkty układają się równomiernie po obu stronach wartości 0. Brak wyraźnego trendu w położeniu punktów. Świadczy to o dobrym dopasowaniu modelu liniowego.

Przypadek 2:

Charakterystyczny paraboliczny kształt ułożenia punktów. Taki  kształt świadczy o nieliniowym charakterze rozkładu punktów. Najczęściej w tym przypadku mają one rozkład dwumianowy (funkcja drugiego stopnia). W tym przypadku zastosowanie modelu liniowego pomimo wysokiego R^2 jest nieprawidłowe, gdyż zależność jest nieliniowa.

Przypadek 3:

Reszty oddalają się od wartości 0 wraz ze wzrostem stężenia (kształt lejka). Świadczy to o tzw. Heteroskedastyczności (niestałej wariancji). W takim wypadku powinno zastosować się regresję ważoną.

Podsumowanie

Na podstawie powyższych danych dość dobrze widać, że wartości R czy R^2 mogą być mylące. Przy wyznaczaniu liniowości warto dokładniej przyjrzeć się danym i ocenić czy zastosowany przez nas model kalibracji faktycznie jest najlepszy i zgodny z matematyką.

Niestety w większości przypadków oprogramowanie służące do obsługi sprzętu i analizy wyników nie wykona tej analizy. Warto więc sięgnąć do specjalnych narzędzi statystycznych takich jak Statistica czy Minitab, lub po prostu arkusza obliczeniowego by ocenić czy liniowość faktycznie jest liniowa.

Źródła:

ICH Q2

pogotowiestatystyczne.pl

sixsigmadsi.com

Dodaj komentarz

Twój adres e-mail nie zostanie opublikowany. Wymagane pola są oznaczone *

Przegląd prywatności
Bioeducator.eu

Ta strona korzysta z ciasteczek, aby zapewnić Ci najlepszą możliwą obsługę. Informacje o ciasteczkach są przechowywane w przeglądarce i wykonują funkcje takie jak rozpoznawanie Cię po powrocie na naszą stronę internetową i pomaganie naszemu zespołowi w zrozumieniu, które sekcje witryny są dla Ciebie najbardziej interesujące i przydatne.

Ściśle niezbędne ciasteczka

Niezbędne ciasteczka powinny być zawsze włączone, abyśmy mogli zapisać twoje preferencje dotyczące ustawień ciasteczek.

Analityka

Ta strona korzysta z Google Analytics do gromadzenia anonimowych informacji, takich jak liczba odwiedzających i najpopularniejsze podstrony witryny.

Włączenie tego ciasteczka pomaga nam ulepszyć naszą stronę internetową.