Akaike Information Criterion (Polski)

Discussion

procedura dopasowywania BMDP zapewnia dokładne wartości (zwykle w granicach 6%) zarówno dla stałych czasowych, jak i względnych amplitud rozkładów trójskładnikowych, pod warunkiem że komponent pośredni reprezentuje co najmniej 4-5% Z 1500 punktów danych. Chociaż Indywidualne szacunki dla małego składnika pośredniego wykazują znaczny rozrzut, średnie wartości nadal mieszczą się w 6% rzeczywistych.,

część zmienności w poszczególnych pasmach może wynikać z niespójności związanych z symulowanymi danymi. Przy Ai = 5%, Składnik pośredni składał się tylko z 75 punktów na 1500. Ponieważ odchylenie standardowe dla rozkładu wykładniczego jest równa jego średniej, 75 punktów nie jest naprawdę odpowiednia wielkość próby dla rozkładu wykładniczego. Chociaż dopasowane wartości generowane przez procedurę BMDP czasami odbiegały od średnich, dopasowane wartości konsekwentnie wytwarzały wyższe wartości prawdopodobieństwa niż średnie, określone przez niezależne obliczenie funkcji prawdopodobieństwa., To stwierdzenie wskazuje, że rutyna działała prawidłowo, zbierając się do wartości, które maksymalizowały prawdopodobieństwo.

jednym z problemów związanych z dopasowaniem rozkładów, które są sumami wykładników, jest określenie liczby składników wymaganych do opisania danych. Na przykład dwuskładnikowa funkcja gęstości prawdopodobieństwa może wydawać się odpowiednia do dopasowania rozkładu trójskładnikowego, w którym składnik pośredni stanowi tylko 3-4% punktów danych., Wizualne określenie dobroci dopasowania i liczby wymaganych składników nie zawsze jest zadowalające i może prowadzić do niespójności w analizie danych.

zaproponowano kilka testów porównujących dobre dopasowanie różnych modeli i określających liczbę elementów potrzebnych do opisania rozkładu. Testy te są oparte na log likability ratio (LLR), lub logarytm stosunku między maksymalnymi współczynnikami prawdopodobieństwa uzyskanymi przez dopasowanie do różnych modeli, takich jak te przewidujące rozkład dwu-lub trzyskładnikowy., LLR jest równa różnicy między funkcjami stratnymi dla dwóch pasowań.

gdy modele są zagnieżdżone, dwa razy LLR ma rozkład χ2 z liczbą stopni swobody równą liczbie dodatkowych parametrów bardziej złożonego modelu (4, 11). Przy 2 stopniach swobody test współczynnika prawdopodobieństwa faworyzuje dopasowanie trójskładnikowe (z pięcioma niezależnymi parametrami) nad dopasowaniem dwuskładnikowym (z trzema niezależnymi parametrami) na poziomie znaczenia 0,05, gdy LLR jest większy niż 3.,

inne testy na dobre dopasowanie zawierają terminy, które karzą model za dodatkową złożoność. Kryterium informacyjne Akaike (AIC) (12) stwierdza, że model o najniższym AIC jest lepszym modelem. AIC = – L + P, Gdzie L to maksymalne prawdopodobieństwo logarytmu, A P to liczba niezależnych parametrów w modelu. Dopasowanie trójskładnikowe byłoby preferowane nad dopasowaniem dwuskładnikowym, gdy LLR jest więcej niż 2.

podobną metodę zaproponował Schwarz (13). Kryterium Schwarza (SC) to – L +, gdzie N jest całkowitą liczbą czasów przebywania., Gdy N = 1500, dopasowanie trójskładnikowe zostanie wybrane zamiast dopasowania dwuskładnikowego tylko wtedy, gdy LLR różni się o więcej niż 7,3.

dla symulowanych danych, w których Ai wynosiła 5%, współczynniki prawdopodobieństwa dla dopasowań dwuskładnikowych w porównaniu z trójskładnikowymi wynosiły średnio 9,2 ± 2,6 (±SD) dla pięciu zestawów danych. Wszystkie trzy testy uznają to za istotną różnicę i wskazują, że model złożony jest preferowany. Gdy Ai wynosiła 2%, współczynniki prawdopodobieństwa wynosiły średnio 2,2 ± 1,8. Tylko AIC faworyzowałby wybór trójskładnikowego dopasowania.,

zestawy danych, w których Ai przypisano wartości pośrednie 3 lub 4%, zostały również Przetestowane w celu określenia, czy program BMDP był w stanie wykryć trzeci składnik, gdy przyniósł znaczną poprawę dopasowania. Dla dwóch zestawów danych zawierających trzy składniki, które pasują tylko jako dystrybucje dwuskładnikowe, LLR były 2.4 i 2.0. Jedynie AIC sugeruje, że LLR wskazują na znaczne różnice. Średnia wartość LLR dla Ai = 4% wynosiła 6,0 ± 5,2, a LLR dla Ai = 3% wynosiła 4,2 ± 2,6.,

zarówno testy LLR, jak i SC sugerują, że program BMDP był w stanie rozwiązać trzeci składnik w dystrybucji, gdy dopasowanie trójskładnikowe było znaczącą poprawą w stosunku do dopasowania dwuskładnikowego. W przypadku zestawów danych, w których procedura dopasowywania trójskładnikowego dawała tylko dwie stałe czasowe, różnica między tymi dwoma dopasowaniami nie była znacząca.

oczywiście opisywana tutaj ocena odnosi się naprawdę tylko do warunków, w jakich program został przetestowany. Dokładność i rozdzielczość programu zmniejszy się wraz z mniejszą liczbą punktów danych., Symulowane dane zostały jednak zaprojektowane tak, aby zapewnić dość rygorystyczny test procedury dopasowania. Dwie stałe czasowe zostały oddzielone współczynnikiem wynoszącym tylko 5; tf był tylko 5 razy tmin, co oznacza, że około 18% danych w tym komponencie zostało wyłączone z analizy; a każdy zestaw danych składał się tylko z 1500 punktów, co jest stosunkowo małą, ale realistyczną wielkością próby.

należy jednak pamiętać o pewnych ograniczeniach przy porównywaniu modeli kinetycznych na podstawie dopasowań wykonywanych przez ten program., Chociaż szacunki maksymalnego prawdopodobieństwa zostały częściowo skorygowane w odniesieniu do nieodebranych zdarzeń krótszych niż określony czas trwania tmin, główne ograniczenia nadal mają zastosowanie do interpretacji danych, które zawierają bardzo szybki składnik, którego stała czasowa nie jest znacznie większa niż tmin.

jednym z potencjalnych źródeł błędu nie branego pod uwagę jest błąd promocji próbkowania, który występuje, gdy częstotliwość próbkowania analogowo-cyfrowego używana przez komputer jest porównywalna z czasem trwania zdarzenia (6, 14)., Pobieranie próbek danych w dyskretnych odstępach czasu ma efekt łączenia danych w pojemniki, ponieważ czasy przebywania mogą być wyrażone tylko jako wielokrotności interwału pobierania próbek. Pojemniki te nakładają się na siebie, a rzeczywisty czas trwania zdarzenia mierzonego jako T + 1 może faktycznie wynosić od – 1 do T + 1 interwałów. Na przykład interwał próbkowania wynoszący 50 µsec/punkt oznacza, że czas przebywania wynoszący 100 µsec może w rzeczywistości wynosić od 50 do 150 µsec. Liczba zmierzonych czasów przebywania w każdym pojemniku będzie zatem większa niż liczba prawdziwa lub będzie promowana., Efekt ten jest najbardziej znaczący, gdy okres próbkowania jest znaczącym ułamkiem stałej czasowej rozkładu.

(6) dostarczyły wyraźnych wyrażeń w celu skorygowania prawdopodobieństwa wystąpienia błędów w zakresie pobierania próbek (patrz również Ref. 14). Wnioskują oni, że błędy w maksymalnym oszacowaniu prawdopodobieństwa stałych czasowych dla Sum wykładników staną się znaczące tylko wtedy, gdy okres próbkowania będzie większy niż 10-20% najszybszej stałej czasowej rozkładu. Przedstawione tutaj metody nie uwzględniają korekt dotyczących błędów związanych z promocją pobierania próbek.,

inny typ błędu, o którym nie wspomniano wcześniej, jest wytwarzany przez zdarzenia, które przechodzą niezauważone, ponieważ są szybsze niż tmin. Pominięte czasy zamknięcia powodują, że otwory kanału wydają się zbyt długie, ponieważ dwa sąsiadujące zdarzenia otwarcia pojawiają się jako pojedyncze długie Zdarzenie. Podobnie, pominięte otwory powodują błędnie długie pomiary czasu zamkniętego, ponieważ dwa sąsiadujące czasy zamknięte pojawiają się jako pojedynczy długi czas zamknięty. Korekta takich nieodebranych zdarzeń jest zależna od modelu i może stać się dość złożona(15, 16)., Korekta zależy od liczby ścieżek, przez które kanał może przejść z jednego stanu do drugiego i względnej wielkości stałych szybkości przejścia między Stanami. Brak korekty dla takich nieodebranych zdarzeń może wprowadzić istotne błędy w szacunkach dla stałych stawek między Stanami.

pod warunkiem uwzględnienia tych ograniczeń, procedura dopasowywania BMDP zapewnia wygodną metodę generowania stałych czasowych i względnych amplitud jednokanałowych rozkładów czasu przebywania.

Share

Dodaj komentarz

Twój adres email nie zostanie opublikowany. Pola, których wypełnienie jest wymagane, są oznaczone symbolem *