Akaike Informační Kritérium

Diskuse

BMDP montáž rutinní poskytuje přesné hodnoty (obvykle do 6%) pro obě časové konstanty a relativní amplitudy tři složky-distribuce, za předpokladu, že střední složka tvoří alespoň 4-5% 1500 datových bodů. Přestože jednotlivé odhady pro malou mezilehlou složku vykazují značný rozptyl, průměrné hodnoty jsou stále v rozmezí 6% skutečných.,

některé z variability jednotlivých záchvatů mohou vzniknout z nesrovnalostí, které jsou vlastní simulovaným datům. U Ai = 5% se mezilehlá složka skládala pouze ze 75 bodů ze 1500. Vzhledem k tomu, že směrodatná odchylka exponenciálního rozdělení se rovná jeho průměru, 75 bodů skutečně není odpovídající velikostí vzorku pro exponenciální distribuci. I když vybaveny hodnoty generované BMDP rutinní někdy odchýlil od prostředků, vybavená hodnoty důsledně vyrábí vyšší pravděpodobností než průměrné hodnoty, jak stanoví nezávislý výpočet pravděpodobnosti funkce., Toto zjištění naznačuje, že rutina funguje správně konvergující na ty hodnoty, které maximalizována pravděpodobnost.

Jeden problém související s montáží rozvodů, které jsou sumy exponenciály je určení počtu složek nezbytných k popisu dat. Například funkce dvousložkové hustoty pravděpodobnosti se může jevit jako adekvátní pro montáž třísložkové distribuce, ve které je mezilehlá složka pouze 3-4% datových bodů., Vizuální stanovení oprávněnosti a počet požadovaných komponent není vždy uspokojivá, a může přinést nesrovnalosti v analýze dat.

bylo navrženo několik testů pro porovnání dobré kondice různých modelů a určení počtu komponent potřebných k popisu distribuce. Tyto testy jsou založeny na protokolu míra pravděpodobnosti (LLR), nebo logaritmus poměru mezi maximální pravděpodobností získané montáž do různých modelů, jako jsou ty, předpovídání dva nebo tři-součást distribuce., LLR se rovná rozdílu mezi ztrátovými funkcemi pro oba záchvaty.

když jsou modely vnořeny, dvakrát má LLR distribuci χ2 s počtem stupňů volnosti rovnající se počtu dalších parametrů složitějšího modelu (4, 11). Na 2 stupni volnosti, pravděpodobnost poměr test upřednostňuje tři složky-fit (s pěti nezávislých parametrů) po dvou-komponentní fit (s třemi nezávislými parametry) na 0.05 hladině významnosti, když LLR je více než 3.,

Další testy pro dobrotu fit zahrnují termíny, které trestají model za další složitost. Akaike informační kritérium (AIC) (12) uvádí, že model s nejnižším AIC je lepší model. AIC = – L + P, kde L je maximální pravděpodobnost log a P je počet nezávislých parametrů v modelu. Tříkomponentní fit by byl upřednostňován před dvoukomponentním fit, kdykoli je LLR více než 2.

podobnou metodu navrhl Schwarz (13). Schwarzovo kritérium (Sc) je – L + , kde N je celkový počet prodlev., Když N = 1500, tříkomponentní fit by být vybrán přes dvoukomponentní fit pouze tehdy, když LLR se liší o více než 7.3.

Pro simulovaná data, ve kterém Ai byla 5%, pravděpodobnost, že poměry pro dvousložkové versus tři složky-odpovídá v průměru 9.2 ± 2.6 (±SD) pro pět datových sad. Všechny tři testy to považují za významný rozdíl a naznačují, že je vhodnější komplexní model. Když Ai byla 2%, poměry pravděpodobnosti byly v průměru 2,2 ± 1,8. Pouze AIC by upřednostnil výběr tříkomponentního fit.,

Datové sady, ve které Ai byla přiřazena střední hodnoty 3 nebo 4% byly testovány také určit, zda BMDP byl program schopen detekovat třetí složka, když to produkoval významné zlepšení v kondici. Pro dvě datové sady obsahující tři komponenty, které se hodí pouze jako dvousložkové distribuce, byly LLR 2.4 a 2.0. Pouze AIC by naznačovalo, že LLR naznačují významné rozdíly. V průměru, LLR pro Ai = 4% 6,0 ± 5.2 a LLR pro Ai = 3% byla 4,2 ± 2.6.,

Jak LLR a SC testy naznačují, že BMDP program byl schopen vyřešit třetí složky v distribuční vždy, když tři složky-fit bylo výrazné zlepšení během dvou-komponentní fit. U datových sad, ve kterých tříkomponentní montážní rutina přinesla pouze dvě časové konstanty, nebyl rozdíl mezi těmito dvěma záchvaty významný.

zde popsané hodnocení je samozřejmě skutečně použitelné pouze pro podmínky, za kterých byl program testován. Přesnost a rozlišení programu se sníží s menším počtem datových bodů., Simulované údaje však byly navrženy tak, aby poskytovaly poměrně přísnou zkoušku montážní rutiny. Dvě časové konstanty byly odděleny faktor pouze 5; tf byla jen 5 krát tmin, což znamená, že asi 18% z údajů v této součásti byla vyloučena z analýzy; a každý soubor dat se skládal z pouhých 1500 bodů, což je relativně malé, ale reálné velikosti vzorku.při porovnávání kinetických modelů na základě záchvatů prováděných tímto programem je však třeba mít na paměti určitá omezení., I když maximální věrohodnosti odhady byly částečně opraveny na zmeškané události, méně než určitou dobu tmin, hlavní omezení platí i pro interpretaci údajů, které obsahují extrémně rychlé součásti, jejichž časová konstanta není o moc větší než tmin.

jedním potenciálním zdrojem zkreslení, který zde není zohledněn, je chyba propagace vzorkování, ke které dochází, když je vzorkovací frekvence analogově-digitálně používaná počítačem srovnatelná s dobou trvání události (6, 14)., Odběr vzorků dat v diskrétních intervalech má za následek kombinování dat do popelnic, protože doby prodlevy mohou být vyjádřeny pouze jako násobky intervalu odběru vzorků. Tyto koše se překrývají a skutečná doba trvání události měřená jako intervaly odběru vzorků T může být ve skutečnosti kdekoli od-1 do T + 1 intervaly. Například interval odběru vzorků 50 µsec / bod znamená, že doba trvání prodlevy 100 µsec může být ve skutečnosti kdekoli od 50 do 150 µsec dlouhá. Počet měřených časů prodlevy v každém koši bude tedy větší než skutečné číslo, nebo bude podporován., Tento účinek je nejvýznamnější, když je doba odběru vzorků významným zlomkem časové konstanty distribuce.

McManus et al. (6) poskytli explicitní výrazy pro opravu pravděpodobnosti chyb v propagaci odběru vzorků (viz také Ref. 14). Došli k závěru, že chyby v odhadu maximální pravděpodobnosti časových konstant pro součty exponenciálů by se staly významnými, pouze pokud by doba odběru vzorků byla větší než 10-20% nejrychlejší časové konstanty distribuce. Zde uvedené metody nezahrnují opravy chyb v propagaci vzorkování.,

Další typ chyby, ne se zmínil dříve, je produkován události, které projdou bez povšimnutí, protože jsou rychlejší než tmin. Zmeškané uzavřené časy způsobují, že otvory kanálů se objevují příliš dlouho, protože dvě sousední Otevírací události se objevují jako jedna dlouhá událost. Podobně Zmeškané otvory způsobují chybně dlouhá měření uzavřených trvání, protože dvě sousední uzavřené časy se objevují jako jedna dlouhá uzavřená doba. Oprava takových zmeškaných událostí je závislá na modelu a může být poměrně složitá (15, 16)., Korekce závisí na počtu cest, který kanál může podstoupit přechody z jednoho státu do druhého a relativní velikosti rychlostních konstant pro přechod mezi státy. Neschopnost opravit takové zmeškané události může způsobit značné chyby v odhadech pro konstanty sazeb mezi státy.

za předpokladu, že jsou tato omezení zvažována, poskytuje rutina BMDP vhodnou metodu pro generování časových konstant a relativních amplitud jednokanálových časových distribucí prodlevy.

Share

Napsat komentář

Vaše e-mailová adresa nebude zveřejněna. Vyžadované informace jsou označeny *