Akaike Information Criterion

discussie

De BMDP fitting routine levert nauwkeurige waarden (meestal binnen 6%) voor zowel tijdconstanten als relatieve amplitudes van driecomponenten distributies, op voorwaarde dat de tussencomponent ten minste 4-5% van de 1500 datapunten vertegenwoordigt. Hoewel individuele schattingen voor een klein tussenbestanddeel aanzienlijke spreiding vertonen, liggen de gemiddelde waarden nog steeds binnen 6% van de werkelijke waarden.,

sommige variabiliteit in individuele toevallen kan het gevolg zijn van inconsistenties die inherent zijn aan de gesimuleerde gegevens. Bij Ai = 5%, de tussencomponent bestond uit slechts 75 punten van de 1500. Aangezien de standaarddeviatie voor een exponentiële verdeling gelijk is aan het gemiddelde, is 75 punten echt geen adequate steekproefgrootte voor een exponentiële verdeling. Hoewel de door de BMDP-routine gegenereerde geïnstalleerde waarden soms van de gemiddelden afweek, produceerden de geïnstalleerde waarden consequent hogere waarschijnlijkheden dan de gemiddelde waarden, zoals bepaald door een onafhankelijke berekening van de waarschijnlijkheidsfunctie., Deze bevinding geeft aan dat de routine correct functioneerde door te convergeren naar die waarden die de waarschijnlijkheid maximaliseerden.

een probleem in verband met de montage van distributies die de som van exponentialen zijn, is het bepalen van het aantal componenten dat nodig is om de gegevens te beschrijven. Een tweecomponentenkansdichtheidsfunctie kan bijvoorbeeld geschikt lijken voor de montage van een driecomponentenverdeling waarbij een tussencomponent slechts 3-4% van de gegevenspunten bedraagt., De visuele bepaling van de goede pasvorm en het aantal vereiste onderdelen is niet altijd bevredigend en kan inconsistenties bij de gegevensanalyse opleveren.

Er zijn verschillende tests voorgesteld om de geschiktheid van verschillende modellen te vergelijken en het aantal onderdelen te bepalen dat nodig is om een verdeling te beschrijven. Deze tests zijn gebaseerd op de log likelihood ratio (LLR), of de logaritme van de verhouding tussen maximale waarschijnlijkheid verkregen door aanpassing aan verschillende modellen, zoals die voorspellen twee – versus drie-componenten distributies., De LLR is gelijk aan het verschil tussen VERLIESFUNCTIES voor de twee fits.

wanneer modellen worden genest, heeft tweemaal de LLR een χ2-verdeling met een aantal vrijheidsgraden gelijk aan het aantal aanvullende parameters van het complexere model (4, 11). Bij 2 vrijheidsgraden geeft de waarschijnlijkheidsratio-test de voorkeur aan een driecomponent-fit (met vijf onafhankelijke parameters) boven een tweecomponent-fit (met drie onafhankelijke parameters) op het 0,05-significantieniveau wanneer de LLR meer dan 3 is.,

andere tests voor goedheid of fit omvatten termen die een model straffen voor extra complexiteit. Het Akaike informatiecriterium (AIC) (12) stelt dat het model met de laagste AIC het betere model is. AIC = – L + P, waarbij L de maximale log waarschijnlijkheid is en P het aantal onafhankelijke parameters in het model. Een drie-componenten fit zou worden voorkeur boven een twee-componenten fit wanneer de LLR is meer dan 2.

een soortgelijke methode is voorgesteld door Schwarz (13). Het schwarzcriterium (SC) is – L + , waarbij N het totale aantal verblijfstijden is., Wanneer n = 1500, zou een driecomponent fit worden geselecteerd boven een tweecomponent fit alleen wanneer de LLR verschilt met meer dan 7,3.

voor de gesimuleerde gegevens waarin Ai 5% was, waren de waarschijnlijkheidsratio ‘ s voor twee-component versus drie-component fits gemiddeld 9,2 ± 2,6 (±SD) voor de vijf datasets. Alle drie de tests beschouwen dit als een significant verschil en geven aan dat het complexe model de voorkeur verdient. Wanneer Ai 2% was, waren de waarschijnlijkheidsratio ‘ s gemiddeld 2,2 ± 1,8. Alleen de AIC zou de voorkeur geven aan de selectie van de drie-componenten fit.,

datasets waarin Ai intermediaire waarden van 3 of 4% kreeg, werden ook getest om te bepalen of het BMDP-programma in staat was een derde component te detecteren wanneer het significante verbetering in fit veroorzaakte. Voor de twee gegevensverzamelingen die drie componenten bevatten die alleen als tweecomponentendistributies passen, waren de LLR ‘ s 2,4 en 2,0. Alleen het AIC suggereert dat de LLR ‘ s significante verschillen aangeven. Gemiddeld was de LLR voor Ai = 4% 6,0 ± 5,2 en de LLR voor Ai = 3% 4,2 ± 2,6.,

zowel de LLR-als SC-tests suggereren dat het BMDP-programma in staat was een derde component in de verdeling op te lossen wanneer de fit met drie componenten een significante verbetering was ten opzichte van de fit met twee componenten. Voor datasets waarin de driecomponentenaansluitingsroutine slechts twee tijdconstanten opleverde, was het verschil tussen de twee fits niet significant.

natuurlijk is de hier beschreven evaluatie alleen van toepassing op de omstandigheden waaronder het programma werd getest. De nauwkeurigheid en resolutie van het programma zal afnemen met minder datapunten., De gesimuleerde gegevens waren echter ontworpen om een vrij rigoureuze test van de montage routine te leveren. Twee van de tijdconstanten werden gescheiden door een factor van slechts 5; tf was slechts 5 keer tmin, wat betekent dat ongeveer 18% van de gegevens in deze component werd uitgesloten van analyse; en elke gegevensverzameling bestond uit slechts 1500 punten, wat een relatief kleine maar realistische steekproefgrootte is.

bij het vergelijken van kinetische modellen op basis van fits die door dit programma worden uitgevoerd, moet echter rekening worden gehouden met bepaalde beperkingen., Hoewel de maximale waarschijnlijkheidsschattingen gedeeltelijk zijn gecorrigeerd voor gemiste gebeurtenissen van minder dan een bepaalde duur tmin, zijn er nog steeds belangrijke beperkingen van toepassing op de interpretatie van gegevens die een extreem snelle component bevatten waarvan de tijdsconstante niet veel groter is dan tmin.

een mogelijke bron van bias die hier niet in aanmerking wordt genomen, is een fout in de samplingpromotie die optreedt wanneer de analoge naar digitale samplingsnelheid die door de computer wordt gebruikt vergelijkbaar is met de duur van de gebeurtenis (6, 14)., De bemonstering van gegevens met discrete intervallen heeft het effect van het combineren van gegevens in bakken, aangezien de verblijfstijden alleen kunnen worden uitgedrukt als veelvouden van het bemonsteringsinterval. Deze bakken overlappen elkaar en de werkelijke duur van een gebeurtenis gemeten als t bemonsteringsintervallen kan eigenlijk ergens tussen – 1 en T + 1 intervallen zijn. Een bemonsteringsinterval van 50 µsec / punt betekent bijvoorbeeld dat de duur van de duur van 100 µsec 50 tot 150 µsec bedraagt. Het aantal gemeten verblijfstijden in elke bak zal dus groter zijn dan het werkelijke aantal, of zal worden bevorderd., Dit effect is het meest significant wanneer de bemonsteringsperiode een significante fractie van de tijdconstante van de distributie is.

McManus et al. (6) hebben expliciete uitdrukkingen verstrekt om de waarschijnlijkheid van fouten in de steekproefpromotie te corrigeren (zie ook Ref. 14). Zij concluderen dat fouten in de schatting van de maximale waarschijnlijkheid van tijdconstanten voor exponentiële sommen alleen significant zouden worden als de bemonsteringsperiode groter was dan 10-20% van de snelste tijdconstante van de distributie. De hier gepresenteerde methoden bevatten geen correcties voor fouten in de steekproefpromotie.,

een ander type fout dat niet eerder is genoemd, wordt geproduceerd door gebeurtenissen die onopgemerkt voorbij gaan omdat ze sneller zijn dan tmin. Gemiste gesloten tijden veroorzaken kanaal openingen te lang te verschijnen omdat twee aangrenzende opening gebeurtenissen verschijnen als een enkele lange gebeurtenis. Ook gemiste openingen veroorzaken ten onrechte lange metingen van gesloten duur omdat twee aangrenzende gesloten tijden verschijnen als één lange gesloten tijd. Correctie voor dergelijke gemiste gebeurtenissen is modelafhankelijk en kan vrij complex worden (15, 16)., De correctie hangt af van het aantal wegen waardoor het kanaal overgangen van de ene toestand naar de andere kan ondergaan en de relatieve groottes van de snelheidsconstanten voor overgang tussen toestanden. Het niet corrigeren van dergelijke gemiste gebeurtenissen kan leiden tot aanzienlijke fouten in schattingen voor snelheidsconstanten tussen staten.

op voorwaarde dat met deze beperkingen rekening wordt gehouden, biedt de BMDP-aanpassingsroutine een handige methode voor het genereren van tijdconstanten en relatieve amplitudes van éénkanaals-dwell-tijddistributies.

Share

Geef een reactie

Het e-mailadres wordt niet gepubliceerd. Vereiste velden zijn gemarkeerd met *