Akaike Information Criterion (Norsk)

Diskusjon

BMDP montering rutine gir nøyaktige verdier (vanligvis innen 6%) for både tid konstanter og relative amplituder av tre-komponent-distribusjoner, har gitt middels komponent representerer minst 4-5% av 1500-data poeng. Selv om enkelte anslag for en liten middels komponent utstilling betydelig scatter, gjennomsnittlige verdier er fortsatt innen 6% av den sanne.,

Noen av variasjon i individuelle passer kan oppstå uoverensstemmelser som inntreffer i den simulerte data. På Ai = 5%, det mellomliggende komponent besto av bare 75 poeng av 1500. Siden standardavviket for en eksponentiell fordeling er lik mener, 75 poeng er egentlig ikke en tilstrekkelig utvalgsstørrelse for en eksponentiell fordeling. Selv om montert verdier som genereres av BMDP rutine noen ganger avvek fra den betyr, utstyrt verdier konsekvent produsert høyere likelihoods enn betydde verdier, som bestemmes av den uavhengige beregning av likelihood-funksjonen., Dette funnet indikerer at rutinen var riktig funksjon av konvergerende til de verdier som økt sannsynligheten.

Ett problem forbundet med montering av fordelinger som er summene av exponentials er å bestemme antall komponenter som kreves for å beskrive data. For eksempel, en to-komponent sannsynlighetstetthetsfunksjonen kan synes tilstrekkelig for å feste en tre-komponent distribusjon som en mellomliggende komponenten er bare 3-4% av data poeng., Visuell fastsettelse av goodness of fit og antall komponenter som kreves er ikke alltid tilfredsstillende og kan føre til uregelmessigheter i data-analyse.

Flere tester har vært foreslått for å sammenligne goodness of fit forskjellige modeller og bestemme antall av komponenter som er nødvendig for å beskrive en sannsynlighetsfordeling. Disse testene er basert på log likelihood ratio (LLR), eller logaritmen av forholdet mellom maksimal likelihoods oppnås ved å montere ulike modeller, slik som de spår to mot tre-komponent distribusjoner., Den LLR er lik forskjellen mellom TAP funksjoner for de to passer.

Når modellene er nestet, to ganger LLR har en χ2-fordeling med antall frihetsgrader lik antall av flere parametere av mer kompleks modell (4, 11). Ved 2 grader av frihet, likelihood ratio test favoriserer en tre-komponent passer (med fem uavhengige parametre) over en to-komponent passer (med tre uavhengige parametre) på 0.05 nivå av betydning når LLR er mer enn 3.,

Andre tester for goodness of fit » omfatter vilkår som straffer en modell for ytterligere kompleksitet. Den Akaike information criterion (AIC) (12) sier at modellen med den laveste AIC er bedre modell. AIC = –L + P, der L er maksimal log likelihood og P er antall uavhengige parametre i modellen. En tre-komponent passe ville bli favorisert over en to-komponent passer når LLR er mer enn 2.

En lignende metode har blitt foreslått av Schwarz (13). Den Schwarz-kriteriet (SC) er – L + , der N er det totale antall av bu ganger., Når N = 1500, en tre-komponent passe ville bli valgt i løpet av en to-komponent passer bare når LLR avviker med mer enn 7.3.

For de simulerte data som Ai var 5%, likelihood ratio for to-komponent mot tre-komponent passer gjennomsnitt 9.2 ± 2.6 (±SD) for de fem datasettene. Alle tre testene vurdere dette en betydelig forskjell, og tyder på at kompleks modell er å foretrekke. Når Ai var 2%, likelihood ratio gjennomsnitt 2.2 ± 1.8. Bare AIC ville favør valg av tre-komponent passform.,

datasett der Ai ble tildelt mellomliggende verdier av 3 eller 4% ble også testet for å finne ut om BMDP programmet var i stand til å oppdage en tredje komponent når det produseres en betydelig forbedring i passe. For de to datasettene inneholder tre komponenter som passer bare som to-komponent-distribusjoner, på LLRs var 2,4 og 2.0. Bare AIC vil foreslå at LLRs indikerer betydelige forskjeller. I gjennomsnitt, LLR for Ai = 4% 6.0 ble ± 5.2 og LLR for Ai = 3% var på 4,2 ± 2.6.,

Både LLR og SC testene tyder på at BMDP programmet var i stand til å løse en tredje komponent i fordelingen når tre-komponent plass var en betydelig forbedring i forhold til de to-komponent passform. For datasett som tre-komponent montering rutine ga bare to konstanter, forskjellen mellom de to passer ikke var signifikant.

selvfølgelig evaluering er beskrevet her, er det virkelig gjelder bare vilkår som programmet ble testet. Den nøyaktighet og oppløsning av programmet vil avta med færre datapunkter., Den simulerte data ble imidlertid utformet for å gi en relativt grundig test av montering rutine. To av tiden konstanter var adskilt med en faktor på bare 5; tf var bare 5 ganger tmin, noe som betyr at ca 18% av dataene i denne komponenten ble ekskludert fra analysen, og hver datasettet besto av bare 1500 poeng, noe som er en relativt liten, men realistisk eksempel størrelse.

Visse begrensninger bør holdes i bakhodet, men når man sammenligner kinetisk modeller på grunnlag av passer utføres av dette programmet., Selv om maksimum likelihood estimatene har vært delvis korrigert for ubesvarte hendelser mindre enn en viss varighet tmin, store begrensninger gjelder fortsatt til tolkning av data som inneholder en ekstremt rask komponent som tiden konstant er ikke mye større enn tmin.

En mulig kilde til skjevhet ikke tatt hensyn til her er sampling kampanjen feil som oppstår når analog-til-digital sampling-frekvens som brukes av datamaskinen er sammenlignbare til hendelsen varighet (6, 14)., Prøvetaking av data på diskrete intervaller har effekten av å kombinere data inn i hyllene, siden bu ganger kan bare uttrykkes som multipler av sampling interval. Disse hyllene er overlappende og den faktiske varigheten av en hendelse som er målt til å være T-sampling intervaller kan egentlig være hvor som helst fra – 1 til T + 1 intervaller. For eksempel, et utvalg intervall på 50 µsec/punkt betyr at bu tider vises som 100 µsec i varighet som faktisk kan være alt fra 50 til 150 µsec lang. Antall målte bu ganger i hver utskuff vil dermed være større enn den sanne nummer, eller vil bli fremmet., Denne effekten er mest viktig når sampling perioden er en betydelig andel av tiden konstant av fordelingen.

McManus et al. (6) har gitt eksplisitt uttrykk for utbedring av sannsynligheten for prøvetaking kampanjen feil (se også Ref. 14). De konkluderer med at feil i maksimum likelihood estimering av tid konstanter for summer av exponentials ville bli betydelige bare hvis prøvetaking perioden var større enn 10-20% av de raskeste tid konstant av fordelingen. Metodene som presenteres her ikke innlemme korreksjoner for prøvetaking kampanjen feil.,

en Annen type feil som ikke er nevnt tidligere er produsert av hendelser som passere ubemerket fordi de er raskere enn tmin. Savnet lukket ganger føre til kanal åpninger skal vises for lenge siden to tilstøtende åpning hendelsene vises som en eneste lang event. På samme måte, savnet åpninger føre til feilaktig lang målinger av lukket varighet fordi to tilstøtende lukket tider vises som en eneste lang stengt tid. Korreksjon for slike hendelser du har gått glipp er avhengig av modellen du bruker og kan bli ganske komplisert (15, 16)., Korreksjonen er avhengig av antallet av veier som kanal kan gjennomgå overganger fra en tilstand til en annen, og den relative størrelsen på pris konstanter for overgang mellom stater. Unnlatelse av å korrigere for slike hendelser du har gått glipp kan medføre vesentlige feil i anslagene for pris konstanter mellom stater.

Forutsatt at disse begrensningene er vurdert, BMDP montering rutine gir en praktisk metode for å generere tid konstanter og relative amplituder av single-channel holdetid distribusjoner.

Share

Legg igjen en kommentar

Din e-postadresse vil ikke bli publisert. Obligatoriske felt er merket med *