Akaike Information Criterion (Dansk)

Diskussion

BMDP montering rutine giver nøjagtige værdier (normalt inden 6%) for både tid konstanter, og den relative amplitude af tre-komponent-distributioner, forudsat de mellemliggende komponent repræsenterer mindst 4-5% af de 1500 data punkter. Selvom individuelle estimater for en lille mellemkomponent udviser betydelig spredning, er gennemsnitsværdierne stadig inden for 6% af de rigtige.,

Nogle af variabiliteten i individuelle anfald kan skyldes uoverensstemmelser i de simulerede data. Ved Ai = 5% bestod mellemkomponenten kun af 75 point ud af 1500. Da standardafvigelsen for en eksponentiel fordeling er lig med dens middelværdi, 75 point er virkelig ikke en passende stikprøvestørrelse for en eksponentiel fordeling. Selv om de monterede værdier, der genereres af bmdp-rutinen, undertiden afveg fra midlerne, frembragte monterede værdier konsekvent højere sandsynligheder end middelværdierne, bestemt ved uafhængig beregning af sandsynlighedsfunktionen., Denne konstatering indikerer, at rutinen fungerede korrekt ved at konvergere til de værdier, der maksimerede sandsynligheden.

et problem forbundet med montering af distributioner, der er summen af eksponentialer, er at bestemme antallet af komponenter, der kræves for at beskrive dataene. For eksempel kan en to-komponent sandsynlighedsdensitetsfunktion forekomme tilstrækkelig til montering af en tre-komponentfordeling, hvor en mellemkomponent kun er 3-4% af datapunkterne., Visuel bestemmelse af godhed pasform og antallet af komponenter, der kræves, er ikke altid tilfredsstillende og kan give uoverensstemmelser i dataanalyse.

flere tests er blevet foreslået for at sammenligne godheden af pasform af forskellige modeller og bestemme antallet af komponenter, der kræves for at beskrive en distribution. Disse tests er baseret på Log sandsynlighedsforholdet (LLR), eller logaritmen af forholdet mellem maksimale sandsynligheder opnået ved montering på forskellige modeller, såsom dem, der forudser to – versus tre-komponent distributioner., LLR er lig med forskellen mellem TAB funktioner for de to passer.

når modeller er indlejret, har to gange LLR en distribution2-fordeling med antal frihedsgrader svarende til antallet af yderligere parametre for den mere komplekse model (4, 11). Ved 2 frihedsgrader favoriserer sandsynlighedsforholdstesten en tre-komponent pasform (med fem uafhængige parametre) over en to-komponent pasform (med tre uafhængige parametre) på 0.05-niveauet af betydning, når LLR er mere end 3.,

andre test for godhed af pasform omfatter udtryk, der straffer en model for yderligere kompleksitet. Akaike-informationskriteriet (AIC) (12) angiver, at modellen med den laveste AIC er den bedre model. AIC = – L + P, hvor L er maksimal log sandsynlighed og P er antallet af uafhængige parametre i modellen. En tre-komponent pasform ville blive begunstiget over en to-komponent pasform, når LLR er mere end 2.

en lignende metode er blevet foreslået af Sch .ar. (13). Sch criterionar. – kriteriet (SC) er-l + , hvor N er det samlede antal opholdstider., Når N = 1500, vælges en tre-komponent pasform kun over en to-komponent pasform, når LLR adskiller sig med mere end 7.3.

For de simulerede data, hvor Ai var 5%, sandsynligheden nøgletal for to-komponent versus tre-komponent passer gennemsnit 9.2 ± 2.6 (±SD) for de fem data sæt. Alle tre tests betragter dette som en betydelig forskel og indikerer, at den komplekse model foretrækkes. Når Ai var 2%, var sandsynlighedsforhold i gennemsnit 2,2 1.8 1,8. Kun AIC ville favorisere valg af tre-komponent pasform.,

datasæt, hvor Ai blev tildelt mellemværdier på 3 eller 4%, blev også testet for at bestemme, om BMDP-programmet var i stand til at registrere en tredje komponent, når det frembragte betydelig forbedring i fit. For de to datasæt, der indeholder tre komponenter, der kun passer som to-komponent distributioner, var LLR ‘ erne 2.4 og 2.0. Kun AIC antyder, at LLR ‘ erne indikerer betydelige forskelle. I gennemsnit LLR for Ai = 4% var 6.0 ± 5.2 og LLR for Ai = 3% blev 4.2 ± 2.6.,

både LLR-og SC-testene antyder, at BMDP-programmet var i stand til at løse en tredje komponent i distributionen, når trekomponentpasningen var en betydelig forbedring i forhold til tokomponentpasningen. For datasæt, hvor trekomponentmonteringsrutinen kun gav to tidskonstanter, var forskellen mellem de to passer ikke signifikant.

selvfølgelig er evalueringen beskrevet her kun gældende for de betingelser, hvorunder programmet blev testet. Nøjagtigheden og opløsningen af programmet vil falde med færre datapunkter., De simulerede data var imidlertid designet til at give en ret streng test af monteringsrutinen. To af tidskonstanterne blev adskilt med en faktor på kun 5; tf var kun 5 gange tmin, hvilket betyder, at omkring 18% af dataene i denne komponent blev udelukket fra analyse; og hvert datasæt bestod af kun 1500 point, hvilket er en relativt lille, men realistisk prøvestørrelse.

visse begrænsninger skal dog huskes, når man sammenligner kinetiske modeller på grundlag af pas, der udføres af dette program., Selvom maksimale sandsynlighedsestimater er delvist korrigeret for ubesvarede begivenheder mindre end en bestemt varighed tmin, gælder der stadig store begrænsninger for fortolkning af data, der indeholder en ekstremt hurtig komponent, hvis tidskonstant ikke er meget større end tmin.

en potentiel kilde til bias, der ikke er taget i betragtning her, er prøveudtagningsfremmende fejl, der opstår, når den analoge til digitale samplinghastighed, der bruges af computeren, kan sammenlignes med begivenhedsvarigheden (6, 14)., Prøveudtagning af data med diskrete intervaller har den virkning at kombinere data i skraldespande, da opholdstider kun kan udtrykkes som multipler af prøveudtagningsintervallet. Disse skraldespande overlapper hinanden, og den faktiske varighed af en begivenhed målt til at være T-prøvetagningsintervaller kan faktisk være hvor som helst fra-1 til T + 1 intervaller. Eksempelvis betyder et prøvetagningsinterval på 50ecsek / punkt, at opholdstider, der optræder som 100ecsek i varighed, faktisk kan være hvor som helst fra 50 til 150 µsek lange. Antallet af målte opholdstider i hver bin vil således være større end det sande antal, eller vil blive fremmet., Denne effekt er mest signifikant, når prøveudtagningsperioden er en betydelig brøkdel af tidskonstanten for fordelingen.

McManus et al. (6) har givet eksplicitte udtryk for at korrigere sandsynligheden for stikprøveprogramfremstød fejl (Se også Ref. 14). De konkluderer, at fejl i maksimal sandsynlighed estimering af tid konstanter for summer af eksponentialer ville blive betydelige, hvis prøvetagning periode var større end 10-20% af den hurtigste tid konstant af fordelingen. Metoder, der præsenteres her, indeholder ikke korrektioner for prøveudtagningsfremmende fejl.,

en anden type fejl, der ikke er nævnt tidligere, produceres af begivenheder, der passerer uopdaget, fordi de er hurtigere end tmin. Ubesvarede lukkede tider forårsager, at kanalåbninger vises for længe, fordi to tilstødende åbningshændelser vises som en enkelt lang begivenhed. Tilsvarende, ubesvarede åbninger forårsager fejlagtigt lange målinger af lukkede varigheder, fordi to tilstødende lukkede tider vises som en enkelt lang lukket tid. Korrektion for sådanne ubesvarede begivenheder er modelafhængig og kan blive ret kompleks (15, 16)., Korrektionen afhænger af antallet af veje, hvormed kanalen kan gennemgå overgange fra en tilstand til en anden, og de relative størrelser af hastighedskonstanterne for overgang mellem stater. Manglende korrektion for sådanne ubesvarede begivenheder kan indføre betydelige fejl i estimater for rentekonstanter mellem stater.

forudsat at disse begrænsninger overvejes, giver bmdp-monteringsrutinen en bekvem metode til generering af tidskonstanter og relative amplituder af enkeltkanals dvaletidsfordelinger.

Share

Skriv et svar

Din e-mailadresse vil ikke blive publiceret. Krævede felter er markeret med *