Akaike Informationskriterium (Svenska)

diskussion

BMDP montering rutin ger korrekta värden (vanligtvis inom 6%) för både tidskonstanter och relativa amplituder av tre-komponentfördelningar, förutsatt att den mellanliggande komponenten representerar minst 4-5% av de 1500 datapunkter. Även om enskilda uppskattningar för en liten mellanliggande komponent uppvisar betydande scatter, ligger medelvärdena fortfarande inom 6% av de sanna.,

en del av variationen i enskilda inmatningspriser kan bero på inkonsekvenser i de simulerade uppgifterna. Vid Ai = 5% bestod den mellanliggande komponenten av endast 75 poäng av 1500. Eftersom standardavvikelsen för en exponentiell fördelning är lika med dess medelvärde är 75 poäng verkligen inte en tillräcklig provstorlek för en exponentiell fördelning. Även om monterade värden som genereras av BMDP-rutinen ibland avviker från medlen, gav monterade värden konsekvent högre likelihoods än medelvärden, vilket bestämdes genom oberoende beräkning av sannolikhetsfunktionen., Detta konstaterande indikerar att rutinen fungerade korrekt genom att konvergera till de värden som maximerade sannolikheten.

ett problem i samband med montering av distributioner som är summorna av exponentialer är att bestämma antalet komponenter som krävs för att beskriva data. Till exempel kan en tvåkomponents sannolikhetsdensitetsfunktion verka tillräcklig för att passa en trekomponentfördelning där en mellanliggande komponent endast är 3-4% av datapunkterna., Visuell bestämning av lämplighetens godhet och antalet komponenter som krävs är inte alltid tillfredsställande och kan ge inkonsekvenser i dataanalys.

flera tester har föreslagits för att jämföra godheten hos olika modeller och bestämma antalet komponenter som krävs för att beskriva en distribution. Dessa tester baseras på log likelihood ratio (LLR), eller logaritmen för förhållandet mellan maximal likelihoods som erhållits genom montering på olika modeller, såsom de som förutspår två – mot tre-komponentfördelningar., LLR är lika med skillnaden mellan FÖRLUSTFUNKTIONER för de två passar.

När modellerna är kapslade har LLR två gånger en χ2-fördelning med antal frihetsgrader lika med antalet ytterligare parametrar för den mer komplexa modellen (4, 11). Vid 2 grader av frihet gynnar sannolikhetsförhållandet en trekomponentpassning (med fem oberoende parametrar) över en tvåkomponentpassning (med tre oberoende parametrar) vid 0,05-nivån när LLR är mer än 3.,

andra tester för godhet av passform inkluderar villkor som straffar en modell för ytterligare komplexitet. Akaike information criterion (AIC) (12) anger att modellen med den lägsta AIC är den bättre modellen. AIC = – L + P, där L är maximal log sannolikhet och P är antalet oberoende parametrar i modellen. En trekomponents passform skulle gynnas över en tvåkomponents passform när LLR är mer än 2.

Schwarz (13) har föreslagit en liknande metod. Schwarz-kriteriet (SC) är – l + , där N är det totala antalet uppehållstider., När n = 1500, skulle en tre-komponent passform väljas över en två-komponent passar endast när LLR skiljer sig med mer än 7.3.

för de simulerade data där Ai var 5%, var sannolikhetsgraden för tvåkomponents jämfört med trekomponents passar i genomsnitt 9,2 ± 2,6 (±SD) för de fem datamängderna. Alla tre tester anser att detta är en signifikant skillnad och indikerar att den komplexa modellen är att föredra. När Ai var 2%, var sannolikheten nyckeltal i genomsnitt 2,2 ± 1,8. Endast AIC skulle gynna valet av trekomponentpassningen.,

datamängder där Ai tilldelades mellanliggande värden på 3 eller 4% testades också för att avgöra om BMDP-programmet kunde upptäcka en tredje komponent när det gav betydande förbättringar i passform. För de två datamängderna som innehåller tre komponenter som endast passar som tvåkomponentfördelningar var LLRs 2.4 och 2.0. Endast AIC skulle föreslå att LLRs indikerar betydande skillnader. I genomsnitt var LLR för Ai = 4% 6,0 ± 5,2 och LLR för Ai = 3% var 4,2 ± 2,6.,

både LLR-och SC-testen tyder på att BMDP-programmet kunde lösa en tredje komponent i distributionen när trekomponentpassningen var en signifikant förbättring jämfört med tvåkomponentpassningen. För datamängder där trekomponentmonteringsrutinen endast gav två tidskonstanter var skillnaden mellan de två inmatningspriserna inte signifikant.

naturligtvis är den utvärdering som beskrivs här verkligen endast tillämplig på de förhållanden under vilka programmet testades. Noggrannheten och upplösningen av programmet kommer att minska med färre datapunkter., De simulerade uppgifterna var dock utformade för att ge ett ganska rigoröst test av passande rutin. Två av tidskonstanterna separerades med en faktor på endast 5; tf var bara 5 gånger tmin, vilket innebär att cirka 18% av uppgifterna i denna komponent uteslöts från analysen; och varje datauppsättning bestod av endast 1500 poäng, vilket är en relativt liten men realistisk provstorlek.

vissa begränsningar bör dock beaktas när man jämför kinetiska modeller på grundval av passar som utförs av detta program., Även om uppskattningarna av högsta sannolikhet delvis har korrigerats för missade händelser under en viss tid tmin, gäller fortfarande stora begränsningar för tolkning av data som innehåller en extremt snabb komponent vars tidskonstant inte är mycket större än tmin.

en potentiell källa till partiskhet som inte beaktas här är samplingsfrämjande fel som uppstår när den analoga till digitala samplingshastigheten som används av datorn är jämförbar med händelsens varaktighet (6, 14)., Provtagningen av data med diskreta intervaller har effekten att kombinera data i papperskorgar, eftersom uppehållstider endast kan uttryckas som multiplar av provtagningsintervallet. Dessa lager är överlappande och den faktiska varaktigheten av en händelse som mäts för att vara t provtagningsintervaller kan faktiskt vara någonstans från – 1 till T + 1 intervall. Till exempel innebär ett provtagningsintervall på 50 µsec/punkt att uppehållstider som uppträder som 100 µsec i varaktighet faktiskt kan vara någonstans från 50 till 150 µsec lång. Antalet uppmätta uppehållstider i varje bin kommer således att vara större än det sanna antalet, eller kommer att främjas., Denna effekt är mest signifikant när provtagningsperioden är en signifikant bråkdel av distributionens tidskonstant.

McManus et al. (6) har lämnat uttryckliga uttryck för att korrigera sannolikheten för urvalsfel i kampanjen (se även Ref. 14). De drar slutsatsen att fel i den maximala sannolikhetsbedömningen av tidskonstanter för summor av exponentialvärden endast skulle bli betydande om provtagningsperioden var större än 10-20% av distributionens snabbaste tidskonstant. Metoder som presenteras här innehåller inte korrigeringar för urvalsfel.,

en annan typ av fel som inte nämnts tidigare produceras av händelser som passerar oupptäckta eftersom de är snabbare än tmin. Missade stängda tider gör att kanalöppningar visas för länge eftersom två intilliggande öppningshändelser visas som en enda lång händelse. På samma sätt orsakar missade öppningar felaktiga långa mätningar av slutna löptider eftersom två intilliggande stängda tider visas som en enda lång stängd tid. Korrigering för sådana missade händelser är modellberoende och kan bli ganska komplex (15, 16)., Korrigeringen beror på antalet vägar genom vilka kanalen kan genomgå övergångar från ett tillstånd till ett annat och de relativa magnituderna hos hastighetskonstanterna för övergång mellan stater. Underlåtenhet att korrigera för sådana missade händelser kan medföra betydande fel i uppskattningar av räntekonstanter mellan stater.

förutsatt att dessa begränsningar beaktas, ger BMDP-monteringsrutinen en bekväm metod för att generera tidskonstanter och relativa amplituder för enkanals uppehållstid.

Share

Lämna ett svar

Din e-postadress kommer inte publiceras. Obligatoriska fält är märkta *