Akaike Information Criterion (Español)

Discussion

la rutina de ajuste BMDP proporciona valores precisos (generalmente dentro del 6%) tanto para las constantes de tiempo como para las amplitudes relativas de las distribuciones de tres componentes, siempre que el componente intermedio represente al menos el 4-5% de los 1500 puntos de datos. Aunque las estimaciones individuales para un pequeño componente intermedio muestran una dispersión considerable, los valores promedio todavía están dentro del 6% de los verdaderos.,

parte de la variabilidad en los ajustes individuales puede surgir de inconsistencias inherentes a los datos simulados. En Ia = 5%, el componente intermedio consistió en solo 75 puntos de 1500. Dado que la desviación estándar para una distribución exponencial es igual a su media, 75 puntos no es realmente un tamaño de muestra adecuado para una distribución exponencial. Aunque los valores ajustados generados por la rutina BMDP a veces se desviaron de las medias, los valores ajustados produjeron consistentemente probabilidades más altas que los valores medios, según lo determinado por el cálculo independiente de la función de verosimilitud., Este hallazgo indica que la rutina estaba funcionando correctamente al converger a aquellos valores que maximizaban la probabilidad.

un problema asociado con el ajuste de Distribuciones que son las sumas de exponenciales es determinar el número de componentes necesarios para describir los datos. Por ejemplo, una función de densidad de probabilidad de dos componentes puede parecer adecuada para encajar una distribución de tres componentes en la que un componente intermedio es solo 3-4% de los puntos de datos., La determinación Visual de la bondad de ajuste y el número de componentes requeridos no siempre es satisfactoria y puede producir inconsistencias en el análisis de datos.

se han propuesto varias pruebas para comparar la bondad de ajuste de diferentes modelos y determinar el número de componentes necesarios para describir una distribución. Estas pruebas se basan en la razón de log verosimilitud (LLR), o el logaritmo de la relación entre las probabilidades máximas obtenidas ajustándose a diferentes modelos, como los que predicen distribuciones de dos contra tres componentes., El LLR es igual a la diferencia entre las funciones de pérdida para los dos ajustes.

cuando los modelos están anidados, dos veces el LLR tiene una distribución χ2 con un número de grados de libertad igual al número de parámetros adicionales del modelo más complejo (4, 11). A 2 grados de libertad, la prueba de razón de verosimilitud favorece un ajuste de tres componentes (con cinco parámetros independientes) sobre un ajuste de dos componentes (con tres parámetros independientes) en el nivel de significación 0.05 cuando el LLR es más de 3.,

otras pruebas de bondad de ajuste incluyen términos que penalizan a un modelo por complejidad adicional. El criterio de información de Akaike (AIC) (12) establece que el modelo con el AIC más bajo es el mejor modelo. AIC = – L + P, donde L es la máxima verosimilitud logarítmica y P es el número de parámetros independientes en el modelo. Un ajuste de tres componentes sería favorecido sobre un ajuste de dos componentes siempre que el LLR sea más de 2.

un método similar ha sido propuesto por Schwarz (13). El criterio de Schwarz (SC) es – L + , donde N es el número total de tiempos de permanencia., Cuando N = 1500, un ajuste de tres componentes se seleccionaría sobre un ajuste de dos componentes solo cuando el LLR difiere en más de 7.3.

para los datos simulados en los que la IA fue del 5%, las razones de verosimilitud para los ajustes de dos componentes versus tres componentes promediaron 9,2 ± 2,6 (±de) para los cinco conjuntos de datos. Las tres pruebas consideran que esta es una diferencia significativa e indican que el modelo complejo es preferible. Cuando la IA fue del 2%, las razones de verosimilitud promediaron 2,2 ± 1,8. Solo el AIC favorecería la selección del ajuste de tres componentes.,

también se probaron conjuntos de datos en los que se asignaron valores intermedios de IA de 3 o 4% para determinar si el programa BMDP fue capaz de detectar un tercer componente cuando produjo una mejora significativa en el ajuste. Para los dos conjuntos de datos que contienen tres componentes que se ajustan solo como distribuciones de dos componentes, los LLR fueron 2.4 y 2.0. Solo AIC sugeriría que los LLR indican diferencias significativas. En promedio, la LLR para Ia = 4% fue de 6,0 ± 5,2 y la LLR para Ia = 3% fue de 4,2 ± 2,6.,

las pruebas LLR y SC sugieren que el programa BMDP fue capaz de resolver un tercer componente en la distribución siempre que el ajuste de tres componentes fuera una mejora significativa sobre el ajuste de dos componentes. Para los conjuntos de datos en los que la rutina de ajuste de tres componentes produjo solo dos constantes de tiempo, la diferencia entre los dos ajustes no fue significativa.

Por supuesto, la evaluación descrita aquí es realmente aplicable solo a las condiciones en las que se probó el programa. La precisión y la resolución del programa disminuirán con menos puntos de datos., Sin embargo, los datos simulados fueron diseñados para proporcionar una prueba bastante rigurosa de la rutina de ajuste. Dos de las constantes de tiempo fueron separadas por un factor de solo 5; El tf fue de solo 5 veces La tmin, lo que significa que alrededor del 18% de los datos de este componente fueron excluidos del análisis; y cada conjunto de datos consistió de solo 1500 puntos, que es un tamaño de muestra relativamente pequeño pero realista.

Se deben tener en cuenta ciertas limitaciones, sin embargo, al comparar modelos cinéticos sobre la base de los ajustes realizados por este programa., Aunque las estimaciones de máxima verosimilitud se han corregido parcialmente para eventos perdidos de menos de una duración determinada tmin, las principales restricciones todavía se aplican a la interpretación de los datos que contienen un componente extremadamente rápido cuya constante de tiempo no es mucho mayor que la tmin.

una fuente potencial de sesgo que no se tiene en cuenta aquí es el error de promoción de muestreo que ocurre cuando la velocidad de muestreo analógico-digital utilizada por la computadora es comparable a la duración del evento (6, 14)., El muestreo de datos a intervalos discretos tiene el efecto de combinar los datos en contenedores, ya que los tiempos de permanencia pueden expresarse solo como múltiplos del intervalo de muestreo. Estos contenedores se superponen y la duración real de un evento medido para ser t intervalos de muestreo puede ser en realidad en cualquier lugar de-1 A T + 1 intervalos. Por ejemplo, un intervalo de muestreo de 50 µseg/punto significa que los tiempos de permanencia que aparecen como 100 µseg en duración pueden ser realmente de 50 a 150 µseg de largo. Por lo tanto, el número de tiempos de permanencia medidos en cada contenedor será mayor que el número real, o se promocionará., Este efecto es más significativo cuando el período de muestreo es una fracción significativa de la constante de tiempo de la distribución.

McManus et al. (6) han proporcionado expresiones explícitas para corregir la probabilidad de errores de promoción de muestreo (Véase también Ref. 14). Concluyen que los errores en la estimación de la máxima verosimilitud de las constantes de tiempo para las sumas de exponenciales solo serían significativos si el período de muestreo fuera superior al 10-20% de la constante de tiempo más rápida de la distribución. Los métodos presentados aquí no incorporan correcciones por errores de muestreo en la promoción.,

otro tipo de error no mencionado anteriormente es producido por eventos que pasan sin ser detectados porque son más rápidos que tmin. Los tiempos de cierre perdidos hacen que las aperturas de canales parezcan demasiado largas porque dos eventos de apertura adyacentes aparecen como un solo evento largo. Del mismo modo, las aberturas perdidas causan erróneamente mediciones largas de duraciones cerradas porque dos tiempos cerrados adyacentes aparecen como un solo tiempo cerrado largo. La corrección de tales eventos perdidos depende del modelo y puede llegar a ser bastante compleja (15, 16)., La corrección depende del número de vías por las cuales el canal puede experimentar transiciones de un estado a otro y las magnitudes relativas de las constantes de velocidad para la transición entre Estados. La falta de corrección de tales eventos perdidos puede introducir errores sustanciales en las estimaciones de las constantes de tasas entre Estados.

siempre que se tengan en cuenta estas limitaciones, la rutina de ajuste BMDP proporciona un método conveniente para generar constantes de tiempo y amplitudes relativas de distribuciones de tiempo de permanencia de un solo canal.

Share

Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *