Brève Introduction à L’analyse de survie et à L’estimateur Kaplan Meier

Cet article a été publié dans le cadre du Blogathon sur la science des données.

Introduction

analyse de survie

beaucoup d’entre nous ont toujours une question en tête quant au temps qu’il faudra pour qu’un événement se produise. Comme l’échec d’un système mécanique, le corps humain est affecté par tout type de maladie, combien de temps il faudra pour guérir les maladies., Alors combien survivront à un spécifique après avoir fait un diagnostic médical, à quel rythme on mourra ou échouera? Est-il possible de prendre en considération les multiples causes de décès ou d’échec dans une perspective plus large? Pour répondre à toutes ces questions, nous étudions L’analyse de la survie.

L’analyse de la survie est une branche importante de la statistique qui est prise en considération pour répondre à toutes ces questions.

L’étude D’analyse de la survie doit définir un calendrier dans lequel cette étude est réalisée., Comme dans de nombreux cas, il est possible que la période donnée pour que l’événement puisse se produire est le même que l’autre. L’analyse de survie implique la modélisation des données de temps à l’événement. Donc, nous avons besoin de définir le contexte de l’Analyse de Survie dans l’étude comme le temps comme « l’Événement” dans le contexte de l’analyse de Survie.

Il existe différentes façons d’effectuer une analyse de survie. Il est effectué de plusieurs façons comme lorsque nous définissons un groupe. Certains d’entre eux sont les courbes de Kaplan Meier, les Modèles de régression de Cox, la fonction de danger, la fonction de survie, etc.,

lorsque l’analyse de survie est faite pour comparer l’analyse de survie de deux groupes différents. Là, nous effectuons le test Log-Rank.

lorsque l’analyse de survie aime décrire les variables catégorielles et quantitatives sur la survie, nous aimons faire une régression proportionnelle des risques de Cox, des modèles de survie paramétriques, etc.

dans L’analyse de survie, nous devons définir certains termes avant de procéder comme L’événement, le temps, la censure, la fonction de survie, etc.,

événement, quand nous parlons, est l’activité qui se passe ou va se produire dans l’étude d’analyse de survie comme la mort d’une personne d’une maladie particulière, le temps de se guérir par un diagnostic médical, le temps de se guérir par des vaccins, le moment de l’apparition de l’échec des machines dans l’atelier

Temps

dans la survie de l’analyse de l’étude de cas est le temps depuis le début de l’analyse de survie d’observation sur la question jusqu’au moment où l’événement va se produire., Comme dans le cas D’une machine mécanique à une défaillance, nous avons besoin de connaître le

(a) l’heure d’un événement où la machine va démarrer
(b) lorsque la machine va échouer
(c) la perte de la machine ou l’arrêt de la machine de l’étude d’analyse de survie.

censure/observation censurée

cette terminologie est définie comme si le sujet sur lequel nous faisons l’étude de l’analyse de la survie n’est pas affecté par l’événement défini de l’étude, alors ils sont décrits comme censurés. Le sujet censuré peut également ne pas avoir d’événement après la fin de l’observation de l’analyse de survie., Le sujet est appelé censuré dans le sens où rien n’a été observé hors du sujet après le moment de la censure.

Les observations de censure sont également de 3 types-

1. Censurée à droite

Droit de censure est utilisé dans de nombreux problèmes. Cela arrive quand nous ne sommes pas certains de ce qui est arrivé aux gens après un certain moment.

cela se produit lorsque le temps réel de l’événement est supérieur au temps censuré lorsque c < T. cela se produit si certaines personnes ne peuvent pas être suivies tout le temps parce qu’elles sont décédées ou ont été perdues pour suivre ou se sont retirées de l’étude. ,

2. Gauche censuré

gauche censurer est quand nous ne sommes pas certains de ce qui est arrivé aux gens avant un certain point dans le temps. La censure à gauche est le contraire, se produisant lorsque le temps réel de l’événement est inférieur au temps censuré lorsque c > t.

3. Intervalle censuré

la censure D’intervalle est lorsque nous savons que quelque chose s’est passé dans un intervalle (pas avant l’Heure de début et pas après l’Heure de fin de l’étude) mais nous ne savons pas exactement quand dans l’intervalle, cela s’est produit.,

la censure par intervalle est une concaténation de la censure gauche et droite lorsque le temps est connu pour s’être produit entre deux points de temps

fonction de survie S (t): il s’agit d’une fonction de probabilité qui dépend du temps de l’étude. Le sujet survit plus que le temps t. La fonction Survivor donne la probabilité que la variable aléatoire t dépasse le temps t spécifié.

ici, nous allons discuter de L’estimateur de Kaplan Meier.

Kaplan Meier Estimator

Kaplan Meier Estimator est utilisé pour estimer la fonction de survie pour les données de durée de vie., C’est une technique statistique non paramétrique. Il est également connu sous le nom d’estimateur de limite de produit, et le concept consiste à estimer le temps de survie pour un certain temps, comme un événement d’essai médical majeur, un certain moment de décès, une défaillance de la machine ou tout événement important important.

Il y a beaucoup d’exemples comme

1. Défaillance des pièces de la machine après plusieurs heures de fonctionnement.

2. Combien de temps il faudra pour que le vaccin COVID 19 guérisse le patient.

3. Combien de temps est nécessaire pour obtenir un remède à partir d’un diagnostic médical, etc.

4., Pour estimer combien d’employés quitteront l’entreprise dans une période de temps spécifique.

5. Combien de patients seront guéris par le cancer du poumon

pour estimer la survie de Kaplan Meier, nous devons d’abord estimer la fonction de survie S (t) est la probabilité de temps d’événement t

où (d) sont le nombre d’événements de décès au moment (t), et (n) est le nombre de sujets à risque de décès juste avant le moment (t).

hypothèses de survie de Kaplan Meier

dans les cas réels, nous n’avons pas d’idée de la véritable fonction du taux de survie., Ainsi, dans L’estimateur Kaplan Meier, nous estimons et approximons la fonction de survie réelle à partir des données de l’étude. Il y a 3 hypothèses de survie de Kaplan Meier

1) les probabilités de survie sont les mêmes pour tous les échantillons qui ont rejoint tard dans l’étude et ceux qui ont rejoint tôt. L’analyse de survie qui peut affecter n’est pas supposée changer.

2) L’Occurrence de L’événement se fait à un moment spécifié.

3) la Censure de l’étude ne dépend pas du résultat. La méthode Kaplan Meier ne dépend pas du résultat d’intérêt.,

L’interprétation de L’analyse de survie est l’axe des Y montre la probabilité de sujet qui n’a pas fait l’objet de l’étude de cas. L’axe des X montre la représentation de l’intérêt du sujet après avoir survécu jusqu’au temps. Chaque baisse de la fonction de survie (approximée par L’estimateur de Kaplan-Meier) est causée par l’événement d’intérêt qui se produit pour au moins une observation.,

l’intrigue est souvent accompagnée d’intervalles de confiance, pour décrire l’incertitude sur les estimations ponctuelles-des intervalles de confiance plus larges montrent une incertitude élevée, cela se produit lorsque nous avons quelques participants – se produit dans les deux observations mourir et être censuré.

éléments importants à considérer pour L’analyse de L’estimateur Kaplan Meier

1) nous devons effectuer le test de classement du journal pour faire tout type d’inférences.

2) les résultats de Kaplan Meier peuvent être facilement biaisés., Le Kaplan Meier est une approche univariée pour résoudre le problème

3) la suppression des DONNÉES CENSURÉES entraînera un changement de forme de la courbe. Cela créera des biais dans l’ajustement du modèle

4) les tests statistiques et les observations deviennent trompeurs si la dichotomie de la Variable continue est effectuée.

5) en dichotomisant les moyens, nous prenons des mesures statistiques telles que la médiane pour créer des groupes, mais cela peut entraîner des problèmes dans l’ensemble de données.,

prenons l’exemple en Python

Lien pour ordinateur Portable (https://drive.google.com/file/d/1VGKZNViDbx4rx_7lGMCA6dgU3XuMKGVU/view?usp=sharing)

Laissez-nous importer la bibliothèque importante requise pour travailler en python

tout d’Abord, nous sommes l’importation de différentes bibliothèques python pour notre travail. Ici, nous prenons l’ensemble de données sur le cancer du poumon. Après les bibliothèques et le chargement, nous lirons les données à l’aide de la bibliothèque pandas. L’ensemble de données contient des informations différentes

Ici, nous voyons la Tête &queue.,

maintenant, ici nous importons le code python pour effectuer L’estimateur Kaplan Meier

ici, nous effectuons l’analyse sur le score de Karnofsky, l’axe des x représente la chronologie et l’axe des y montre le score. Le meilleur score est 1 cela signifie que le sujet est en forme, un score de 0 signifie le pire score.

ensuite, nous appliquons le code pour la survie, la thérapie préalable, le traitement ici, nous ferons L’analyse de L’estimateur Kaplan Meier.

ensuite, nous adaptons kmf1 = KaplanMeierFitter() pour ajuster la fonction Kaplan Meier et nous exécutons le code suivant pour différentes données liées aux problèmes de cancer du poumon.,

L’estimateur Kaplan Meier après l’exécution du code montre le tracé entre la norme de test de traitement & test de traitement.

Dans cet article, mon objectif était d’expliquer l’Analyse de Survie de Kaplan Meier Estimateur. Les choses qui y sont liées et une description du problème dans la vie réelle.,

avantages& Dis-avantages de L’estimateur Kaplan Meier

avantages

1) ne nécessite pas trop de fonctionnalités – le temps nécessaire à l’événement d’analyse de survie est seulement requis.

2) fournit un aperçu moyen lié à l’événement.

Share

Laisser un commentaire

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *