Eine kurze Einführung in die Überlebensanalyse und Kaplan Meier Estimator

Dieser Artikel wurde als Teil des Data Science Blogathon veröffentlicht.

Einführung

Überlebensanalyse

Viele von uns haben immer eine Frage im Kopf, wie viel Zeit für ein Ereignis benötigt wird. Wie das Versagen eines mechanischen Systems wird der menschliche Körper von jeder Art von Krankheit betroffen, wie viel Zeit es dauern wird, um die Krankheiten zu heilen., Wie viele werden dann eine Krankheit nach einer medizinischen Diagnose überleben, mit welcher Rate wird man sterben oder scheitern? Ist es möglich, die vielfältigen Todesursachen oder Misserfolge im weiteren Sinne zu berücksichtigen? Um all diese Fragen zu beantworten, untersuchen wir die Überlebensanalyse.

Die Überlebensanalyse ist ein wichtiger Statistikzweig, der zur Beantwortung all dieser Fragen berücksichtigt wird.

Survival Analysis Studie muss definieren Sie einen Zeitrahmen, in dem diese Studie durchgeführt wird., Wie in vielen Fällen ist es möglich, dass der gegebene Zeitraum für das Ereignis identisch ist. Die Überlebensanalyse beinhaltet die Modellierung von Zeit-zu-Ereignis-Daten. Daher müssen wir den Kontext der Überlebensanalyse in der Studie wie die Zeit als „Ereignis“ im Kontext der Überlebensanalyse definieren.

Es gibt verschiedene Möglichkeiten, wie wir eine Überlebensanalyse durchführen. Es wird auf verschiedene Arten ausgeführt, z. B. wenn wir eine Gruppe definieren. Einige von ihnen sind Kaplan Meier-Kurven, Cox-Regressionsmodelle, Gefahrenfunktion, Überlebensfunktion usw.,

Wenn die Überlebensanalyse durchgeführt wird, um die Überlebensanalyse zweier verschiedener Gruppen zu vergleichen. Dort führen wir den Log-Rank-Test durch.

Wenn die Überlebensanalyse die kategorischen und quantitativen Überlebensvariablen beschreibt, die wir gerne mit proportionaler Risikoregression, parametrischen Überlebensmodellen usw. durchführen.

In der Überlebensanalyse müssen wir bestimmte Begriffe definieren, bevor man wie das Ereignis, die Zeit, die Zensur, die Überlebensfunktion usw. vorgeht.,

Ereignis, wenn wir darüber sprechen, ist die Aktivität, die in der Überlebensanalyse-Studie stattfindet oder stattfinden wird, wie der Tod einer Person an einer bestimmten Krankheit, die Zeit, um durch eine medizinische Diagnose geheilt zu werden, die Zeit, um durch Impfstoffe geheilt zu werden, die Zeit des Auftretens von Maschinen in der Fertigungshalle, die Zeit für das Auftreten von Krankheiten usw.

Zeit

in der Überlebensanalyse Fallstudie ist die Zeit vom Beginn der Überlebensanalyse Beobachtung zum Thema bis zu dem Zeitpunkt, wenn das Ereignis auftreten wird., Wie im Fall der mechanischen Maschine zu einem Ausfall müssen wir die

(a) Zeit eines Ereignisses kennen, wenn die Maschine startet
(b) wenn die Maschine ausfällt
(c) Verlust der Maschine oder das Herunterfahren der Maschine aus der Überlebensanalyse Studie.

Zensur / Zensierte Beobachtung

Diese Terminologie ist so definiert, als ob der Gegenstand, an dem wir die Untersuchung der Überlebensanalyse durchführen, nicht durch das definierte Studienereignis beeinflusst wird.dann werden sie als zensiert beschrieben. Das zensierte Subjekt hat möglicherweise auch kein Ereignis nach dem Ende der Beobachtung der Überlebensanalyse., Das Subjekt wird zensiert in dem Sinne genannt, dass nach der Zeit der Zensur nichts aus dem Subjekt heraus beobachtet wurde.

Zensurbeobachtungen sind ebenfalls von 3 Typen –

1. Rechts zensiert

Rechts Zensur wird in vielen Problemen verwendet. Es passiert, wenn wir nicht sicher sind, was nach einem bestimmten Zeitpunkt mit Menschen passiert ist.

Es tritt auf, wenn die wahre Ereigniszeit größer ist als die zensierte Zeit, wenn c < t. Dies geschieht, wenn entweder einige Personen nicht die ganze Zeit verfolgt werden können, weil sie gestorben sind oder verloren gegangen sind, um die Studie zu verfolgen oder sich aus der Studie zurückzuziehen. ,

2. Links zensiert

Linke Zensur ist, wenn wir nicht sicher sind, was vor einem bestimmten Zeitpunkt mit Menschen passiert ist. Die linke Zensur ist das Gegenteil und tritt auf, wenn die wahre Ereigniszeit geringer ist als die zensierte Zeit, wenn c > t.

3. Intervall zensiert

Intervall Zensur ist, wenn wir wissen, dass etwas in einem Intervall passiert ist (nicht vor dem Start und nicht nach dem Ende der Studie), aber wir wissen nicht genau, wann in dem Intervall es passiert ist.,

Intervallzensur ist eine Verkettung der linken und rechten Zensur, wenn bekannt ist, dass die Zeit zwischen zwei Zeitpunkten aufgetreten ist

Überlebensfunktion S (t): Dies ist eine Wahrscheinlichkeitsfunktion, die vom Zeitpunkt der Studie abhängt. Das Subjekt überlebt mehr als die Zeit t. Die Überlebensfunktion gibt die Wahrscheinlichkeit an, dass die Zufallsvariable T die angegebene Zeit t überschreitet.

Hier werden wir den Kaplan Meier-Schätzer diskutieren.

Kaplan Meier Estimator

Kaplan Meier Estimator wird verwendet, um die Überlebensfunktion für lebenslange Daten zu schätzen., Es ist eine nicht-parametrische Statistiken Technik. Es ist auch bekannt als die produkt-limit estimator, und das konzept liegt in der schätzung der überlebenszeit für eine bestimmte zeit wie eine große medizinische studie ereignis, eine bestimmte zeit des todes, ausfall der maschine, oder jede große signifikante ereignis.

Es gibt viele Beispiele, wie

1. Ausfall von Maschinenteilen nach mehreren Betriebsstunden.

2. Wie viel Zeit wird es dauern, bis der COVID-19-Impfstoff den Patienten heilt?

3. Wie viel Zeit ist erforderlich, um eine Heilung von einer medizinischen Diagnose usw. zu erhalten?

4., Um abzuschätzen, wie viele Mitarbeiter das Unternehmen in einem bestimmten Zeitraum verlassen werden.

5. Wie viele Patienten werden durch Lungenkrebs geheilt werden

Um das Kaplan Meier-Überleben abzuschätzen, müssen wir zuerst die Überlebensfunktion abschätzen S (t) ist die Wahrscheinlichkeit der Ereigniszeit t

Wobei (d) die Anzahl der Todesfälle zum Zeitpunkt (t) und (n) die Anzahl der todesgefährdeten Personen kurz vor dem Zeitpunkt (t) ist.

Annahmen des Kaplan Meier-Überlebens

In realen Fällen haben wir keine Vorstellung von der wahren Überlebensratenfunktion., In Kaplan Meier Estimator schätzen und approximieren wir also die wahre Überlebensfunktion aus den Studiendaten. Es gibt 3 Annahmen der Kaplan-Meier Survival

1) Survival Wahrscheinlichkeiten sind die gleichen für alle die Proben, trat spät in das Studium und die haben sich diejenigen, die früh. Die Überlebensanalyse, die beeinflussen kann, wird nicht angenommen, sich zu ändern.

2) Das Auftreten von Ereignissen erfolgt zu einem bestimmten Zeitpunkt.

3) Die Zensur der Studie hängt nicht vom Ergebnis ab. Die Kaplan-Meier-Methode hängt nicht vom Ergebnis des Interesses ab.,

Interpretation der Überlebensanalyse ist Y-Achse zeigt die Wahrscheinlichkeit des Subjekts, das nicht unter die Fallstudie gekommen ist. Die X-Achse zeigt die Darstellung des Interesses des Subjekts nach dem Überleben bis zu Zeit. Jeder Rückgang der Überlebensfunktion (angenähert durch den Kaplan-Meier-Schätzer) wird durch das Ereignis von Interesse verursacht, das für mindestens eine Beobachtung auftritt.,

Die Handlung wird oft von Konfidenzintervallen begleitet, um die Unsicherheit über die Punktschätzungen zu beschreiben-breitere Konfidenzintervalle zeigen eine hohe Unsicherheit, dies geschieht, wenn wir einige Teilnehmer haben – tritt sowohl in Beobachtungen auf, die sterben als auch zensiert werden.

Wichtige Dinge, die für die Kaplan Meier Estimator-Analyse zu beachten sind

1) Wir müssen den Log Rank-Test durchführen, um Rückschlüsse jeglicher Art zu ziehen.

2) Kaplan Meiers Ergebnisse können leicht voreingenommen sein., Der Kaplan Meier ist ein univariater Ansatz zur Lösung des Problems

3) Das Entfernen zensierter Daten führt zu einer Änderung der Kurvenform. Dies führt zu Verzerrungen bei der Modellanpassung

4) Statistische Tests und Beobachtungen werden irregeführt, wenn die Dichotomisierung der Variablen durchgeführt wird.

5) Durch Dichotomisierung ergreifen wir statistische Maßnahmen wie den Median, um Gruppen zu erstellen, dies kann jedoch zu Problemen im Datensatz führen.,

Nehmen wir das Beispiel in Python

Link zum Notebook- (https://drive.google.com/file/d/1VGKZNViDbx4rx_7lGMCA6dgU3XuMKGVU/view?usp=sharing)

Lassen Sie uns die wichtige Bibliothek importieren, die für die Arbeit in Python erforderlich ist

Zunächst importieren wir verschiedene Python-Bibliotheken für unsere Arbeit. Hier nehmen wir den Lungenkrebsdatensatz. Nach den Bibliotheken und dem Laden lesen wir die Daten mit der Pandas-Bibliothek. Der Datensatz enthält verschiedene Informationen

Hier sehen wir den Kopf &Schwanz.,

Nun, Hier importieren wir den Python-Code für die Durchführung des Kaplan Meier Schätzers

Hier führen wir die Analyse auf dem Karnofsky Score es x-Achse zeigt die Zeitleiste und die y-Achse zeigt die Punktzahl. Die beste Punktzahl ist 1 es bedeutet, dass das Thema fit ist, eine Punktzahl von 0 bedeutet die schlechteste Punktzahl.

Dann wenden wir den Code für das Überleben an, Vorherige Therapie, die Behandlung hier werden wir die Kaplan Meier Estimator-Analyse durchführen.

Dann passen wir kmf1 = KaplanMeierFitter() zur Anpassung der Kaplan Meier-Funktion an und führen den folgenden Code für verschiedene Daten im Zusammenhang mit den Lungenkrebsproblemen aus.,

Kaplan Meier estimator nach dem Ausführen des Codes zeigt das Diagramm zwischen Behandlungstest Standard &Behandlungstest.

In diesem Beitrag war es mein Hauptziel, die Überlebensanalyse mit Kaplan Meier Estimator zu erklären. Die damit verbundenen Dinge und eine Problembeschreibung im wirklichen Leben.,

Vorteile & Dis-Vorteile von Kaplan Meier Estimator

Vorteile

1) Erfordert nicht zu viele Funktionen – Zeit zum Überlebensanalyseereignis ist nur erforderlich.

2) Bietet einen durchschnittlichen Überblick über das Ereignis.

Share

Schreibe einen Kommentar

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert.