En Kort Introduksjon til Overlevelse Analyse og Kaplan-Meier-Estimator

Denne artikkelen ble publisert som en del av Data, Science Blogathon.

Innledning

Overlevelse Analyse

Mange av oss alltid har et spørsmål i hodet som til hvor mye tid vil det ta for at en hendelse skal skje. Som unnlatelse av et mekanisk system, den menneskelige kroppen blir berørt av noen form for sykdom, hvor mye tid det vil ta å kurere sykdommer., Så hvor mange som vil overleve en bestemt etter å gjøre en medisinsk diagnose, til hvilken pris man vil dø eller ikke? Er det mulig å ta hensyn til flere årsaker til død eller manglende bli tatt inn på et bredere syn? For å svare på alle disse spørsmålene vi studere Overlevelse Analyse.

Overlevelse Analyse er en viktig gren av Statistikken som er tatt i betraktning for å svare på alle disse spørsmålene.

Overlevelse Analyse studie behov for å definere en tidsramme som denne studien er gjennomført., Som i mange tilfeller er det mulig at tid-periode for at hendelsen skal inntreffe er det samme som hverandre. Overlevelse analyse innebærer modellering av tid til event data. Så, vi må definere sammenheng med Overlevelse Analyse i studien som tid som «Event» i sammenheng med Overlevelse analyse.

Det finnes forskjellige måter som vi utføre overlevelse analyse. Det er utført på flere måter, som når vi definerer en gruppe. Noen av dem er Kaplan-Meier Kurver, Cox Regresjon Modeller, Fare Funksjon, Overlevelse Funksjon, etc.,

Når Overlevelse Analyse er gjort for å sammenligne overlevelse analyse av to ulike grupper. Det vi utfører Log-Rank test.

Når Overlevelse Analyse liker å beskrive det kategoriske og kvantitative variabler på overlevelse vi liker å gjøre Cox proporsjonal farer regresjon, Parametrisk Overlevelse Modeller, etc.

I Overlevelse Analyse, må vi definere visse vilkår før en går som Hendelse, Tid, Sensurere, Overlevelse Funksjon, etc.,

Event, når vi snakker om, er den aktiviteten som skjer eller kommer til å skje i overlevelse analyse studie som Død av en Person fra en bestemt sykdom, tid til å få kur av en medisinsk diagnose, tid til å bli kurert ved hjelp av vaksiner, forekomst av feil på maskiner i produksjon av verksted -, tid for sykdommer forekomst, etc.

Tid

i overlevelse analyse case study er tiden fra begynnelsen av overlevelse analyse observasjon på saken til den tiden når hendelsen kommer til å skje., Som i tilfelle av Mekanisk Maskin til en feil, vi trenger å vite

(a) tidspunktet for en hendelse når maskinen vil starte
(b) når maskinen vil mislykkes
(c) tap av maskinen eller nedleggelse av maskinen fra overlevelse analyse studie.

Sensurere/ Sensurert Observasjon

Denne terminologien er definert som om den saken som vi gjør studier av overlevelse analyse ikke bli påvirket av de definerte tilfelle av studien, da de er beskrevet som sensurert. Den sensurerte emnet kan heller ikke ha et arrangement etter slutten av overlevelse analyse observasjon., Motivet er kalt sensurert i den forstand at ingenting ble observert ut av motivet etter den tid av sensur.

Sensurere Observasjon er også av 3 typer-

– >

1. Høyre Sensurert

Riktig å sensurere brukes i mange problemer. Det som skjer når vi ikke er sikker på hva som skjedde med folk etter et visst tidspunkt.

Det skjer når sant tidspunktet for aktiviteten er større enn sensurert tid når c < t. Dette skjer hvis noen mennesker ikke kan følges hele tiden fordi de døde eller ble borte for å følge opp eller trakk seg fra studien.,

2. Venstre Sensurert

Venstre sensur er når vi ikke er sikker på hva som skjedde med folk før noen gang. Venstre sensur er det motsatte, som oppstår når sant tidspunktet for aktiviteten er mindre enn sensurert tid når c > t.

3. Intervall Sensurert

Intervall sensur er når vi vet at noe har skjedd i et intervall (ikke før du starter gang og ikke etter avslutningen tid av studien), men vi vet ikke nøyaktig når i intervallet det skjedde.,

Intervall sensur er en sammensetning av venstre og høyre sensurere når tiden er kjent for å ha skjedd mellom to-tid poeng

Overlevelse Funksjonen S (t): Dette er en sannsynlighet funksjon som avhenger av tidspunktet for undersøkelsen. Emnet overlever mer enn tid t. Den Overlevende-funksjonen gir sannsynligheten for at en tilfeldig variabel T overstiger den angitte tiden t.

Her vil vi diskutere Kaplan-Meier-Estimator.

Kaplan-Meier-Estimator

Kaplan-Meier-Estimator er brukt til å estimere overlevelse funksjon for å forlenge levetiden data., Det er en ikke-parametrisk statistikk teknikk. Det er også kjent som produkt-limit estimator, og konseptet ligger i å estimere overlevelse tid for en viss tid som en stor medisinsk rettssaken hendelse, en viss tid av død, feil på maskinen, eller noen større betydelige arrangementet.

Det er mange eksempler som

1. Unnlatelse av maskindeler etter flere timers drift.

2. Hvor mye tid vil det ta for COVID 19 vaksine for å kurere pasienten.

3. Hvor mye tid er nødvendig for å få en kur fra en medisinsk diagnose osv.

4., For å anslå hvor mange ansatte vil forlate selskapet i en bestemt periode av tid.

5. Hvor mange pasienter vil få kurert av lungekreft

for Å Beregne Kaplan-Meier Overlevelse vi må først beregne Overlevelse Funksjonen S (t) er sannsynligheten for hendelsen tid t

Hvor (d) er antall dødsfall hendelser på den tiden (t), og (n) er antall personer i risiko for død like før den tid (t).

Forutsetninger for Kaplan-Meier Overlevelse

I det virkelige liv tilfeller vi ikke har en idé om overlevelse rate-funksjonen., Så i Kaplan-Meier-Estimator vi beregne og simulere overlevelse funksjon fra undersøkelsen data. Det er 3 forutsetninger for Kaplan-Meier Overlevelse

1) Overlevelse Sannsynligheten er den samme for alle prøvene som ble med på et sent i studiet og de som har sluttet seg tidlig. Overlevelsen analyse som kan påvirke er ikke antatt å endre.

2) Forekomsten av Hendelsen er gjort på et bestemt tidspunkt.

3) Sensur av studiet ikke er avhengig av utfallet. Den Kaplan-Meier-metoden ikke avhenger av utfallet av interesse.,

Tolkning av Overlevelse Analyse er Y-aksen viser sannsynligheten for at en gjenstand som ikke kommer inn under case-studie. X-aksen viser representasjon av fagets interesse etter å ha overlevd opp til tid. Hver dråpe i overlevelse funksjon (tilnærmes ved Kaplan-Meier-estimator) er forårsaket av arrangementet av interesse som skjer for minst én observasjon.,

tomten er ofte ledsaget av konfidensintervall, for å beskrive usikkerhet om punkt anslag-bredere konfidensintervaller viser høy usikkerhet, dette skjer når vi har få deltagere – forekommer i både observasjoner dø og bli sensurert.

Viktig ting å vurdere for Kaplan-Meier-Estimator Analyse

1) Vi trenger for å utføre Log-Rank Test for å gjøre noe slag av inferens.

2) Kaplan-Meier ‘ s resultater kan være lett partisk., Den Kaplan-Meier er en univariate tilnærming for å løse problemet

3) Fjerning av Sensurert Data vil føre til endring i formen på kurven. Dette vil skape skjevheter i modellen passer-up

4) Statistiske tester og observasjoner bli villede hvis Dichotomizing av Kontinuerlig Variabel er utført.

5) Ved dichotomizing betyr at vi tar statistiske tiltak som median å opprette grupper, men dette kan føre til problemer i datasettet.,

La oss ta et eksempel i Python

Link til Notebook- (https://drive.google.com/file/d/1VGKZNViDbx4rx_7lGMCA6dgU3XuMKGVU/view?usp=sharing)

La oss importere viktige bibliotek som kreves for å arbeide i python –

– >

Først, vi importerer ulike python biblioteker for vårt arbeid. Her tar vi lunge-kreft datasettet. Etter bibliotekene og legg, vi vil lese dataene ved å bruke pandaer bibliotek. Datasettet inneholder forskjellig informasjon

Her ser vi Leder &halen.,

Nå, Her har vi importere python-koden for å utføre Kaplan-Meier-Estimator

Her, vi utfører analyse på Karnofsky score det x-aksen viser tidslinjen og y-aksen viser score. Den beste score er 1 det betyr at emnet er passe, en score på 0 betyr at den dårligste score.

Deretter bruker vi koden for å Overleve, Før Terapi, behandling her vil vi gjøre Kaplan-Meier-Estimator Analyse.

Så, vi passer opp kmf1 = KaplanMeierFitter() for montering opp Kaplan-Meier-funksjonen og vi kjøre følgende kode for ulike data relatert til lungekreft problemer.,

Kaplan-Meier-estimator etter å ha kjørt koden viser tomten mellom Behandling test standard &Behandling test.

I dette notatet, er mitt viktigste mål var å forklare Overlevelse Analyse med Kaplan-Meier-Estimator. De ting relatert til det, og en beskrivelse av problemet i det virkelige liv.,

Fordeler & Dis-Fordelene av Kaplan-Meier-Estimator

Fordeler

1) Betyr ikke kreve for mange har tid til å overleve analyse arrangementet er kun nødvendig.

2) Gir en gjennomsnittlig oversikt knyttet til hendelsen.

Share

Legg igjen en kommentar

Din e-postadresse vil ikke bli publisert. Obligatoriske felt er merket med *