Ez a cikk az Data Science Blogathon részeként jelent meg.
Bevezetés
túlélési elemzés
sokan közülünk mindig van egy kérdés az elmében, hogy mennyi időt vesz igénybe egy esemény bekövetkezése. Mint egy mechanikus rendszer meghibásodása, az emberi testet bármilyen betegség érinti, mennyi időbe telik a betegségek gyógyítása., Akkor hány fog túlélni egy adott után csinál egy orvosi diagnózis, milyen sebességgel fog meghalni, vagy nem? Lehetséges-e figyelembe venni a halál vagy kudarc többszörös okait a tágabb nézetben? Mindezen kérdések megválaszolásához tanulmányozzuk a túlélési elemzést.
a túlélési elemzés a statisztikák fontos ága, amelyet figyelembe veszünk mindezen kérdések megválaszolásához.
a túlélési elemzésnek meg kell határoznia azt az időkeretet, amelyben ezt a vizsgálatot elvégzik., Mint sok esetben, lehetséges, hogy az esemény bekövetkezésének adott időtartama megegyezik egymással. A túlélési elemzés magában foglalja az eseményekre vonatkozó adatok modellezését. Tehát meg kell határoznunk a túlélési elemzés kontextusát a tanulmányban, mint az idő, mint” esemény ” a túlélési elemzés összefüggésében.
a túlélés elemzésének különböző módjai vannak. Ez többféle módon történik, mint például egy csoport meghatározásakor. Ezek közül néhány Kaplan Meier görbék, Cox regressziós modellek, Veszélyfunkció, túlélési funkció stb.,
amikor a túlélési elemzést két különböző csoport túlélési elemzésének összehasonlítására végzik. Itt végezzük el a Log-Rank tesztet.
amikor a túlélési analízis a túlélésre vonatkozó kategorikus és kvantitatív változókat szeretné leírni, a Cox arányos veszélyek regresszióját, parametrikus túlélési modelleket stb.
a túlélési elemzésben meg kell határoznunk bizonyos kifejezéseket, mielőtt az esemény, az idő, a cenzúra, a túlélési funkció stb.,
esemény, amikor beszélünk, az a tevékenység, amely folyik, vagy fog történni a túlélési elemzés tanulmány, mint a halál egy személy egy adott betegség, ideje, hogy gyógyítja az orvosi diagnosztika, ideje, hogy meggyógyult vakcinák, előfordulásának időpontja meghibásodása gépek a gyártó üzlet emelet, ideje betegségek előfordulása, stb ..
idő
a túlélési analízisben az esettanulmány a tárgyra vonatkozó túlélési analízis megfigyelésének kezdetétől az esemény bekövetkezésének időpontjáig eltelt idő., Mint a mechanikus gép meghibásodása esetén, ismernünk kell egy esemény
(a) idejét, amikor a gép elindul
(b) amikor a gép meghibásodik
(c) A gép elvesztése vagy a gép leállítása a túlélési elemzésből.
Cenzúrázott / Cenzúrázott megfigyelés
Ez a terminológia úgy definiálódik, mintha a túlélési elemzés tanulmányozásának tárgyát nem érinti a meghatározott tanulmányi esemény, akkor cenzúrázottnak nevezik őket. Lehet, hogy a cenzúrázott alanynak nincs eseménye a túlélési elemzés megfigyelésének befejezése után., A témát cenzúrázottnak nevezik abban az értelemben, hogy a cenzúrázás ideje után semmit sem figyeltek meg a témáról.
a cenzúrázási megfigyelés szintén 3 típusból áll –
1. Jobb Cenzúrázott
jobb cenzúra használják sok probléma. Ez akkor történik, amikor nem vagyunk biztosak abban, hogy mi történt az emberekkel egy bizonyos idő elteltével.
Ez akkor fordul elő, amikor a valódi esemény ideje nagyobb, mint a cenzúrázott idő, amikor c < t. ez akkor fordul elő, ha vagy néhány embert nem lehet követni az egész idő alatt, mert meghaltak vagy elvesztek, hogy nyomon kövessék vagy visszavonják a tanulmányt.,
2. Balra Cenzúrázott
a bal cenzúra akkor van, amikor nem vagyunk biztosak abban, hogy mi történt az emberekkel egy bizonyos idő előtt. A bal cenzúra az ellenkezője, akkor fordul elő, amikor az igazi eseményidő kevesebb, mint a cenzúrázott idő, amikor c > t.
3. Intervallum Cenzúrázott
intervallum cenzúrázása az, amikor tudjuk, hogy valami történt egy intervallumban (nem a kezdési idő előtt, nem pedig a vizsgálat befejezési ideje után), de nem tudjuk pontosan, mikor történt az intervallumban.,
az Intervallumcenzorálás a bal és a jobb cenzorálás konkatenációja, amikor az idő ismert, hogy két időpont között történt
túlélési függvény S (t): ez egy valószínűségi függvény, amely a vizsgálat idejétől függ. Az alany túléli több mint idő t. a túlélő függvény megadja annak a valószínűségét, hogy a véletlen változó t meghaladja a megadott időt t.
itt, megbeszéljük a Kaplan Meier Becslőt.
Kaplan Meier Estimator
Kaplan Meier Estimator becslésére használják a túlélési funkció élettartam adatok., Ez egy nem parametrikus statisztikai technika. Ez is ismert, mint a termék-limit becslő, és a koncepció abban rejlik, hogy becslése a túlélési idő egy bizonyos ideig, mint egy nagy orvosi próba esemény, egy bizonyos ideig a halál, a gép meghibásodása, vagy bármely jelentős esemény.
sok példa van, mint például a
1. A gép alkatrészeinek meghibásodása több órás működés után.
2. Mennyi időt vesz igénybe a COVID 19 vakcina a beteg gyógyításához.
3. Mennyi időre van szükség ahhoz, hogy gyógyulást kapjunk az orvosi diagnózisból stb.
4., Annak becslése, hogy hány alkalmazott hagyja el a társaságot egy adott időszakban.
5. Hány beteget gyógyít meg tüdőrák
a Kaplan Meier túlélésének becsléséhez először meg kell becsülnünk az S (t) túlélési funkciót, a T
eseményidő valószínűsége, ahol (d) a haláleset száma abban az időben (t), és (n) A halál kockázatának kitett személyek száma közvetlenül a T (T) idő előtt.
A Kaplan Meier túlélésének feltételezései
valós esetekben nincs elképzelésünk a valódi túlélési arány funkcióról., Tehát a Kaplan Meier becslésben a vizsgálati adatokból becsüljük meg és közelítjük meg a valódi túlélési funkciót. Vannak 3 feltételezések Kaplan Meier túlélés
1) túlélési valószínűségek azonosak az összes mintát, akik csatlakoztak későn a vizsgálatban, és azok, akik csatlakoztak a korai. Feltételezhető, hogy a túlélési elemzés, amely befolyásolhatja, nem változik.
2) Az esemény előfordulása egy meghatározott időpontban történik.
3) a vizsgálat cenzúrázása nem függ az eredménytől. A Kaplan Meier módszer nem függ az érdeklődés eredményétől.,
a túlélési elemzés értelmezése Y-tengely mutatja az alany valószínűségét, amely nem került az esettanulmány alá. Az X-tengely mutatja az alany érdeklődésének ábrázolását, miután túlélte az időt. A túlélési funkció minden csökkenését (a Kaplan-Meier becslővel közelítve) legalább egy megfigyelés esetén bekövetkező érdeklődés okozza.,
a cselekményt gyakran bizalmi intervallumok kísérik, a pontbecslésekkel kapcsolatos bizonytalanság leírására-a szélesebb megbízhatósági intervallumok nagy bizonytalanságot mutatnak, ez akkor fordul elő, ha néhány résztvevőnk van-mind a megfigyelések haldoklik, mind pedig cenzúrázzák.
Fontos dolog, hogy fontolja meg a Kaplan-Meier Becslés, Elemzés
1) el kell végezni a Log-Rank Teszt, hogy bármilyen következtetéseket.
2) Kaplan Meier eredményei könnyen elfogultak lehetnek., A Kaplan Meier egy univariate megközelítés a probléma megoldására
3) a cenzúrázott Adatok eltávolítása a görbe alakjának megváltozását eredményezi. Ez torzításokat hoz létre a model fit-up
4) statisztikai tesztekben és megfigyelésekben, ha a folyamatos változó Dichotomizálását végezzük.
5) a dichotomizálással olyan statisztikai intézkedéseket teszünk, mint például a medián csoportok létrehozásához, de ez problémákat okozhat az adatkészletben.,
vegyük a példát Python
link to Notebook- (https://drive.google.com/file/d/1VGKZNViDbx4rx_7lGMCA6dgU3XuMKGVU/view?usp=sharing)
importáljuk a python
először különböző Python könyvtárakat importálunk a munkánkhoz. Itt vesszük a tüdőrák adathalmazát. A könyvtárak betöltése után az adatokat a pandas könyvtár segítségével fogjuk elolvasni. Az adatkészlet különböző információkat tartalmaz
itt látjuk a fejét &farok.,
most itt importáljuk a Python kódot a Kaplan Meier Becslőhöz
itt elvégezzük az elemzést a Karnofsky pontszám X tengelye ábrázolja az idővonalat, az y tengely pedig a pontszámot mutatja. A legjobb pontszám 1 Ez azt jelenti, hogy a téma megfelelő, a 0-os pontszám a legrosszabb pontszámot jelenti.
ezután alkalmazzuk a túlélési kódot, az előzetes terápiát, a kezelést itt fogjuk elvégezni a Kaplan Meier becslési elemzést.
ezután a Kaplan Meier funkció felszereléséhez kmf1 = KaplanMeierFitter () – et illesztünk be, és a tüdőrákkal kapcsolatos különböző adatokhoz a következő kódot futtatjuk.,
Kaplan Meier estimator a kód futtatása után a &kezelési teszt közötti telket mutatja.
ebben a tanulmányban a legfontosabb célom a túlélési elemzés magyarázata volt Kaplan Meier Becslővel. Az ehhez kapcsolódó dolgok, valamint a valós élet problémaleírása.,
előnyök & Dis – a Kaplan Meier Estimator előnyei
előnyök
1) nem igényel túl sok funkciót – a túlélési elemzési eseményhez csak idő szükséges.
2) az eseményhez kapcsolódó átlagos áttekintést nyújt.