artykuł został opublikowany w ramach Blogathonu Data Science.
wprowadzenie
Analiza przeżycia
Wielu z nas zawsze ma pytanie, ile czasu zajmie wydarzenie. Podobnie jak awaria układu mechanicznego, Ludzkie ciało dotknięte jakąkolwiek chorobą, ile czasu zajmie wyleczenie chorób., To ile przeżyje konkretny po zrobieniu diagnozy medycznej, w jakim tempie jeden umrze lub zawiedzie? Czy możliwe jest wzięcie pod uwagę wielu przyczyn śmierci lub niepowodzenia w szerszym ujęciu? Aby odpowiedzieć na wszystkie te pytania, badamy analizę przeżycia.
Analiza przeżycia jest ważną gałęzią statystyki, która jest brana pod uwagę, aby odpowiedzieć na wszystkie te pytania.
Analiza przeżycia badanie musi określić ramy czasowe, w których badanie to jest przeprowadzane., Jak w wielu przypadkach, możliwe jest, że dany okres czasu dla zdarzenia do wystąpienia jest taki sam jak siebie nawzajem. Analiza przeżycia obejmuje modelowanie czasu do danych zdarzeń. Tak więc, musimy zdefiniować kontekst analizy przeżycia w badaniu jak czas jako „zdarzenie” w kontekście analizy przeżycia.
istnieją różne sposoby przeprowadzania analizy przeżycia. Jest ona wykonywana na kilka sposobów, jak wtedy, gdy definiujemy grupę. Niektóre z nich to krzywe Kaplana Meiera, Modele regresji Coxa, funkcja zagrożenia, funkcja przeżycia itp.,
gdy analiza przeżycia jest wykonywana w celu porównania analizy przeżycia dwóch różnych grup. Tam wykonujemy test Log-Rank.
gdy analiza przeżycia lubi opisywać zmienne kategoryczne i ilościowe dotyczące przeżycia, lubimy robić regresję zagrożeń proporcjonalnych, parametryczne modele przeżycia itp.
w analizie przetrwania musimy zdefiniować pewne terminy, zanim zaczniemy działać, takie jak Zdarzenie, czas, Cenzura, funkcja przetrwania itp.,
Zdarzenie, o którym mówimy, to czynność, która ma miejsce lub ma się wydarzyć w badaniu analizy przeżycia, jak śmierć osoby z określonej choroby, czas na wyleczenie przez diagnozę medyczną, czas na wyleczenie przez szczepionki, czas wystąpienia awarii maszyn w hali produkcyjnej, czas wystąpienia chorób itp.
czas
w studium przypadku analizy przeżycia to czas od rozpoczęcia obserwacji analizy przeżycia na dany temat do czasu wystąpienia zdarzenia., Podobnie jak w przypadku awarii maszyny mechanicznej musimy znać
(a) czas zdarzenia, gdy maszyna się uruchomi
(b) gdy maszyna się nie powiedzie
(c) utrata maszyny lub wyłączenie maszyny z badania analizy przeżycia.
cenzurowanie/ocenzurowana obserwacja
terminologia ta jest zdefiniowana tak, jakby przedmiot, na który prowadzimy analizę przeżycia, nie został dotknięty określonym zdarzeniem badania, a następnie jest opisywany jako ocenzurowany. Ocenzurowany podmiot może również nie mieć zdarzenia po zakończeniu obserwacji analizy przeżycia., Podmiot nazywany jest ocenzurowanym w tym sensie, że po czasie cenzurowania nic nie było obserwowane poza podmiotem.
obserwacja Cenzurująca jest również 3 typów-
1. Prawo cenzurowane
prawo cenzurowane jest używane w wielu problemach. Dzieje się tak, gdy nie jesteśmy pewni, co stało się z ludźmi po pewnym momencie w czasie.
występuje, gdy prawdziwy czas zdarzenia jest większy niż czas ocenzurowany, gdy c< t. dzieje się tak, gdy niektóre osoby nie mogą być śledzone przez cały czas, ponieważ umarły lub zostały utracone w celu obserwacji lub wycofały się z badania.,
2. Lewe cenzurowanie
lewe cenzurowanie jest wtedy, gdy nie jesteśmy pewni, co stało się z ludźmi przed pewnym momentem w czasie. Cenzurowanie lewe jest odwrotne, występuje, gdy prawdziwy czas zdarzenia jest mniejszy niż czas cenzurowania, gdy c > t.
3. Interwał ocenzurowany
interwał ocenzurowany jest wtedy, gdy wiemy, że coś się wydarzyło w interwale (Nie przed czasem rozpoczęcia i nie po czasie zakończenia badania), ale nie wiemy dokładnie, kiedy w interwale to się stało.,
cenzurowanie interwałowe jest połączeniem cenzurowania lewego i prawego, gdy wiadomo, że czas wystąpił między dwoma punktami czasowymi
funkcja przetrwania S (t): jest to funkcja prawdopodobieństwa, która zależy od czasu badania. Obiekt przeżywa więcej niż czas t. funkcja przetrwania daje prawdopodobieństwo, że zmienna losowa T przekracza określony czas t.
tutaj omówimy Estymator Kaplana Meiera.
Estymator Kaplana Meiera
Estymator Kaplana Meiera służy do oszacowania funkcji przeżycia dla danych dotyczących okresu życia., Jest to nieparametryczna technika statystyczna. Jest również znany jako Estymator limitu produktu, a koncepcja polega na szacowaniu czasu przeżycia przez pewien czas, jak poważne zdarzenie medyczne, pewien czas śmierci, awaria maszyny lub jakiekolwiek ważne wydarzenie.
istnieje wiele przykładów takich jak
1. Awaria części maszyn po kilku godzinach pracy.
2. Ile czasu zajmie szczepionka COVID 19, aby wyleczyć pacjenta.
3. Ile czasu potrzeba na wyleczenie z diagnozy medycznej itp.
4., Aby oszacować, ilu pracowników opuści firmę w określonym czasie.
5. Ilu pacjentów wyleczy się z raka płuc
aby oszacować przeżywalność Kaplana Meiera najpierw musimy oszacować przeżywalność S (T) to prawdopodobieństwo wystąpienia zdarzenia t
Gdzie (D) to liczba zdarzeń śmiertelnych w czasie (t), A (n) to liczba osób zagrożonych zgonem tuż przed czasem (t).
założenia przeżycia Kaplana Meiera
w rzeczywistych przypadkach nie mamy pojęcia o prawdziwej funkcji przeżywalności., Tak więc w Estymatorze Kaplana Meiera szacujemy i przybliżamy prawdziwą funkcję przeżycia na podstawie danych z badania. Istnieją 3 założenia Kaplan Meier Survival
1) prawdopodobieństwo przeżycia jest takie samo dla wszystkich próbek, które dołączyły późno w badaniu i tych, które dołączyły wcześniej. Nie zakłada się, że analiza przeżycia, która może mieć wpływ, nie ulegnie zmianie.
2) wystąpienie zdarzenia odbywa się w określonym czasie.
3) ocenzurowanie badania nie zależy od wyniku. Metoda Kaplana Meiera nie zależy od wyniku zainteresowania.,
interpretacja analizy przeżycia to oś Y pokazuje prawdopodobieństwo wystąpienia podmiotu, który nie znalazł się w studium przypadku. Oś X pokazuje reprezentację zainteresowania testera po przetrwaniu do czasu. Każdy spadek funkcji przeżycia (przybliżony przez Estymator Kaplana-Meiera) jest spowodowany zdarzeniem, które miało miejsce dla co najmniej jednej obserwacji.,
fabule często towarzyszą przedziały ufności, aby opisać niepewność co do szacunków punktowych-szersze przedziały ufności wykazują dużą niepewność, dzieje się tak, gdy mamy kilku uczestników-występuje zarówno w obserwacjach, jak i w ocenzurowaniu.
ważne rzeczy, które należy wziąć pod uwagę przy analizie estymatora Kaplana Meiera
1) musimy wykonać test Log Rank, aby wyciągnąć jakiekolwiek wnioski.
2) wyniki Kaplana Meiera mogą być łatwo stronnicze., Kaplan Meier jest podejściem jednowymiarowym do rozwiązania problemu
3) Usunięcie ocenzurowanych danych spowoduje zmianę kształtu krzywej. Spowoduje to powstanie uprzedzeń w dopasowaniu modelu
4) testy statystyczne i obserwacje stają się mylące, jeśli przeprowadzono Dychotomizację zmiennej ciągłej.
5) poprzez dychotomizację środków podejmujemy środki statystyczne, takie jak Mediana, aby utworzyć grupy, ale może to prowadzić do problemów w zbiorze danych.,
weźmy przykład w Pythonie
Link do Notatnika- (https://drive.google.com/file/d/1VGKZNViDbx4rx_7lGMCA6dgU3XuMKGVU/view?usp=sharing)
zaimportujmy ważną bibliotekę wymaganą do pracy w Pythonie
Po pierwsze, importujemy różne biblioteki Pythona do naszej pracy. Tutaj bierzemy zestaw danych dotyczących raka płuc. Po załadowaniu bibliotek odczytamy dane za pomocą biblioteki pandas. Zestaw danych zawiera różne informacje
tutaj widzimy głowę &ogon.,
teraz, tutaj importujemy kod Pythona do wykonywania estymatora Kaplana Meiera
tutaj, wykonujemy analizę na wyniku Karnofsky ' ego oś x przedstawia oś czasu, a oś y pokazuje wynik. Najlepszy wynik to 1 oznacza to, że obiekt jest sprawny, wynik 0 oznacza najgorszy wynik.
następnie zastosujemy kod przeżycia, wcześniejszą terapię, leczenie tutaj wykonamy analizę estymatora Kaplana Meiera.
następnie dopasowujemy kmf1 = KaplanMeierFitter () do dopasowania funkcji Kaplan Meier i uruchamiamy następujący kod dla różnych danych związanych z rakiem płuc.,
Estymator Kaplana Meiera po uruchomieniu kodu pokazuje wykres pomiędzy standardem testu leczenia&test leczenia.
w tym artykule moim głównym celem było wyjaśnienie analizy przeżycia za pomocą estymatora Kaplana Meiera. Rzeczy z nim związane i opis problemu w prawdziwym życiu.,
zalety& zalety estymatora Kaplana Meiera
zalety
1) nie wymaga zbyt wielu funkcji-wymagany jest tylko czas do analizy przeżycia.
2) zapewnia średni przegląd związany z wydarzeniem.