Przejdź do głównej zawartości

Dr House i matematyka

W odcinku „Occam's Razor” dr Gregory House uzasadniając swoje zdanie, że jego hipoteza tłumacząca symptomy dwiema chorobami jest prostsza niż hipoteza oparta na jednej ale bardzo rzadkiej chorobie wygłasza następujące stwierdzenie:

Częstość wystąpienia tych dwóch chorób wynosi jeden do tysiąca. To znaczy, że wystąpienie tych dwóch chorób na raz to wydarzenie do którego dochodzi jeden raz na milion przypadków. Chase twierdzi, że szansa na wystąpienie infekcji serca jest jak jeden do dziesięciu milionów. A to czyni moją hipotezę dziesięć razy lepszą od twojej.

Ta wypowiedź świadczy o tym, że dr Gregory House potrafi pomnożyć dwie liczby i porównać wynik z trzecią, słyszał też coś o prawdopodobieństwie i bardzo chciałby posługiwać się matematyką lecz mimo szczerych chęci zupełnie mu to nie wychodzi. (W sumie wszystko to można zapewne powiedzieć również o scenarzyście, który napisał powyższe zdanie.)

Po pierwsze House czyni założenie o niezależności zapadnięcia na dwie choroby, które podejrzewa u pacjenta. Tak być przecież nie musi. Przykładowo bez jakichkolwiek statystyk mogę śmiało stwierdzić, że zachorowania na mięsaka Kaposiego i toksoplazmozę mózgu nie są zdarzeniami niezależnymi. House jako lekarz powinien mieć świadomość możliwości wystąpienia takich zależności. Być może w przypadku chorób podejrzewanych przez House'a dałoby się obronić założenie ich niezależności ale on sam ani słowem o tym nie wspomniał, choć zdecydowane powinien.

Po drugie nawet jeśli choroby te są niezależne to przecież nie rozważamy tutaj prawdopodobieństwa zapadnięcia na te choroby przypadkowej osoby o której nic nie wiemy. Tu mamy konkretnego pacjenta z konkretnymi symptomami. Nie mamy więc do czynienia z prawdopodobieństwem zwykłym tylko warunkowym. Prawdopodobieństwo generalnie służy ocenie naszej niewiedzy na temat zajścia lub nie określonych zdarzeń. Informacja jaką uzyskujemy np. o zajściu zdarzeń takich jak symptomy chorobowe zmienia naszą wiedzę a tym samym prawdopodobieństwa jakie przypisujemy zdarzeniom. Pewne symptomy chorobowe są bardzo specyficzne i nie dają dużego pola do wątpliwości. Wystąpienie wspomnianego wyżej mięsaka Kaposiego dla lekarza jest jednoznaczną podstawą do zdiagnozowania końcowego stadium zakażenia wirusem HIV czyli AIDS. Objawy grypopodobne mogą również wynikać z infekcji takim wirusem ale mogą też być wynikiem grypy zatem takiej jednoznaczności jak w poprzednim przypadku nie ma. Symptomy nie wpłynęły tu na prawdopodobieństwo zakażenia HIV liczone względem całej populacji ale wpłynęły na naszą ocenę najprawdopodobniejszej diagnozy dla tego konkretnego przypadku. Ten element House w swej wypowiedzi zupełnie zignorował.

Jeśli nawet pójść na rękę House'owi i przyjąć, że zachorowalność na dwie choroby stanowiące jego domysł są zdarzeniami niezależnymi a prawdopodobieństwa warunkowe pod warunkiem wystąpienia zaobserwowanych objawów są proporcjonalne do tych, które wymienił House to i tak rozumowanie House'a będzie błędne i w opisany sposób prawdopodobieństwa warunkowego wystąpienia obu chorób na raz jako iloczynu odpowiednich prawdopodobieństw warunkowych uzyskać bez dodatkowych założeń nie można. Obrazują to poniższe przykłady.

Jeśli pewnego wieczoru w trakcie oglądania telewizji dostrzegę zakłócenia i tego samego dnia w moim mieście wystąpi pożar to zdarzenia te mogę oceniać jako niezależne i mogę mnożyć częstość zakłóceń przez częstość pożarów. Jeśli jednak uzyskam pewną wiedzę wyglądając za okno i dostrzegając burzę, to zdarzenia te przestają zachowywać się jak zdarzenia niezależne i iloczyn prawdopodobieństwa zakłóceń podczas burzy oraz prawdopodobieństwa pożaru (np. wywołanego wyładowaniami atmosferycznymi) podczas burzy nie da mi w wyniku prawdopodobieństwa jednoczesnych zakłóceń i pożaru podczas burzy.

Drugi przykład będzie bardziej matematyczny. Losujemy w sposób niezależny dwie liczby rzeczywiste z przedziału od 0 do 1. Rozkład prawdopodobieństwa w tym losowaniu niech będzie równomierny. Niech zdarzeniami A i B będą sytuacje, w których odpowiednio pierwsza i druga liczba jest mniejsza od 0,5. Niech zdarzeniem S będzie sytuacja, w której suma obu liczb jest większa od 1. Wtedy oczywiście

P(A ∩ B) = P(A) · P(B)

a jednocześnie

P(A|S) = P(A ∩ S) / P(S) = (1/8) / (1/2) = 1/4

P(B|S) = P(B ∩ S) / P(S) = (1/8) / (1/2) = 1/4

Dokładne liczby zresztą nie mają większego znaczenia. Ważne, że wartości te są niezerowe podczas gdy:

P(A ∩ B|S) = P(A ∩ B ∩ S) / P(S) = 0 / (1/2) = 0

Taka sytuacja oznaczałaby dla House'a totalną porażkę.

Pójdźmy jednak znów na rękę House'owi i przyjmijmy, że przy zaobserwowanych symptomach prawdopodobieństwo warunkowe wystąpienia obu podejrzewanych przez niego chorób jednocześnie jest rzeczywiście dziesięć razy większe niż prawdopodobieństwo warunkowe dla choroby, którą domniemywa jego rozmówca. Czy to wystarczy by przyjąć, że zaproponowane przez niego postępowanie jest dziesięć razy lepsze? Też nie do końca. Prawdopodobieństwa to nie wszystko. Niezbędna jest jeszcze ocena ryzyka podjęcia lub niepodjęcia określonych działań. Wróćmy do przytoczonego wcześniej przykładu. Jeśli występują objawy grypopodobne mogące wynikać z grypy lub zakażenia wirusem HIV to test na HIV zrobimy mimo tego, że grypa jest bardziej prawdopodobna. Decydujące w zakresie decyzji o takich działaniach jest ryzyko na jakie jesteśmy narażeni w przypadku zaniechania wykonania testu. Matematycy finansowi mają sytuację łatwiejszą ponieważ to czym ryzykują daje się wyrazić ilościowo. Lekarz musi podejmować ocenę trudniejszych do ilościowego uchwycenia czynników takich jak śmierć, kalectwo lub chroniczne bóle. W przywoływanym przypadku House zignorował lub w najlepszym przypadku przemilczał takie rozważania.

W matematycznych nieścisłościach serialowego bohatera nie byłoby w sumie nic strasznego gdyby nie to, że cytowany fragment stał się modelowym rozumowaniem w książce „House i filozofia – wszyscy kłamią”. Przykład ten ma ilustrować, że prostota stanowiąca kryterium wyboru hipotezy nie zawsze jest rzeczą oczywistą. Rzeczywiście nie jest, ale szkoda, że autorzy książki nie poświęcili choćby kilku zdań krytycznych temu właśnie cytatowi.

Komentarze

Popularne posty z tego bloga

House MD and Mathematics

In “Occam's Razor” episode Gregory House MD substantiating his view that the hypothesis explaining the observed symptoms with two diseases is simplier, than a hypothesis based on one but very rare disease, speaks the following statement:Each one of these conditions is about a thousand to one shot. That means that any two of them happening at the same time is a million to one shot. Chase says that cardiac infection is a 10 million to one shot, which makes my idea 10 times better than yours.This statement shows that Gregory House is able to multiply two numbers and compare the result with a third one, he also heard something about probability and would like very much to use mathematics, but in spite of his sincere desire he cannot. (Generally, all of this can be probably said about the screenwriter who wrote the above sentence.)First, House makes the assumption of independence of developing the two diseases, which are suspected in a patient. That does not have to be. For example, wi…

Paradoksy jednomandatowych ordynacji wyborczych

W ostatnich latach jednomandatowe wybory przedstawiane były jako dużo lepiej odzwierciedlające wolę wyborców. Czy tak jest w istocie?

Przyjrzyjmy się sytuacji na przykładzie autorstwa znakomitego popularyzatora matematyki pana doktora Krzysztofa Ciesielskiego. Przykład ten został zaprezentowany parę dekad temu na jego wykładzie na temat matematyki wyborczej. Teraz, po latach, dzięki jego uprzejmości prezentuję to zagadnienie tutaj.

Wyobraźmy sobie, że w pewnych wyborach startuje sześciu kandydatów, których oznaczymy imionami bohaterów ze Stumilowego Lasu. Mamy więc Puchatka (P), Tygryska (T), Kłapouchego (K), Sowę (S) i Maleństwo (M).

Głosuje 55 osób i tak się złożyło, że w tym malutkim społeczeństwie mamy 6 opcji preferencji wyborczych. Przedstawia je poniższa tabela.


14 osób11 osób10 osób9 osób6 osób5 osób1. wybórP T K S M P 2. wybór M K S M K S 3. wybór T S M K S M 4. wybór S M T T T T 5. wybór K P P P P K
Jak wybierzemy tę jedną?

Można użyć metody większości. Wygrywa w niej ten kto jest pierwszym wyborem dla najwi…