Overconfidence
za chwilę rozwiązecie test weidzy Russo i Schoemakera w adaptacji Tyszki
Instrukcja: Dla każdego z poniższych pytań proszę podać po 2 wartości DOLNĄ i GÓRNĄ takie, żeby Pan(i) miał(a) 90% pewności, że prawdziwa odpowiedź mieści się między tymi dwoma wartościami
Dolna Górna
Wiek Adama Mickiewicza w chwili śmierci
Długość rzeki Nil
Liczba krajów zrzeszonych w organizacji OPEC?
Lista ksiąg Starego Testamentu
Długość średnicy księżyca w kilometrach
Waga pustego Boeing 747 w kilogramach
Rok urodzenia Wolfganga Amadeusza Mozarta
Okres ciąży (w dniach) u słonia azjatyckiego
Odległość powietrzna z Londynu do Tokio
Najgłębszy (znany) punkt na oceanach w metrach
Oskamp (1962) badał psychologów klinicznych. Podawał informacje o pacjentach w 4 proporcjach:
-stan obecny
-lata szkolne
-służbę wojskowa
-dalsze życie
Po każdej fazie pytał o diagnozę. Trzeba było przewidywać prawdopodobieństwo nawrotu chotoby i powrotu do szpitala. Z każdą porcją danych diagności byli coraz bardziej pewni, ale ich diagnoza nie była pewna. Oni mogli powiedzieć o tym, po ilu latach wróci, mogli tym manipulować. Większość z nich podjęła pewną decyzję, przyjęła hipotezie, a kolejne dane służyły temu, żeby podbudować ją mocniesjzymi danymi, ale nie weryfikowali trafności hipotezy.
Slovic podobne badanie o znawcach wyścigów konnych. Historia taka sama - trzeba było przewidywać wyniki wyścigów - czy koń pobiegnie dobrze czy nie, przewidywać kolejność. Informacje o koniu były podzielone na porcje, były info o przodkach konia, historia życia itd. Efekt dokładnie taki sam jak wyżej - pewność rosła, trafność nie. Tak samo nietrafne decyzje, ale podbudowane większą liczbą danych.
Tyszka&Zielonka - analitycy finansowi. Byl program komputerowy - wyświetlał tło czerwone albo niebieskie losowo i do tego wyświetlał strzałkę w górę lub w dół losowo. Zadaniem osoby badanej było powiedzieć przed nacisnięciem guziczka, czy na następnym ekranie strzałka będzie w górę czy w dół i oszacowanie pewności swojej decyzji.
My wiemy, że pojawia się złudzenie kontroli, że nawet jak są rzeczy generowane losowo, to dostrzegamy w tym wzory - tutaj wzorów nie było na pewno.
Badane były 2 grupy ludzi - doświadczeni analitycy finansowi. Druga grupa - meteorolodzy. Okazało się, że obie te grupy się myliły, oczywistą rzeczą jest to, że nie sposób z żadną większą trafnością niż 0,5 zgadnąć, bo tylko tak można, bo jest losowo. Natomiast bardzo różnił się wzór odpowidzi jeśli chodzi o pewność - meteorolodzy to są ludzie, którzy bardzo wyraźnie widza skutki swoich przewidywań, weryfikują się dzień w dzień. Są w stanie zauważyć, że mylą się dość często. Uczą się, wiedzą, kiedy mogą być pewni albo nie mogą. W przypadku meteorologów ich pewność była zbliżona do trafności i się nie zmieniała. U analityków finansowych wynik był taki, że trafność była niezmieniona, a bardzo wyraźnie z każdym kolejnym rozdaniem oni widzieli coraz bardziej te wzory, kiedy co się pojawia, uczyli się iluzorycznych korelacji. Trafność zostawała taka sama, ale pewność wyraźnie rosła. Analitycy, w odróżnieniu od meteorologów nie uczyli się na błędach, a wręcz przeciwnie. Brną mimo 50% błędnych trafień.
Dobry ekspert ma trafność taką jak pewność- świadomy jest swojej trafności.
Skąd brać prawdopodobieństwa?
Częstości (gdy zdarzenie jest powtarzalne) - mianownik ważny
jednorodność bazy danych kobiety wypadki drogowe - faceci mają częściej wypadki samochodowe niż kobiety. Jeżeli weźmiemy jako mianownik nie ilość kierowców, ale o przejechane kilometry, godziny spędzone w samochodzie, to może się okazać, że współczynniki się skrajnie zbliżą. Tak samo wypadki motocyklowe - jak się popatrzy na przebieg - ile człowiek tym czymś przejeżdża - uwzględnił to, ze motocykliści jeżdżą mniej i rzadziej i się okazuje, że mają więcej wypadków. Czy to jest tak, że zależy to od płci i wieku, czy też rodzaju wehikułu czy też od częstości i długości podróżowania. W zależności od podstawy porównań wszystko się zmienia.
dysponowanie odpowiednio długą historią przebiegu danego zdarzenia - musi być długa; wiemy w końcu, ze zdarzają się regresje do średniej, trzeba mieć bazę, w której one się pojawiają; jeśli wnioskujemy z 2-3 lat to jesteśmy w błędzie. Kiedy wprowadzono w Warszawie prędkość do 50 km/h. Kiedyś można było jeździć zgodnie z tabliczkami, a teraz jest tak ogólnie. W pierwszym roku jak to wprowadzono był gwałtowny spadek liczby przypadek. Ludzie komentowali, że słusznie ograniczono prędkość. Co zrobili? Oni wzięli jeden rok obowiązywania tego przepisu i porównano do innego roku nieobowiązywania. A tego roku był specyficzny rok, bo była łagodna zima. W następnym roku natomiast liczba wypadków wzrosła chociaz niewiele, ale pojawiła się inna rzecz - przy wypadkach zaczęli więcej umierać pieszych. Bo oni przestali być tak ostrożni przy przekraczaniu, a kierowcy nie zmienili przyzwyczajeń. Innymi słowy, jak się wnioskuje o takich zmianach, to trzeba porównywać okresami kilkunastoletnimi, a nie pojedynczymi.
czy dotychczas historyczny trend będzie kontynuowany
Badanie: Eksperci migdałki - Russo, Schoemaker - dla laryngologów przygotowywano teczki pacjentów, chorych dzieci; po przeczytaniu historii choroby mieli zdecydować - na jednej kupce położyć jedne dzieci, którym trzeba wyciąć migdałki, a na drugiej te, którym nie ruszać. Wyszło, że 46% pacjentów powinno mieć wycięte migdałki. Co zrobili oni? Wzięli teczki dzieci odrzuconych i poprosił lekarzy wykonanie tego samego zadania podobnie. Współczynnik dzieci skierowanych na usunięcie migdałków wynosił 46%. Lekarze mieli przekonanie o prawdopodobieństwie tego, że należy wyciąć migdałków z prawdopodobieństwem ~50 i około tego wycinali.
Subiektywne oceny - odbiór wartości różnych jest zależy od kontekstu i sposobu podawania informacji; duże prawdopodobieństwo jest czym innym w różnych sytuacjach - dla totolotka 10%, dla czegoś innego np. 80%; (Yamagishi) śmiertelność raka: Ludzie dostali dwie historyjki; smiertelność została wyrażona w dwa sposoby:
1286 na 10 000
24,14 na 100
Jest logiczne, że 12 to połowa 24, więc należało by powiedzieć, że pierwsza wersja jest łagodniejsza niż druga, natomiast ludzie zareagowali na numeryczność liczb podawanych (1286 to więcej niż 24), w związku z tym:
Wyszło, że 12% to więcej niż 24%
Te efekty są automatycznie bezrefleksyjne itd. Na duże wartości liczbowe reaguje się silniej niż na mniejsze wartości liczbowe.
W przyszłości będzie prawdopodobnie tak, że ludzie będą dyskutować z lekarzami o tym, co chcą żeby im zrobić. Ostatnio ktoś pozwał lekarza, że zrobili mu coś, co mu się nie podoba. Bo lekarz zbyt trudno podaje informacje, wprowadza w błąd gmatwając sprawę. Nawet jeśli pacjent się zgodził w oparciu o dokument napisane w niezrozumiały język, to może pozwać. Będzie się superwizować lekarzy, którzy będą przekazywać probabilistyczne informacje pacjentom.
Można z łatwością w taki sposób manipulować zgodą/niezgodą pacjenta podając informacje inny sposób (było takie badanie o tym, że inaczej ludzie reagują, kiedy się mówi o 70% przeżywalności versus 30% śmiertelności)
(Friconomics - mnóstwo frapujących przyadków jak różnią się dane dotyczące tej samej sprawy w zależności od tego jak się je interpretuje)
Np. łatwiej jest w realnym świecie umrzeć od samochodu niż samolotu. Tak jest jak się patrzy na stosunek liczby zabitych pasażerów do wszystkich pasażerow. Mianownikiem tego ułamka pokazującego częstość jest coś innego. Jak się wstawi np. godziny podróży, to procent śmierci jest mocno porównywalna, ponieważ długość podróży samolotem jest krótsza. Każda ze statystyk daje inne wyniki.
Metody wydobywania p
Wcale nie brać - zamiast liczyć, to można mniej lub bardziej ścisłe drzewka decyzyjne zrobić, które nam pomogą zdecydować bez uwzględniania kwestii prawdopodobieństwa; oczywiśłcie lepiej, jeśli dane są jakieś jednak, ale jak już drzewka są zrobione, to wcale nie trzeba mieć żadnych numerków, żeby trafnie podejmować decyzje;
Słowne określenia - czy posługiwać się słownymi okresleniami prawdopodobieństwa, a jeśli już się posługujemy to co z tym dalej zrobić? Jest mnóstwo badań o tym, co ludzie myślą o prawdopodobieństwie i można wymyślić kilka sposobów, żeby pominąć problem komunikacji słownej ludzi, którzy są dobrzy z matematyki i słabi; jest inny problem, dotyczący szerszego zjawiska; jak się pojawi na dwutorowe modele funkcjonowania ludzi, to są takie klasyczne artykuły, w których przywołuje się anegdotę: otóż w latach 70tych odbywał się zjazd psychologów matematycznych - np. Tversy, Kahnemann, Slovik, itd. Święta wiara psychologów matematycznych w to, że wszystko można modelować. Ci statystycy dostali info o Lindzie - jakie prawdopodobieństwo, że Linda jest kimśtam jeśli cośtam. Okazało się, że ci ludzie, którzy byli matematykami odpowiadali w taki sposób, że gdzieśtam z umysłu to ja wiem, że podaję nieprawdziwą informacje, ale to jest hsitoryjka o osobowości. Mówili, że wiedza, że to złudzenie o koniunkcji, ale i tak tamta opcja im się bardziej podobała, bo to była sytuacja „życiowa” ← efekt framingu. Więc nie chodzi tylko o przetwarzanie numerków, ale o to, że pod te numerki możemy sobie coś podstawić, a to nam zupełnie rozwala cała historię. Należy zatem wymyślić takie pytania o prawdopodobieństwo, dzięki którym wydobędziemy z osób to, co naprawdę myślą - tak samo trzeba podawać ludziom w taki sposób, by zrozumieli, nie wszyscy wiedza, co to jest statystyka. Tak samo można sformułować komunikat np. w taki sposób, żeby ludzi odstraszyć albo żeby łagodzić, wszystko zależy od konstrukcji, kontekstu itd. Dla statystyka prawdopodobieństwo jest liniowe, a dla Kowalskiego nie.
Kolejnych przybliżeń
Koła prawdopodobieństwa
Równoważnych urn
Drzewa zdarzeń
<drzewko decyzyjne do klasyfikacji pacjentów na wysokie i niskie ryzyko (Breiman et al., 1993) przerysowane w zeszycie, do wstawienia>
W trakcie przechodzenia przez drzewko decyzyjne wykluczyło się wielu symulantów, nie używając żadnych medycznych tricków potężnych; im dalej tym bardziej specjalistyczna wiedza jest potrzebna, do zmierzenia tachykardii sinusoidalnej potrzebna jest pielęgniarka, pielęgniarka może zdecydować, czy pacjent idzie w związku z tym na OIOM czy nie. Personel musi być jakośtam wykwalifikowany, ale nie musi być diagnostą. Najlepsi diagności mają takie rzeczy zbudowane na własny użytek. To jest sytuacja, kiedy my podejmujemy decyzje posiadając taką procedurę i wcale nie musimy przetwarzać danych probabilistycznych - proste decyzje oparte na jakichś odgórnie ustalonych parametrach. Tak można diagnozować wszystko, łącznie z popsutym samochodem. Dlatego w karetkach jeżdża paramedycy, a nie lekarze - oni nie mają leczyć, tylko powiedzieć, czy osoba ma jechać do szpitala, czy nie, podjąć decyzje tylko, itd. Np. jak socjjopata nie był w więzieniu do 30 roku życia to już nie trafi.
Słowne określenia
Jak nietrudno zgadnąć - zawodne
Badania:
Teigen, Brun; To samo określenie, różna interpretacja - (some possibility) od 15% do 62%
Keeney, Winterfeldt - „małe szanse” 1% do 40%.
stwierdzenia „pewna możliwość” i „dosyć niepewne” oceniane dość zgodnie = ~35%, ale „pewna możliwość” dotyczy pozytywnych zdarzeń, czyli 35% i rób, - a „dość niepewny” negatywnych - 35% i nie rób,
czyli negatywne rekomendowały unikanie wyboru, pozytywne rekomendowały wybór
Metoda kolejnych przybliżeń
Keeney, Winterfeldt (1989)
Pytamy „negocjując” wartość
czy dużo to p=0,90?, jeżeli badany powie „znacznie mniej” mówimy 50%, aż do momentu, gdy badany powie „więcej”. Otrzymujemy pewien dowolnie wąski przedział oszacowań.
Koło prawdopodobieństwa/równoważnych urn
Ruletkowy wynalazek, lub urna z kulkami, w którym możliwe jest ustalenie proporcji kolorów pól zwycięskich i przegranych; takie koło fortuny, w którym jest więcej albo mniej zwycięskiego pola;
Działa przy większych wartościach p
Pokazuje rozłączność zdarzeń - jest ileś na jedną stronę, a ileś na drugą stronę.
Można po prostu ludziom pokazywać takie koło fortuny, jak człowiek zrozumie ideę, że to są jakieś podstawowe proporcje w populacji, to jest duza szansa, że podstawową wersję zależności częstotliwości występowania zrozumie;
Reprezentacja graficzna pozwala się dogadać, bo jest dość zrozumiała dla większości ludzi
<rysunek koło prawdopodobieństwa w zeszycie>
Drzewa zdarzeń
-Jak określić prawdopodobieństwo „nagród Darwina”? Czyli zdarzeń powstających w wyniku zbiegów okoliczności. Do katastrofy prowadzi długie drzewo różnych zbiegów okoliczności. Wiele było odnóg, które były bezpieczne, a odnogi niebezpieczne to jakaś maleńka część każdego wyboru. Prawdopodobieństwo katastrofy jest maleńskie i tak należy je traktować. Prawdopodobieństwo katastrofy w elektrowni jądrowej jest mikrobowe. Jakby patrzeć na to na aktualnych elektrowniach jądrowych, to prawdopodobieństwo jest wyższe, bo z 10 były katastrofy w dwóch = 20%
Przykładowe drzewko wydarzenia się katastroficznej awarii - konfiguracja rzeczy rzadkich prowadzi do katastrofy