Drżące słupki

Poprzedni numer Polityki (11/2011) zawiera bardzo dobry i bardzo potrzebny artykuł Michała Jasieńskiego Co widać ze słupka? na temat sondaży oraz tego, w jaki sposób ich wyniki powinny być komunikowane i interpretowane. Publikacja artykułu zbiegła się w czasie (mniej więcej) z publikacją raportu Ocena metodologii i rezultatów badań poprzedzających pierwszą i drugą turę wyborów prezydenckich w 2010 roku przygotowanym przez zespół pod kierunkiem prof. Henryka Domańskiego na zamówienie OFBOR. Raport jest dostępny na stronach OFBOR tu.

Główne przesłanie tekstu Michała Jasieńskiego można by zamknąć w sformułowaniu: „pamiętaj o błędzie”. Mowa tu o błędzie losowym, którym obarczone są wyniki każdego sondażu, do którego respondenci dobierani są w sposób losowy, w tym sondaży preferencji politycznych. O tym, kto powinien pamiętać o błędzie za moment.

Z kolei dla OFBOR głównym pretekstem do zamówienia raportu była

(…) wyjątkowo intensywna krytyka  jakości sondaży prowadzonych przed wyborami prezydenckimi, które odbyły się 21 czerwca i 5 lipca 2010. (…) Kontrowersje wzbudziła trafność prognoz wyborczych formułowanych na podstawie tych badań – w stosunku do faktycznego wyniku – i rozbieżności między poszczególnymi firmami.

Zanim odniosę się do kilku konkretnych wątków z artykułu i raportu krótkie przypomnienie co to jest błąd losowy i skąd się bierze.

Wyniki każdego sondażu obarczone są błędem związanym z losowym doborem osób do badania. Wynik każdej partii, lub kandydata, w takim sondażu nie jest pewny, tak jak pewne jest to, że na szczyt Empire State Building wiedzie 1860 stopni. Wręcz przeciwnie, wynik ten jest tak samo niepewny jak to, że rzucając rzetelną monetą 1000 razy wyrzucimy dokładnie 500 razy orła i 500 reszkę. Za każdym razem, gdybyśmy powtórzyli eksperyment 1000-ca rzutów wynik może być trochę inny. Raz 495:505, innym razem 513:487 itd. Jeżeli otrzymamy jednak np. 211 orłów i 789 reszek to zdrowy rozsądek sugeruje nam wątpić w rzetelność monety: taka dysproporcja orłów i reszek jest mało prawdopodobna przy założeniu, że pojedynczy rzut monetą z równym prawdopodobieństwem daje orła co reszkę.

Z wynikami partii w sondażach jest podobnie. Pokazać to można za pomocą następującego eksperymentu myślowego (gwoli ścisłości, myśl będzie wspomagana przez komputer). Wyobraźmy sobie, że mamy cztery partie A, B, C i D cieszą się następującym poparciem wśród Polaków: A=31%, B=27%, C=16% i D=7.5%. Niestety nie są to wielkości publicznie znane więc stacja TV zleca agencji badawczej przeprowadzenie sondażu aby je poznać. Agencja badawcza losuje 1000 osób i wszystkim zadaje pytanie „na którą z tych czterech partii zagłosowałaby Pan(i), gdyby wybory odbyły się dzisiaj?”. Informacje spływają od ankieterów i agencja dostarcza stacji TV wynik. Głosowanie na partię A deklaruje 28.9% ankietowanych, na partię B 29.1%, C 15.3%, a na partię D 7.4%. Pozostałe odpowiedzi to 19.3%. Na ile taki wynik jest (nie)prawdopodobny?

Poniższy filmik ilustruje potencjalne zróżnicowanie wyników sondaży zakładające, że prawdziwe poparcie dla partii rozkłada się A=31%, B=27%, C=16% i D=7.5%. Każda klatka w tym filmiku to wyniki jednego z 500 symulowanych sondaży. Drżące słupki po prawej to poparcie poszczególnych partii. Poziome kreski wokół każdego słupka pokazują minimalny i maksymalny wynik danej partii. Dwa wykresy po lewej stronie porównują wyniki dwóch partii A i B. Górny pokazuje wielkość różnicy w poparciu A – B (oś pozioma): jeżeli dodatnia, to więcej respondentów deklarowało poparcie dla A. Wysokość słupków (oś pionowa) pokazuje na ile prawdopodobne jest wylosowanie sondażu z daną wielkością różnicy poparcia A-B. Przykładowo wysokość słupka nad 4 to liczba sondaży, w których parta A miała przewagę 4 punktów procentowych nad partią B. Drżący poziomy słupek poniżej (wykres w prawym dolnym rogu) pokazuje różnicę A-B w danym sondażu (klatce filmu).

Obserwacje

  1. Znaczący rozrzut wyników poszczególnych partii (patrz lewy wykres, końcowe klatki filmu).
  2. Porównując poparcie dla partii A i B całkiem prawdopodobne jest, że wg sondażu różnica będzie pomiędzy 2 a 6 punktów procentowych, mimo że rzeczywista różnica to 4 punkty na korzyść A.
  3. Jest możliwe, choć mało prawdopodobne, że sondaż pokaże, sprzecznie z rzeczywistością,  że to partia B ma przewagę nad A. Wg eksperymentu 3 sondaże na 100 pokażą przewagę B nad A.

Co z tego wynika:

  1. Interpretując wyniki sondaży wyborczych należy domagac sie informacji o wielkosci proby i rozmiarze bledu
  2. Przewaznie nie warto ekscytowac sie roznicami 1-2 punktu procentowego. nie mowiac o mniejszych,
  3. Informacja o bledzie powinna być pokazywana wraz ze słupkami. Na przykład za pomocą poziomych linii tak, jak na lewym wykresie w filmiku.

Wątki poboczne:

  1. Eksperyment zakładał, że wszystkie 1000 osób zrekrutowanych do badania chętnie i szczerze deklaruje swoje poglądy. Rzeczywistość jest daleka od tego ideału tak pod względem chęci badanych do brania udziału w sondażach, jak również i szczerości przy udzielaniu odpowiedzi.
  2. Szczególnie problem związany z odmowami wzięcia udziału w badaniu (jak również i innymi powodami nierealizowania badania) ma istotny wpływ na precyzję wyników. Osoby, które odmówiły udziału, bądź których nie przebadano z innych przyczyn, przeważnie mają trochę inne poglądy od tych, które przebadano. Trywialny przykład tego zjawiska to trudność w zastaniu w domu osób, które pracują. Z kolei poglądy polityczne inaczej rozkładają się wśród osób pracujących niż, dajmy na to, wśród emerytów. Jeżeli nie kontrolujemy tego typu efektów, to o precyzyjnych wynikach  sondaży możemy zapomnieć.
  3. Jako że wyniki sondaży obarczone są dodatkowym błędem systematycznym (opisanym powyżej) należy jeszcze bardziej chłodno podchodzić wobec prezentowanych wyników. Tym bardziej, że rozmiar tego błędu jest bardzo trudno oszacować, a poziom realizacji badań sondażowych w Polsce nieprzerwanie spada.
  4. Wątek związany z poziomem realizacji badań nie pojawił się w artykule w Polityce, co jest zrozumiałe ze względu na jego raczej ogólny charakter. Dziwi mnie jednak, że wątek ten nie został dokładnie zbadany w raporcie OFBOR. Być może to właśnie ukryte błędy systematyczne był powodem tak dużych rozbieżności pomiędzy poszczególnymi sondażami przed ostatnimi wyborami prezydenckimi.

Kto powinien pamiętać o błędzie? Omawiana tu sprawa dotyczy trzech typów aktorów społecznych połączonych swoistym łańcuchem pokarmowym: (1) firm badawczych przeprowadzających sondaże, (2) mediów, które te sondaże zamawiają i ich wyniki komunikują społeczeństwu, wreszcie (3) społeczeństwu, które wyniki sondaży prezentowane w mediach przyswaja, interpretuje oraz, w jakiejś za pewne niewielkiej części, na podstawie sondaży podejmuje decyzje wyborcze. Pamiętać o błędzie powinny wszystkie trzy grupy

  1. Firmy badawcze, bo wielkość błędu to najważniejszy wskaźnik jakości wytwarzanego przez nich produktu (sondaży).
  2. Media, bo wielkość błędu to najważniejszy wskaźnik jakości kupowanego przez nich produktu. Elementarna ekonomia uczy nas, że jakość dostarczanego produktu będzie spadać, jeżeli klient tej jakości nie będzie się domagać.
  3. Publiczność, czyli my wszyscy. Po pierwsze, nie dajmy się zwodzić małymi różnicami w wynikach sondażowych poszczególnych partii. Po drugie, wymagajmy od mediów aby zamawiały sondaże wyższej jakości i rzetelnie informowały o ich dokładności. Po trzecie, bierzmy udział w badaniach wyborczych i udzielajmy prawdziwych odpowiedzi, to jest w naszym własnym interesie.

Ciekawe pytanie, które się nasuwa, to kto w tym „łańcuchu pokarmowym” dysponuje największą władzą? Ale to już może temat na inny post…

Ten wpis został opublikowany w kategorii ogólne i oznaczony tagami , , , . Dodaj zakładkę do bezpośredniego odnośnika.

Jedna odpowiedź na „Drżące słupki

  1. Janusz Pilewski pisze:

    Technikalia robienia sondaży są godne uwagi jak i dochowywania staranności, ale zdumiewa to, że kompletnie nie są widoczne w publicznej przestrzeni inne palące problemy, jakie przynosi ankietyzacja. Chodzi o degradację demokracji, do czego grubsza rzecz biorąc przyczynia się ;
    1. nieświadome lub intencjonalne mylenie interesu wspólnego z opinią mas, które to masy nie odnoszą się do żadnego systemu wartości, wydawany przez nie werdykt nie ma związku z posługiwaniem się intelektem, a ich roszczenia są nieograniczone. To ma swoje dramatyczne konsekwencje dla systemu sprawowania władzy przez kogokolwiek, na opis których tu brak miejsca.
    2. Kłopot także jest z manipulacją wynikającą z identyfikowania społecznego, politycznego znaczenia dawnego VoX Populi, z tym co przynoszą robione z godziny na godzinę, często niechlujne lub wprost zmanipulowane ankiety. Nie są to zjawiska takie same a ze szkodą dla interesów wspólnotowych praktycznie przypisuje się im identyczną rangę, co jest nadużyciem, manipulacją.
    3. Występuje wskutek tego przeciw interesom wspólnoty automatyczna konsekwencja ankietyzacji zycia , czym jest deprecjonowanie, lub całkowity zanik znaczenia opinii autorytetu w przestrzeni publicznej. Autorytet potrafi odwoływać się do systemów wartosci i w przeciwieństwie do opinii wyrażanej masowo „potrafi” odwoływać się do intelektu.
    4. Z powodu braku intelektualnej zdolności mas do analizowania rzeczywistości, opisywane nadużycie gdy dotyczy działania władzy, niesie za sobą konkretne zagrożenia rozwojowe.
    4. szkodom powodowanym przez ankietyzację życia publicznego, sprzyja także mechanizm akjomatycznej niepodważalności opinii masowej wyrażonej w danej chwili, gdyż w następnej chwili może być ta opinia inną i nie ma sposobu aby to uwairygodnić wstecznie, czy zakwestionować – a skutki każdej publikacji takich wyników badań są przewaznie natychmiastowe.
    Itd. itp ………
    A to że na salony władzy nie wiadomo kto od kuchni włazi i poza kontrolą publiczną decyduje o sprawach dotyczących całej wspólnoty, a instytucje powołane do realizowania zasad demokracji zmieniają się w fasadowe, to coż…… jaki poziom kapitału społecznego taka kontrola i ochrona interesów wspólnototowych …… . Te bigos oczywiści instytucja ankietyzacji nie smaży sama a w tandemie z agencjami wizerunku, które czy opanowały media, lub tworzą z nim godną podziwu synegię nie portafie powiedzieć.
    To właśnie to nas dorżnie, a nie to że ankieterskie firmy są niedouczone, nieudolne. Jest przeciwnie, jak się douczą, to przy obecnym stanie prawnym, bez sensownego uregulowania tej działalności wykorzystująca przestrzeń publiczną nie wiem czy zostaną choćby pozory demokracji.
    Przepraszam, ale może jak bym był socjologiem, to bym potrafił to opisać jaśniej.
    Pozdrawiam

Dodaj komentarz

Twój adres e-mail nie zostanie opublikowany. Pola, których wypełnienie jest wymagane, są oznaczone symbolem *

Możesz użyć następujących tagów oraz atrybutów HTML-a: <a href="" title=""> <abbr title=""> <acronym title=""> <b> <blockquote cite=""> <cite> <code> <del datetime=""> <em> <i> <q cite=""> <s> <strike> <strong>