Parę lat temu Internet obiegł bardzo popularny wykres, który wyraźnie pokazuje zależność pomiędzy wzrostem liczby osób, u których zdiagnozowano autyzm oraz wzrostem sprzedaży żywności ekologicznej. Korelacja jest bardzo wysoka, pokazuje zależność niemalże idealną.
Zapraszam na tekst gościnny Krystyny Piątkowskiej z bloga Statystyczny.pl
Pojawiły się głosy, że warto
karmić dzieci fast foodem, żeby uniknąć problemów zdrowotnych. Inni
zastanawiają się nad prozdrowotnym działaniem pestycydów. Jak to możliwe, że
zwiększenie sprzedaży (a co z tym związane i spożycia) żywności ekologicznej
powoduje wzrost autyzmu? Żeby sobie to wyjaśnić, musimy zrozumieć trochę lepiej
statystykę.
karmić dzieci fast foodem, żeby uniknąć problemów zdrowotnych. Inni
zastanawiają się nad prozdrowotnym działaniem pestycydów. Jak to możliwe, że
zwiększenie sprzedaży (a co z tym związane i spożycia) żywności ekologicznej
powoduje wzrost autyzmu? Żeby sobie to wyjaśnić, musimy zrozumieć trochę lepiej
statystykę.
Zacznijmy od tego, czym jest
korelacja. Korelacja to inaczej współzależność, która występuje pomiędzy dwoma
zjawiskami. W statystyce poziom zależności liniowej między dwoma zmiennymi
losowymi mierzy się za pomocą współczynnika korelacji liniowej Pearsona (na
powyższym wykresie r=0.9971 to właśnie wartość tego współczynnika). Wartość
współczynnika korelacji liniowej Pearsona zawsze mieści się w przedziale od -1
do 1. Jeśli współczynnik wynosi zero (r=0), to mamy do czynienia z brakiem
korelacji liniowej pomiędzy dwoma cechami. Jeśli wynik jest dodatni (r>0),
mamy do czynienia z korelacją dodatnią. W takiej sytuacji wraz ze wzrostem
wartości jednej cechy można spodziewać się wzrostu wartości drugiej cechy. W
przypadku ujemnych wartości współczynnika (r<0), mówimy o korelacji ujemnej.
Czyli dla wyższych wartości jednej cechy można spodziewać się spadku wartości
drugiej cechy.
korelacja. Korelacja to inaczej współzależność, która występuje pomiędzy dwoma
zjawiskami. W statystyce poziom zależności liniowej między dwoma zmiennymi
losowymi mierzy się za pomocą współczynnika korelacji liniowej Pearsona (na
powyższym wykresie r=0.9971 to właśnie wartość tego współczynnika). Wartość
współczynnika korelacji liniowej Pearsona zawsze mieści się w przedziale od -1
do 1. Jeśli współczynnik wynosi zero (r=0), to mamy do czynienia z brakiem
korelacji liniowej pomiędzy dwoma cechami. Jeśli wynik jest dodatni (r>0),
mamy do czynienia z korelacją dodatnią. W takiej sytuacji wraz ze wzrostem
wartości jednej cechy można spodziewać się wzrostu wartości drugiej cechy. W
przypadku ujemnych wartości współczynnika (r<0), mówimy o korelacji ujemnej.
Czyli dla wyższych wartości jednej cechy można spodziewać się spadku wartości
drugiej cechy.
Kiedy wartość bezwzględna współczynnika
korelacji przyjmuje wartości powyżej 0,9, to mamy do czynienia z bardzo silną
zależnością. Czyli co? Wraz ze wzrostem sprzedaży żywności ekologicznej możemy
się spodziewać wzrostu liczby dzieci ze zdiagnozowanym autyzmem? Również wysoka korelacja występuje
pomiędzy zdiagnozowanymi przypadkami autyzmu w USA a odsetkiem Amerykanów
używających Internetu, długiem
publicznym USA i współczynnikiem małżeństw w USA (w ostatnim przypadku ujemna). Dane dotyczące powyższych
wykresów pochodzą z lat 2000-2012. Współczynniki korelacji Pearsona wynoszą
odpowiednio: r=0,91 (dla Internetu),
r=0,97 (dla długu publicznego) oraz r=-0,98 (dla współczynnika małżeństw).
korelacji przyjmuje wartości powyżej 0,9, to mamy do czynienia z bardzo silną
zależnością. Czyli co? Wraz ze wzrostem sprzedaży żywności ekologicznej możemy
się spodziewać wzrostu liczby dzieci ze zdiagnozowanym autyzmem? Również wysoka korelacja występuje
pomiędzy zdiagnozowanymi przypadkami autyzmu w USA a odsetkiem Amerykanów
używających Internetu, długiem
publicznym USA i współczynnikiem małżeństw w USA (w ostatnim przypadku ujemna). Dane dotyczące powyższych
wykresów pochodzą z lat 2000-2012. Współczynniki korelacji Pearsona wynoszą
odpowiednio: r=0,91 (dla Internetu),
r=0,97 (dla długu publicznego) oraz r=-0,98 (dla współczynnika małżeństw).
Jak to rozumieć? Z roku na rok
rośnie sprzedaż produktów ekologicznych. Z roku na rok rośnie liczba osób,
które mają dostęp do Internetu. Z roku na rok zwiększa się dług publiczny USA.
W kolejnych latach coraz mniej osób zawiera związki małżeńskie. I z roku na rok
rośnie liczba zdiagnozowanych przypadków autyzmu. Tak – między rosnącą liczbą
autystycznych dzieci i pozostałymi cechami istnieje wysoka korelacja. I z dużym
prawdopodobieństwem możemy się spodziewać, że nadal obserwując wzrost sprzedaży
produktów ekologicznych, będziemy również obserwować wzrost liczby diagnoz autyzmu.
Ale jeśli zakażemy sprzedaży takich produktów, to ten wzrost liczby przypadków autyzmu nie będzie zatrzymany. Jeśli zmniejszymy dług publiczny, zablokujemy dostęp do
Internetu, zmniejszymy dług publiczny – to wszystko wcale nie musi wpłynąć na
liczbę zdiagnozowanych przypadków autyzmu.
rośnie sprzedaż produktów ekologicznych. Z roku na rok rośnie liczba osób,
które mają dostęp do Internetu. Z roku na rok zwiększa się dług publiczny USA.
W kolejnych latach coraz mniej osób zawiera związki małżeńskie. I z roku na rok
rośnie liczba zdiagnozowanych przypadków autyzmu. Tak – między rosnącą liczbą
autystycznych dzieci i pozostałymi cechami istnieje wysoka korelacja. I z dużym
prawdopodobieństwem możemy się spodziewać, że nadal obserwując wzrost sprzedaży
produktów ekologicznych, będziemy również obserwować wzrost liczby diagnoz autyzmu.
Ale jeśli zakażemy sprzedaży takich produktów, to ten wzrost liczby przypadków autyzmu nie będzie zatrzymany. Jeśli zmniejszymy dług publiczny, zablokujemy dostęp do
Internetu, zmniejszymy dług publiczny – to wszystko wcale nie musi wpłynąć na
liczbę zdiagnozowanych przypadków autyzmu.
Dlaczego tak to działa? Bo cały
czas mamy do czynienia z korelacją, a nie związkiem przyczynowo-skutkowym. Są
jakieś powody, przez które rośnie liczba autystycznych dzieci. Są też przyczyny,
które powodują wzrost liczby użytkowników Internetu, większą sprzedaż produktów
ekologicznych, wzrost długu publicznego i spadek liczby zawieranych małżeństw.
Te przyczyny wcale nie muszą być ze sobą powiązane. I póki tylko obserwujemy
rzeczywistość, to nie możemy powiedzieć, że na siebie nawzajem wpływają. Żeby
powiedzieć, że zmiana jednej cechy ma wpływ na drugą cechę, to trzeba
przeprowadzić eksperyment (przy zachowaniu niezmiennego całego otoczenia).
czas mamy do czynienia z korelacją, a nie związkiem przyczynowo-skutkowym. Są
jakieś powody, przez które rośnie liczba autystycznych dzieci. Są też przyczyny,
które powodują wzrost liczby użytkowników Internetu, większą sprzedaż produktów
ekologicznych, wzrost długu publicznego i spadek liczby zawieranych małżeństw.
Te przyczyny wcale nie muszą być ze sobą powiązane. I póki tylko obserwujemy
rzeczywistość, to nie możemy powiedzieć, że na siebie nawzajem wpływają. Żeby
powiedzieć, że zmiana jednej cechy ma wpływ na drugą cechę, to trzeba
przeprowadzić eksperyment (przy zachowaniu niezmiennego całego otoczenia).
Takie eksperymenty bardzo często
prowadzone są w medycynie. Mamy grupę badawczą i grupę kontrolną. Jedna grupa
dostaje np. określone lekarstwo, druga grupa dostaje placebo. Potem porównuje
się różnice, bada się statystyczną istotność, sprawdza parametry krwi czy
wyniki badań obrazowych i dopiero wtedy można powiedzieć, czy dane dawkowanie
leku wpływa na zdrowie pacjentów. Dopiero wtedy można powiedzieć, czy zwiększenie
dawki spowodowało zmniejszenie infekcji. Tu już nie mówimy tylko o korelacji,
ale o związku przyczynowo-skutkowym. I takie właśnie badania eksperymentalne
powinny być przeprowadzone wszędzie, gdzie chcemy mówić o wpływie jednej cechy
na drugą. Jeśli więc ktoś będzie próbował Was przekonać, że żywność ekologiczna
jest złem, bo powoduje autyzm, to powtórzcie mu znane angielskie powiedzenie:
„Correlation does not imply causation” (korelacja nie implikuje
przyczynowości) i uśmiechnijcie się sami do siebie. Już więcej nikt Was nie
nabierze na sztuczkę korelacji.
prowadzone są w medycynie. Mamy grupę badawczą i grupę kontrolną. Jedna grupa
dostaje np. określone lekarstwo, druga grupa dostaje placebo. Potem porównuje
się różnice, bada się statystyczną istotność, sprawdza parametry krwi czy
wyniki badań obrazowych i dopiero wtedy można powiedzieć, czy dane dawkowanie
leku wpływa na zdrowie pacjentów. Dopiero wtedy można powiedzieć, czy zwiększenie
dawki spowodowało zmniejszenie infekcji. Tu już nie mówimy tylko o korelacji,
ale o związku przyczynowo-skutkowym. I takie właśnie badania eksperymentalne
powinny być przeprowadzone wszędzie, gdzie chcemy mówić o wpływie jednej cechy
na drugą. Jeśli więc ktoś będzie próbował Was przekonać, że żywność ekologiczna
jest złem, bo powoduje autyzm, to powtórzcie mu znane angielskie powiedzenie:
„Correlation does not imply causation” (korelacja nie implikuje
przyczynowości) i uśmiechnijcie się sami do siebie. Już więcej nikt Was nie
nabierze na sztuczkę korelacji.
Krystyna Piątkowska, autorka bloga Statystyczny.pl
Ta ciekawostka jak i sam temat statystyki są mi dobrze znane, ale bardzo cieszę się, że poruszyłeś ten temat. Co prawda, nieczęsto zdarza się żeby ktoś próbował przekonać mnie, że żywność ekologiczna jest złem, bo powoduje autyzm, ale obecna moda na wyciąganie statystyk z dupy i stosowanie ich bez elementarnego zrozumienia tematu tylko po to, by podeprzeć czymś swoją (najczesciej
*(najczęściej kompletnie nienaukową) teorię to już prawdziwa plaga!
A jednak na podstawie korelacji miażdżyca-cholesterol świat naukowy z rozkoszą widział przyczynowość: cholesterol=miażdżyca.
Nie tylko na podstawie korelacji, ale tez eksperymentów pokazujących np., że leki "na cholesterol" zmniejszają umieralności z powodu powikłań miażdżycy, spowalniaja rozwoj płytki miażdżycowej. Do tego dochodzą badania pokazujące, że ludzie z defektem metabolizmu cholesterolu (rodzinną hipercholesterolrlemoą) umierają przedwcześnie na powikłania miażdżycy właśnie. I wiele wiele innych. To nie jest tylko i wyłącznie prosta korelacja.
No bo robiono też i eksperymenty , takie jak wyżej opisane.
Rzeczywistość jest bardziej skomplikowana niż sie wydawało w tej dziedzinie, ale podstawowe powiązanie nadmiaru NIEKTÓRYCH frakcji cholesterolu WE KRWI (nie w jedzeniu – i to tu tkwił błąd) z miażdżycą wszak dalej jest uważane za prawdziwe.
Możliwe, że wszystkim ułatwiłoby traktowanie korelacji jako miary zmienności. Dwie zmienne korelują ze sobą w sposób dodatni lub ujemny jeśli zmianie jednej zmiennej równocześnie towarzyszy zmiana drugiej zmiennej. Wtedy łatwiej powstrzymać się przed automatycznym "podejrzewaniem" ich zależności. Dlatego zwrot z artykułu: "Korelacja to inaczej współzależność, która występuje pomiędzy dwoma zjawiskami." wydaje się mimo intencji sugerować zależność (związek, wzajemny wpływ). Korelacja pokazuje zaś aż lecz i tylko, że między zmianami wartości analizowanych zmiennych występuje jakiś rodzaj "równoczesności". "Winić" można określenie korelacji jako współzależności choć bliżej jej do równoległości, która nie sugeruje związku/zależności między zmiennymi.
Przyznam, że nie wiedziałam o czymś takim jak korelacja ! Lubię do Ciebie zaglądać bo zawsze przeczytam coś wartościowego i nauczę się czegoś nowego 🙂
W dzisiejszych czasach post prawdy powyższe zjawisko jest dość powszechne. W literaturze jest też dość dobrze opisane. Polecam hasła regresja pozorna, korelacja pozorna czy w języku angielskim Spurious relationship. Eksperyment jako metoda badawcza jest niestety dość drogi dlatego jest tak rzadko używany.
o mój sklep z kosmetykami (: Gdzie ja Was spotykam 😀
Jedni mówią tak, drudzy inaczej.
Szczerze mówiąc, o tym temacie niewiele wcześniej słyszałam.
„Pojawiły się głosy, że warto karmić dzieci fast foodem, żeby uniknąć problemów zdrowotnych. Inni zastanawiają się nad prozdrowotnym działaniem pestycydów.”
‚Jeśli więc ktoś będzie próbował Was przekonać, że żywność ekologiczna jest złem, bo powoduje autyzm, to powtórzcie mu znane angielskie powiedzenie: „Correlation does not imply caustation”’
Niestety nie odrobiliście lekcji – nie poświęciliście dość uwagi na sprawdzenie genezy tej grafiki, w przeciwnym razie wiedzielibyście, że grafika ta jest żartem i wyśmiewa interpretowanie korelacji jako związku przyczynowo-skutkowego.
USA podzieliły się na dwa fronty, na tych którzy akceptują i rozumieją naukę, oraz na tych którzy sprzeciwiają się GMO, szczepionkom i promują drogą, nie zawsze korzystną dla zdrowia i środowiska żywność "organiczną".
Organic w USA jest terminem czysto marketingowym oraz gałęzią przemysłu, a wymagania które należy spełnić aby sprzedawać żywność jako organiczną nie gwarantują, że produkty te będą ekologiczne tj. korzystne dla zdrowia i środowiska (sustainable). Przykładowo mniej szkodliwe pestycydy syntetyczne zastępowane są bardziej szkodliwymi pestycydami pochodzenia naturalnego.
Środowisko to ma swoich popularyzatorów i bożków pokroju Zięby. Promują oni szkodliwe mity, takie jak to że szczepionki powodują autyzm (Andrew Wakefield to dla nich męczennik), a jakiś czas temu zaczęli twierdzić, że GMO również jest odpowiedzialne za "epidemię autyzmu", swoje teorie w całości opierając na wykresach pokazujących korelację pomiędzy spożyciem GMO a diagnozami autyzmu.
Pewien użytkownik Reddita postanowił ich wyśmiać, tworząc taki sam wykres, ale pokazujący korelację pomiędzy autyzmem, a spożyciem żywności organicznej…
https://www.reddit.com/…/rskeptic_i_was_practicing…/
Nie, żywność organiczna prawdopodobnie nie powoduje autyzmu, ale niesie ze sobą inne zagrożenia, jak chociażby wyższa zachorowalność z powodu wielu bakterii i grzybów, z którymi producenci żywności organicznej nie mają jak walczyć. Odchodzi się nawet od tak podstawowego procesu przetwórstwa żywności jak pasteryzacja – epidemie po spożyciu organicznego, niepasteryzowanego mleka są w USA coraz częstsze.
Po prostu nie dało się wybrać gorszego przykładu na zilustrowanie różnicy pomiędzy korelacją, a przyczynowością. Nie dało się.
Yyyy, ale właśnie taką wymowę ma ten artykuł: zwraca uwagę na to, że korelacja =/= związek przyczynowo-skutkowy…
Przeczytaj drugą połowę artykułu, bo jest o tym samym co piszesz.
@Łukasz, Kuba: ja nie polemizuję z ogólnym przesłaniem artykułu i rozumiem na co ma zwrócić uwagę. Chodzi o to, że artykuł stawia w złym świetle autora wykresu i sugeruje, że chciał nas on tym wykresem oszukać. W rzeczywistości jest odwrotnie. Wiem, że można się tu powoływać na prawo Poego, ale po sprawdzeniu okoliczności powstania wykresu wszystko stałoby się jasne. 🙂
Hm, dziwne, bo ja doskonale wiem, jaki był zamysł autora i nadal nie widzę forsowania idei przeciwnej w tym tekście. 🙂
Ale ja nic takiego nie sugerowałem… Nie mówię, że tekst forsuje ideę przeciwną, tylko że stawia w złym świetle autora wykresu. Ty doskonale wiesz jaki był zamysł autora wykresu, ale nie każdy Twój czytelnik też o tym wie.
Jeszcze raz: "Jeśli więc ktoś będzie próbował Was przekonać, że żywność ekologiczna jest złem, bo powoduje autyzm" – autor wykresu nie próbuje nikogo przekonać, że żywność ekologiczna powoduje autyzm.
W artykule brakło chyba zwrócenia uwagi na efekt tzw. samo-spełniającej się przepowiedni.
Przykładowo, większy dostęp do internetu faktycznie może być skorelowany ze wzrostem zdiagnozowanych przypadków autyzmu, bo po prostu więcej ludzi ma dostęp do informacji i leci z dzieckiem do lekarza.
To samo z żywnością 'ekologiczną', po prostu ludzie zwracają coraz większą uwagę na zdrowie.
Czyli korelacja nie jest przypadkowa, natomiast nie oznacza ona, iż B->C, tylko A->B i A->C.
Ale ogólnie zgadzam się, że wyciąganie bzdurnych wniosków z wykresów wzmacnia w społeczeństwie sens powiedzenia 'kłamstewka, kłamstwa, statystyka'.
Statystyka ma bardzo zły PR, bo przez profanów (dziennikarze, politycy itp) jest źle stosowana, a przez ludzi źle rozumiana (np. osławiona średnia dochodów).
A to słuszna uwaga, dzięki!
Mało kto natomiast wie, że naukowcy badają aktualnie hipotezę, że autyzm jest wywołany przez mikroflorę jelitową, a dokładniej jej dysfunkcję. Jest to bardzo obiecujący temat badań naukowych, a ponieważ jednym z głównych czynników wpływającym na nasz mikrobiom jest dieta, bardzo możliwe, że w najbliższych latach naukowcy dojdą do konsensusu, że za autyzm odpowiada min. dieta.
Myślę, że o tym jest dosyć głośno, ale trzeba jednoznacznych wyników. No i niezależnie od tego udowodniono już bardzo silne czynniki genetyczne predysponujące.
Są może jakieś badania na temat wielkości spożycia żywności organicznej, przez matki dzieci z autyzmem?
http://www.tylervigen.com/spurious-correlations
Osobiscie wybralabym lepszy przyklad: posprzeczalam sie z kolezanka ze mammografia nie powoduje raka. Chociaz i to jest slabe w porownaniu do kwiatkow jakie znalazlam piszac prace licencjacka na elektroradiologii. Przy okazji czepiania sie szczegolow- nie zawsze interpretacja statystyki jest problemem. Osobiscie zwracam tez uwage na uzytecznosc publikowanych artykulow i tak przyczepilam sie do artykulu opublikowanego w naukowym czasopismie elektrotechnicznym – otoz napisano program analizujacy przy pomocy transformaty fouriera "sygnaly" zarejestrowane z serc 3 psow aby zdiagnozowac niedomniecie okienka owalnego miedzy przedsionkami. Czy wyczuwacie co z tym artykulem moglo byc nie tak? 😉
Kiedyś( jakieś kilkadziesiąt lat temu) ludzie nie znali pestycydów i jedli wyłącznie żywność ekologiczną:) Czy wtedy autyzm był znany?
I to jest genialne podsumowanie tego artykułu w 2 zdaniach.
a jak go wtedy można było stwierdzić?