Projekti
Iesaisties
Blogs
Par mums
Kontakti
← ATPAKAĻ

Manipulācija datu vizualizācijā

2019-08-27

Ir meli, lielāki meli un statistika, mēdz teikt. To, kādi ir izplatītākie manipulācijas paņēmieni datu vizualizācijā apskatīsim šajā bloga rakstā.

Manipulācija ar asīm

Viens no izplatītākajiem manipulācijas paņēmieniem ir datu atspoguļošana, kas nesākas no y ass nultās atzīmes. Par to pirms pāris gadiem rakstījām, apskatot gadījumu kad Rīgas Domē valdošā partija “Saskaņa” izplatīja maldinošu grafiku par apkures tarifiem lielākajās Latvijas pilsētās. Tā radīja iespaidu, ka Rīgas tarifi ir četras reizes mazāki, lai gan patiesībā, vien aptuveni 0,3 reizes mazāki nekā Cēsīs.

Avots

Y ass apgriezšana rada iespaidu, ka atšķirība starp salīdzināmiem lielumiem ir lielākas nekā patiesībā. Tas it īpaši raksturīgs stabiņveida diagrammām. Līnijveida grafikiem Y ass vērtību nesākšana no nulles ir pieļaujama gadījumos, kad svarīgi saskatīt kāda rādītāja minimālās izmaiņas laikā. Tiek panākts “palielināmā stikla efekts”.

Manipulācija ar mērogu

Salīdzinot divas atsevišķas stabiņveida diagrammas, ir svarīgi, lai abām būtu viens mērogs. Pretējā gadījumā rodas maldinošs iespaids par patiesajām vērtībām, ko grafiks atspoguļo. Zemāk ir piemērs no TVNet raksta par dzīvnieku patversmi “Mežavairogi”, kur salīdzināti uzņemtie un mirušie dzīvnieki. 

Avots

Rodas iespaids, ka uzņemts ir mazāk dzīvnieku nekā nomiris. Tas tāpēc, ka katrai stabiņveida diagrammai ir izmantots automātisks mērogs, kā atskaites punktu izmantojot katras datu kopas maksimālo vērtību. Tas arī izskaidro, kāpēc stabiņi abās diagrammas izskatās līdzīgi, lai gan to vērtības ir stipri atšķirīgas. Zemāk parādītas abas diagrammas, bet nu jau ar vienādu mērogu.

Avots: Datu skola

Manipulācija ar korelācijām

Argumentējot par vai pret kādu lēmumu, bieži tiek izmantotas korelācijas jeb likumsakarības starp diviem vai vairākim mainīgiem lielumiem. Piemēram, stingra likumsakarība (ar retiem izņēmumiem) ir starp bērna vecumu un augumu. Jo vecāks bērns, jo garāks viņš vai viņa būs. Tikpat spēcīgas un viennozīmīgas likumsakarības mēs sastopam arī fizikā, bet daudz retāk sociālajās norisēs un ekonomikā. 

Bieži likumsakarības tiek parādītas kombinētos grafikos. Zemāk ir piemērs no Valsts ieņēmumu dienesta mājaslapā pieejamas 2018. gada prezentācijas par akcīzes nodokļa izmaiņām. Konkrētais grafiks salīdzina patēriņam nodoto alu litros un tā cenu par 100 litriem.

Avots (11. slaids)

Kā redzams, alus daudzums ir svārstījies (ne tik dramatiski, protams, Y ass ir nogriezta), bet cena pēdēlā laikā ir manāmi uzkāpusi. Kādu atbildi šis grafiks sniedz? Nekādu. Starp alus daudzumu un cenu nav manāma nekāda likumsakarība. Tā daudzums ir atkarīgs no, piemēram, izejvielu ražas, bet cena aug visdrīzāk akcīzes nodokļa un vispārējās inflācijas dēļ. Pēc būtības grafiks ir informatīvi bezjēdzīgs, lai gan rada ilūziju, ka jebkas, ko saka prezentētājs ir pamatots datos. 

Iedvesmai piedāvājam noskatīties fragmentu no Jāņa Ošleja runas vienā no konfrerences “Eiro 5 gadi Latvijā” paneļdiskusijām. Tajā viņš rāda izprintētus grafikus, kurus klātesošie un video skatītāji nespēj skaidri saredzēt. Izklausās pārliecinoši.

Manipulācija ar absolūtām un “normalizētām” vērtībām

Radio “Brīvā Eiropa” savā Facebook lapā nopublicēja grafiku, kas salīdzina nāvējošu ceļa satiksmes negadījumu skaitu Eiropā un Krievijā.

Avots

Tajā Krievijas “melnā skatistika” izskatās vizmaz piecas reizes sliktāk nekā Francijā, Itālijā un Vācijā. Latvija šajā grafikā ir vien 25. vietā no 32 valstīm. Liekas, ka varam būt lepni, bet, paga, Krievijā taču dzīvo daudz vairāk cilvēku nekā Francijā. Kā izskatās grafiks, ja dati ir “normalizēti” pret iedzīvotāju skaitu?

Nākamajā dienā Radio “Brīvā Eiropa” savā Facebook lapā nopublicēja daudz objektīvāku grafiku, kurā parādīts fatālo negadījumu skaits uz 100 tūkstošiem iedzīvotāju.

Avots

Šajā grafikā Krievija vēl joprojām ir topa augšgalā, bet nu arī Latvija ir “melnās statistikas” 6. vietā.

Cits piemērs. Latvijas Darba devēju konfederācijas mājaslapā pieejama prezentācija, kurā viens no slaidiem apgalvo, ka centralizēto eksāmenu kārtotāju skaits fizikā septiņu gadu laikā ir sarucis par 54%. Grafiks izmanto absolūtos skaitļus, parādot kopējo kārtotāju skaitu un katrā no stabiņiem atzīmē kārtotāju skatiu vispārizglītojošās skolās un to kārtotāju skatiu, kas ieguvuši vairāk nekā 60% no maksimālā vērtējuma.

Avots

Līkne tik tiešām iet uz leju un kritums no 1753 kārtotājiem vispārizglītojošās skolās uz 805 kārtotājiem ir kritums par 54%. Tomēr šis grafiks neņem vērā kopējo skolēnu skaitu katrā no mācību gadiem. Tā sauktās “demogrāfiskās bedres” dēļ arī tas ir sarucis. Lūk kāda aina paveras, ja grafikā iekļauj arī kopējo absolventu skaitu, un izrēķina procentuālo izmaiņu.

Avots

Centralizēto eksāmenu kārtotāju skaits fizikā vispārizglītojošās skolās ir krieties, bet vien par 2,2 procentpunktiem no kopējo absolventu skaita. Aina nav tik dramatiska kā to uzbūra iepriekšējais grafiks.

Manipulācija ar vēstījumu

Viena un tā pati datu kopa var pamatot dažādus vēstījumus. Labs piemērs tam ir Saimona Skara (Simon Scarr) 2011. gadā “South China Morning Post” publicētais inforgrafiks ar vēstījumu “Irākas asiņainā samaksa” (Iraq’s Bloody Toll).

Avots

Tajā sarkanie stabiņi, kas attēlo Irākā bojā gājušo skaitu, “aug” nevis uz augšu, bet uz leju, atgādinot vertikāli tekošas asinis. Vizuāli uzsvars koncentrējas uz grafika vidu, kas rāda lielu kritušo skaitu 2006. – 2007. gadā. No 2009. līdz 2011. gadam nāvju skaits ir samazinājies, un to daudz labāk parāda šī paša infografika apgrieztā versija, ko 2016, gadā radīja Endijs Kotgreivs (Andy Cotgreave).

Avots

Tajā stabiņi “aug” uz augšu un izvēlētā krāsa ir zila. Virsraksts vēsta “Irāka: nāves samazinās” (Iraq: Deaths on the decline). Dati tie paši, vēstījums pavisam cits. 

Paplašinot apvārsni

Iesakām noskatīties Alberto Kairo (Alberto Cairo), Majamī universitātes Datu vizualizācijas profesora, prezentācijas ierakstu, kurā viņš stāsta par to, kā “grafiki mums melo”.

Kairo vēstījums ir, ka datu vizualizācija parāda tikai to, ko tā parāda, bet cilvēki mēdz tās interpretēt sev izdevīgos veidos. Viņš mudina veidot labus grafikus, kas veicina diskusijas un izvairīties no sliktām vizualizācijām, kas tās traucē. Izmantojot piemērus, Kairo paskaidro, kāpēc pieņēmums, ka grafiks spēj “parādīt vairāk nekā 1000 vārdu” vai ka “dati runā paši par sevi” ir kļūdains. 

Viņš uzskaita sešus kognitīvos izaicinājumus, kas traucē mums uztvert datu vizualizācijas objektīvi:

  1. Tendence saskatīt likumsakarības (patterns) par tad, kad tās ir nejaušas sakritības nevis cēloņsakarības;
  2. Nepietiekama grafiskā datu pratība (igraphicacy). Mums jāspēj grafikus “lasīt” nevis tikai “redzēt”;
  3. Bailes no sarežģītības. Grafiku uzdevums nav vienkāršot, bet gan paskaidrot. Bieži ar vienu grafiku nepietiek. Jāapskata un jāsalīdzina vairāki, lai labāk izprastu parādību;
  4. Tendence ignorēt nenotektību. Dati nekad nav objektīvi. Bieži tie ir nepilnīgi. Tā vietā, lai ignorētu datu nepilnības ir jāizvērš diskusija par nezināmo.
  5. Tiekšanās pēc apstiprinājuma (confirmation bias). Lai pamatotu savu argumentu, mēs izmantojam datus, kas to apstiprina, ignorējot datu nepilnības un neizmērītus ietekmes faktorus;
  6. Racionalizācija. Evolūcijas laikā esam pieraduši uzņemt informāciju, kura mums šķiet pieņemama, un tālāk pārliecināt par to citus. Tā vietā, ir jāmēģina šis reflekss novirzīt spriešanas virzienā, ļaujot mainīt mūsu pasaules skatījumu.

________

Šis ieraksts tapa pateicoties domapmaiņai kas notika Datu skolas 8. augustā rīkotās diskusijas laikā. “Pasaules vēsmas datu vizualizācijā” diskusijas notiek katra mēneša pirmajā nedēļā. Seko līdzi Datu skolas jaunumiem Facebook un Twitter.

DATU
SKOLA
Datu skola ir daļa no
SCHOOL OF DATA
Pierādījumā ir spēks!

Datu skola ir te, lai žurnālisti, nevalstisko organizāciju aktīvisti, un citi sabiedrības locekļi iegūst spējas efektīvi strādāt ar datiem.