Categories
Datu vizualizācija

Labas datu vizualizācijas veiksmes atslēgas

Kas ir laba datu vizualizācija? Vienā no mūsu “Pasaules vēsmas datu vizualizacijā” kluba tikšanās reizēm kāda dalībniece parādīja šo.

Avots

Neviens nebija vienaldzīgs. Neviens nevarēja pateikt ko sliktu. Tā ir stabiņveida diagramma, kas attēlo kāda vīrieša bārdas garumu. Lai gan šī vizualizācija nesniedz precīzu informāciju, tā nodod galveno vēstījumu, ko nolasa jebkurš sekundes desmitdaļā. 

Diskusijas turpinājumā, apskatot citus piemērus, mūsu secinājums bija –  laba vizualizācija ir ne vien pareizi un pārdomāti noformēta, bet ietver sevī interesantu un viegli uztveramu stāstu. 

Stāsts

Stāsts ir svarīgākā labas datu vizualizācijas panākumu atslēga. Bez laba stāsta pat skaistākais dizaina risinājums ātri vien kļūs par abstraktu grafisku dizainu. Piemēram, augustā visa pasaule bažījās par lielajiem ugunsgrēkiem Amazones lietus mežos un The New York Times nopublicēja datu stāstu ar kartēm, kas attēlo degošās platības pa gadiem un mēnešiem.

Avots

Konkrētās vizualizācijas vēstījums bija parādīt, ka ugunsgrēki atkārtojas līdzīgās teritorijās un līdzīgās sezonās, ko var viegli nolasīt no vizualizācijas.

Stāsts, kur katrs atrod sevi

Gadījumā, ja ir liela un daudzdimensionāla datu kopa, kuras iecerēto vēstījumu nevar parādīt vienā statiskā attēlā lai katrs tajā varētu atrast ko savu, ir jādomā par interaktīvu vizualizāciju. Zemāk ir diezgan labs interaktīvas datu vizualizācijas piemērs, kas parāda cik lietains, vējains un auksts bija 2017. gadā dažādās pasaules pilsētās.

Avots

Tās dizains piesaista ar kontrastējošām krāsām, bet elementu ir tikai tik daudz, cik nepieciešams. Centrā ir radiāla diagramma, kas parāda cik lietains (zilie stabiņi), vējains (baltie aplīši) un auksts (sarkanie stabiņi) bija katrā 2017. gada dienā. Izmantojot izvēlni, kas neuzkrītoši novietota labajā augšējā stūrī, katrs var izvēlēties galveno pilsētu, kas parādīsies apaļajā vizualizācijā un pilsētu, ar ko to salīdzināt. Salīdzinājums parādīsies katrā no trim grafikiem, kas novietoti kraisajā pusē. Pamēģini salīdzināt Rīgu ar, piemēram, Barselonu. 

Dati

Bieži veiksmīga datu stāsta pamatā ir dati, kas sniedz pārsteidzošu un nepārprotamu rezultātu. Piemēram, zemāk redzamajā grafikā ir attēlotas mūžam svarīgas tēmas – nauda un reliģija. Vizualizācija parāda, cik lieli ienākumi ir dažādu reliģiju piederīgajiem ASV.

Avots

Grafikā uzmanību pievērš reliģijas, kurām visvairāk tic bagātākie (tumši zaļie laukumi). Izrādās pasaules bagātnieku sarakstos vispopulārākās ir hiduisms un jūdaisms. Nabadzīgākie cilvēki (gaišie laukumi) visvairāk ir kristieši un jehovas liecinieki. Protams, var būt tā, ka liela daļa bagāto cilvēku ASV neasociē sevi ar kādu reliģisko konfesiju vispār, tāpēc stāsts ir par dažādām reliģijām un cik bagāti clivēki tām tic, nevis, kam tic bagātie.

Atbilstoša grafika izvēle un noformējums

Kad stāsts ir rokā, svarīgi izvēlēties pareizo grafiku, kas spēs to attēlot. Zemāk ir “treemap” grafiks, kas ir piemērotākais veids, lai parādītu, “kas lācītim vēderā”, jeb kas veido kafejnīcā pirktas kafijas izmaksas.

Avots

Grafiks ir noformēts kafijas krūzes formā, kas nepārprotami atgādina par datu galveno tēmu. Vizualizācijas pārvēršana par “clip art” ne vienmēr ir labi. Profesionāla auditorija to varētu novērtēt kā bezgaumīgu, bet “vienkāršie cilvēki” sociālajos tīklos to visdrīzāk novērtētu ar “likes” un “shares”. Par biežākajām kļūdām datu vizualizācijā un kā tās nepieļaut iepriekš esam rakstījuši šeit.

Secinājums

Vispirms ir datu stāsts, tikai tad seko noformējums. Datu vizualizācijas fomātam jābūt atbilstošam, bet grafiskajam dizainam – “lietojamam”. Tam stāsts ir jāpapildina nevis jāizdaiļo “tukši dati”.

________

Šis ieraksts tapa pateicoties domapmaiņai kas notika Datu skolas 4. septembrī rīkotās diskusijas laikā. “Pasaules vēsmas datu vizualizācijā” diskusijas notiek katra mēneša pirmajā nedēļā. Seko līdzi Datu skolas jaunumiem Facebook un Twitter.

Categories
Datu vizualizācija

Manipulācija datu vizualizācijā

Ir meli, lielāki meli un statistika, mēdz teikt. To, kādi ir izplatītākie manipulācijas paņēmieni datu vizualizācijā apskatīsim šajā bloga rakstā.

Manipulācija ar asīm

Viens no izplatītākajiem manipulācijas paņēmieniem ir datu atspoguļošana, kas nesākas no y ass nultās atzīmes. Par to pirms pāris gadiem rakstījām, apskatot gadījumu kad Rīgas Domē valdošā partija “Saskaņa” izplatīja maldinošu grafiku par apkures tarifiem lielākajās Latvijas pilsētās. Tā radīja iespaidu, ka Rīgas tarifi ir četras reizes mazāki, lai gan patiesībā, vien aptuveni 0,3 reizes mazāki nekā Cēsīs.

Avots

Y ass apgriezšana rada iespaidu, ka atšķirība starp salīdzināmiem lielumiem ir lielākas nekā patiesībā. Tas it īpaši raksturīgs stabiņveida diagrammām. Līnijveida grafikiem Y ass vērtību nesākšana no nulles ir pieļaujama gadījumos, kad svarīgi saskatīt kāda rādītāja minimālās izmaiņas laikā. Tiek panākts “palielināmā stikla efekts”.

Manipulācija ar mērogu

Salīdzinot divas atsevišķas stabiņveida diagrammas, ir svarīgi, lai abām būtu viens mērogs. Pretējā gadījumā rodas maldinošs iespaids par patiesajām vērtībām, ko grafiks atspoguļo. Zemāk ir piemērs no TVNet raksta par dzīvnieku patversmi “Mežavairogi”, kur salīdzināti uzņemtie un mirušie dzīvnieki. 

Avots

Rodas iespaids, ka uzņemts ir mazāk dzīvnieku nekā nomiris. Tas tāpēc, ka katrai stabiņveida diagrammai ir izmantots automātisks mērogs, kā atskaites punktu izmantojot katras datu kopas maksimālo vērtību. Tas arī izskaidro, kāpēc stabiņi abās diagrammas izskatās līdzīgi, lai gan to vērtības ir stipri atšķirīgas. Zemāk parādītas abas diagrammas, bet nu jau ar vienādu mērogu.

Avots: Datu skola

Manipulācija ar korelācijām

Argumentējot par vai pret kādu lēmumu, bieži tiek izmantotas korelācijas jeb likumsakarības starp diviem vai vairākim mainīgiem lielumiem. Piemēram, stingra likumsakarība (ar retiem izņēmumiem) ir starp bērna vecumu un augumu. Jo vecāks bērns, jo garāks viņš vai viņa būs. Tikpat spēcīgas un viennozīmīgas likumsakarības mēs sastopam arī fizikā, bet daudz retāk sociālajās norisēs un ekonomikā. 

Bieži likumsakarības tiek parādītas kombinētos grafikos. Zemāk ir piemērs no Valsts ieņēmumu dienesta mājaslapā pieejamas 2018. gada prezentācijas par akcīzes nodokļa izmaiņām. Konkrētais grafiks salīdzina patēriņam nodoto alu litros un tā cenu par 100 litriem.

Avots (11. slaids)

Kā redzams, alus daudzums ir svārstījies (ne tik dramatiski, protams, Y ass ir nogriezta), bet cena pēdēlā laikā ir manāmi uzkāpusi. Kādu atbildi šis grafiks sniedz? Nekādu. Starp alus daudzumu un cenu nav manāma nekāda likumsakarība. Tā daudzums ir atkarīgs no, piemēram, izejvielu ražas, bet cena aug visdrīzāk akcīzes nodokļa un vispārējās inflācijas dēļ. Pēc būtības grafiks ir informatīvi bezjēdzīgs, lai gan rada ilūziju, ka jebkas, ko saka prezentētājs ir pamatots datos. 

Iedvesmai piedāvājam noskatīties fragmentu no Jāņa Ošleja runas vienā no konfrerences “Eiro 5 gadi Latvijā” paneļdiskusijām. Tajā viņš rāda izprintētus grafikus, kurus klātesošie un video skatītāji nespēj skaidri saredzēt. Izklausās pārliecinoši.

Manipulācija ar absolūtām un “normalizētām” vērtībām

Radio “Brīvā Eiropa” savā Facebook lapā nopublicēja grafiku, kas salīdzina nāvējošu ceļa satiksmes negadījumu skaitu Eiropā un Krievijā.

Avots

Tajā Krievijas “melnā skatistika” izskatās vizmaz piecas reizes sliktāk nekā Francijā, Itālijā un Vācijā. Latvija šajā grafikā ir vien 25. vietā no 32 valstīm. Liekas, ka varam būt lepni, bet, paga, Krievijā taču dzīvo daudz vairāk cilvēku nekā Francijā. Kā izskatās grafiks, ja dati ir “normalizēti” pret iedzīvotāju skaitu?

Nākamajā dienā Radio “Brīvā Eiropa” savā Facebook lapā nopublicēja daudz objektīvāku grafiku, kurā parādīts fatālo negadījumu skaits uz 100 tūkstošiem iedzīvotāju.

Avots

Šajā grafikā Krievija vēl joprojām ir topa augšgalā, bet nu arī Latvija ir “melnās statistikas” 6. vietā.

Cits piemērs. Latvijas Darba devēju konfederācijas mājaslapā pieejama prezentācija, kurā viens no slaidiem apgalvo, ka centralizēto eksāmenu kārtotāju skaits fizikā septiņu gadu laikā ir sarucis par 54%. Grafiks izmanto absolūtos skaitļus, parādot kopējo kārtotāju skaitu un katrā no stabiņiem atzīmē kārtotāju skatiu vispārizglītojošās skolās un to kārtotāju skatiu, kas ieguvuši vairāk nekā 60% no maksimālā vērtējuma.

Avots

Līkne tik tiešām iet uz leju un kritums no 1753 kārtotājiem vispārizglītojošās skolās uz 805 kārtotājiem ir kritums par 54%. Tomēr šis grafiks neņem vērā kopējo skolēnu skaitu katrā no mācību gadiem. Tā sauktās “demogrāfiskās bedres” dēļ arī tas ir sarucis. Lūk kāda aina paveras, ja grafikā iekļauj arī kopējo absolventu skaitu, un izrēķina procentuālo izmaiņu.

Avots

Centralizēto eksāmenu kārtotāju skaits fizikā vispārizglītojošās skolās ir krieties, bet vien par 2,2 procentpunktiem no kopējo absolventu skaita. Aina nav tik dramatiska kā to uzbūra iepriekšējais grafiks.

Manipulācija ar vēstījumu

Viena un tā pati datu kopa var pamatot dažādus vēstījumus. Labs piemērs tam ir Saimona Skara (Simon Scarr) 2011. gadā “South China Morning Post” publicētais inforgrafiks ar vēstījumu “Irākas asiņainā samaksa” (Iraq’s Bloody Toll).

Avots

Tajā sarkanie stabiņi, kas attēlo Irākā bojā gājušo skaitu, “aug” nevis uz augšu, bet uz leju, atgādinot vertikāli tekošas asinis. Vizuāli uzsvars koncentrējas uz grafika vidu, kas rāda lielu kritušo skaitu 2006. – 2007. gadā. No 2009. līdz 2011. gadam nāvju skaits ir samazinājies, un to daudz labāk parāda šī paša infografika apgrieztā versija, ko 2016, gadā radīja Endijs Kotgreivs (Andy Cotgreave).

Avots

Tajā stabiņi “aug” uz augšu un izvēlētā krāsa ir zila. Virsraksts vēsta “Irāka: nāves samazinās” (Iraq: Deaths on the decline). Dati tie paši, vēstījums pavisam cits. 

Paplašinot apvārsni

Iesakām noskatīties Alberto Kairo (Alberto Cairo), Majamī universitātes Datu vizualizācijas profesora, prezentācijas ierakstu, kurā viņš stāsta par to, kā “grafiki mums melo”.

Kairo vēstījums ir, ka datu vizualizācija parāda tikai to, ko tā parāda, bet cilvēki mēdz tās interpretēt sev izdevīgos veidos. Viņš mudina veidot labus grafikus, kas veicina diskusijas un izvairīties no sliktām vizualizācijām, kas tās traucē. Izmantojot piemērus, Kairo paskaidro, kāpēc pieņēmums, ka grafiks spēj “parādīt vairāk nekā 1000 vārdu” vai ka “dati runā paši par sevi” ir kļūdains. 

Viņš uzskaita sešus kognitīvos izaicinājumus, kas traucē mums uztvert datu vizualizācijas objektīvi:

  1. Tendence saskatīt likumsakarības (patterns) par tad, kad tās ir nejaušas sakritības nevis cēloņsakarības;
  2. Nepietiekama grafiskā datu pratība (igraphicacy). Mums jāspēj grafikus “lasīt” nevis tikai “redzēt”;
  3. Bailes no sarežģītības. Grafiku uzdevums nav vienkāršot, bet gan paskaidrot. Bieži ar vienu grafiku nepietiek. Jāapskata un jāsalīdzina vairāki, lai labāk izprastu parādību;
  4. Tendence ignorēt nenotektību. Dati nekad nav objektīvi. Bieži tie ir nepilnīgi. Tā vietā, lai ignorētu datu nepilnības ir jāizvērš diskusija par nezināmo.
  5. Tiekšanās pēc apstiprinājuma (confirmation bias). Lai pamatotu savu argumentu, mēs izmantojam datus, kas to apstiprina, ignorējot datu nepilnības un neizmērītus ietekmes faktorus;
  6. Racionalizācija. Evolūcijas laikā esam pieraduši uzņemt informāciju, kura mums šķiet pieņemama, un tālāk pārliecināt par to citus. Tā vietā, ir jāmēģina šis reflekss novirzīt spriešanas virzienā, ļaujot mainīt mūsu pasaules skatījumu.

________

Šis ieraksts tapa pateicoties domapmaiņai kas notika Datu skolas 8. augustā rīkotās diskusijas laikā. “Pasaules vēsmas datu vizualizācijā” diskusijas notiek katra mēneša pirmajā nedēļā. Seko līdzi Datu skolas jaunumiem Facebook un Twitter.

Categories
Datu vizualizācija

Biežākās datu vizualizācijas kļūdas

Neatbilstoša grafika izvēle

Katrai datu kopai ir savs atbilstošs vizualizācijas formāts. Visvieglāk ir nokļūdīties, lietojot apļveida diagrammas jeb “pīrāgus”. Ikonisks piemērs, kurā dati, kas piemēroti stabiņveida diagrammai, izmantoti “pīrāgā”, ir FOX News 2012. gada prezidenta vēlēšanu kandidātu reitingu salīdzinājums.

Avots

Vizualizācijas autors, iespējams, atcerējās, ka procentus vislabāk attēlo “pīrāgs”, taču pīrāgs attēlo procentuālo sadalījumu starp kategorijām, kas veido vienu veselumu. Šajā gadījumā procentuālo vērtību summa pārsniedza vienu veselu jeb 100%. To pamanīja konkurenti NBC un izsmēja kanāla darbinieku matemātikas spējas.

Vēl redikālāks piemērs ir šis:

Avots

ALTERNATĪVA, LAI IZVAIRĪTOS NO KĻŪDAS: 

Stabiņu diagramma.

Vēlme grafiku padarīt “interesantāku”

Iemesls neatbilstošai grafika izvēlei bieži ir vēlme padarīt vizualizāciju “interesantāku”, jo stabiņi un līnijveida grafiki visiem ir apnikuši. Zemāk redzamās vizualizācijas autors nolēma “pīrāgus” izmantot, lai attēlotu kā mainījās 10 gadu laikā to organizāciju īpatsvars, kuras uztraucas par klientu noturēšanu un kuras ne.

Avots

ALTERNATĪVA, LAI IZVAIRĪTOS NO KĻŪDAS:

Lai gan paši “pīrāgi” ir izmantoti pareizi  – katrs attēlo divas kategorijas, kas kopā veido 100%. – izmaiņu organizāciju attieksmē laikā vizlabāk parādītu līnijveida grafiks. 

Tumšā līnija ar svārstībām tiecas uz augšu, bet gaišā – uz leju. Ir skaidri redzams, ka pēc 2012. gada to organizāciju, kurām rūp klientu noturēšana, īpatsvars pārsniedza vienaldzīgās. 

Vēlme padarītu grafiku “interesantāku” bieži noved arī pie pārāk radošiem un sarežģītiem vizuāliem risinājumiem. Zemāk redzams ļoti netradicionāls datu vizualizācijas risinājums, kura nolasīšana prasa pamatīgu iedziļināšanos.

Avots

Sarežģīta datu vizualizācija pati par sevi nav kļūda, bet var “pašaut garām” savai mērķauditorijai, kas, iespējams, nevēlēsies iedziļināties.

ALTERNATĪVA, LAI IZVAIRĪTOS NO KĻŪDAS:

Šajā gadījumā jāiekāpj lasītaja “kurpēs” un jāsaprot, kā lasītājs lasa grafiku. Grafiks,kurā leģenda ir garāka par pašu grafiku, noteikti nav labākais risinājums lasītāja uzrunāšanai. 

Pārsātinājums ar datiem

Vēl viena izplatīta vizualizācijas kļūda ir pārsātinājums, kas visbiežāk izpaužas vēlmē attēlot visus pieejomos datus vienā vizualizācijā vai infografikā.

Avots

ALTERNATĪVA, LAI IZVAIRĪTOS NO KĻŪDAS:

Labākais risinājums ir vispirms saprast, kādu ziņu ar šī grafika palīdzību autors vēlas nodot, un attēlot tikai to. Pilno datu kopu var augšuplādēt kādā failu apmaiņas vietnē un hipersaiti pievienot vizualizācijas aprakstā.

Avots

Šādas datu vizualizācijas sastopamas arī Latvijā.

Avots

ALTERNATĪVA, LAI IZVAIRĪTOS NO KĻŪDAS:

Ja datu kopā ir kategorijas, kuru vērtības salīdzinot ar pārējām ir tik lielas, ka pārējās “pazūd”, bieži izmantots risinājums ir iznest “mazos datus” citā grafikā un parādīt to svārstības bez lielajiem izņēmumiem gluži kā caur palielināmo stiklu. 

Turpinājumā vairāki piemēri, kuros grafika kļūdas pavisam vienkārši varētu atrisināt, ja pirms publicēšanas ar vizualizāciju padalītos ar draugiem vai kolēģiem un ļautu vienkārši pārlasīt. Ja teksts ir saprotams un loģisks, tas būs saprotams arī lasītājiem. 

Vizualizācijas rīka ierobežojumi

Zemāk redzamajā vizualizācijā, kas radīta, izmantojot Piktochart, 100% absolventu sadalījumu pa fakultātēm attēlo 99 trijstūrīši, nevis 100. Tas radies, jo autors izmantojis tiešsaistē pieejamos rīkus, nepamanot to ierobežojumus. 

Avots

“WTF” kļūdas

Citreiz datu vizualizācija nemaz nav datu vizualizācija, bet gan skaitļu un vārdu virknējums dažādos fontos un ģeometriskās formās.

Avots

Avots

Sastopama ir arī vizuālo elementu, piemēram, stabiņu garuma, neatbilstība skaitļiem, kas tiem būtu jāattēlo.

Avots

Avots

Dažkārt vizualizācju autori arī neprot vai nevēlas skaitīt.

Avots

Avots

________
Šis ieraksts tapa pateicoties domapmaiņai kas notika Datu skolas 3. aprīlī rīkotās diskusijas laikā. “Pasaules vēsmas datu vizualizācijā” diskusijas notiek katra mēneša pirmajā nedēļā. Seko līdzi Datu skolas jaunumiem Facebook un Twitter.

Categories
Datu vizualizācija

Dzīves audits

Cik bieži mēs skatāmies pulkstenī? Parasti tik nenozīmīgas lietas mūsu aizņemtie prāti izvēlas ignorēt līdz brīdim, kad sākam apzināti pievērst uzmanību un skaitīt. 

Kāda izskatītos mūsu dzīve, ja katru nedēļu apzināti skaitītu un pēc tam apkopotu dažādus mūsu dzīves aspektus?

Tieši tā izdarīja divas informācijas dizaineres, Džordžija Lupi (Giorgia Lupi) un Stefānija Posaveka (Stefanie Posavec) projekta “Dear data” ietvaros. Katru nedēļu diazaineres sūtīja viena otrai pastkartes ar datu vizualizāciju, kas attēloja datus, kas ievākti par kādu tēmu – kartu nedēļu citu.

Izdomāt unikālu tēmu katrai nedēļai gadā nebūt nav viegli. Piedevām, dizainerēm bija arī jāatrod kāds jauns, radošs veids, kā attēlot ievāktos datus tā, lai ilustrācijas neatkārtojas. 

Izrādās, datus var attēlot arī kā notis, ziedus, un visdažādākās ģeometriskās figūras. 

Džordžija attēlo datus izmantojot negaidītas metodes, un dau vākšanas procesā iekļauj neparastus aspektus. 

Vizualizācijā A Week of complaints (sūdzību nedēļa) Džordžija attēlo datus, izmantojot nošu pierakstu, kas atvieglo uztveri un mudina skatītāju domāt par sūdzēšanos kā par mūziku, ko neesam ikdienā raduši darīt.

Vizualizācijā A Week of clocks (pulskteņu nedēļa) Džordžija ir atzīmējusi arī katru reizi, kad centusies neskatīties pulkstenī, bet tomēr ir to izdarījusi.

Stefānija izteiksmīgi darbojas ar krāsām un līnijām dažādās kombinācijās, taču kontrastu atšķirība starp, piemēram, jūraszilo un debeszilo krāsu nav izteikta, un apgrūtina datu salīdzināšanu. 

Vizualizācijā A Week of goodbyes (atvadu nedēļa) vienā kategorijā ir iekļauts gan medijs, caur kuru tika izteiktas atvadas, gan vieta, kur tās tika izteiktas. Ilustrācijas veids kategorijai ir viens, tāpēc skatītājam izpaliek iespēja meklēt likumsakarības starp šiem aspektiem atsevišķi.

Vizualizācijā A Week of laughters (Smieklu nedēļa) Stefānija izmanto vienkāršas formas un notāciju. Apļa izmērs norāda, cik lieli un sirsnīgi bija smiekli.

“Dear data” projekts ir iedvesmojis cilvēkus visā pasaulē sākt vākt un vizualizēt savas dzīves datus , un sūtīt kādam otrā pasaules galā. 

Projekta dibinātājas ir pierādījušas, ka viss, kas vajadzīga, lai veiktu savas dzīve auditu, ir uzmanība un radošums, un nebūt nav nepieciešams maģistra grāds statistikā. 

Categories
Datu vizualizācija

Klasiķi – manipulātori

Inovatīvi stāstnieki vai manipulātori – robeža starp abiem datu vizualizācijas klasiķu raksturojumiem izrādās ir šaurāka nekā sākumā šķiet. 

Iespējams labākās statistikas vizualizācijas autors Čārlzs Džozefs Minārds 1869. gadā radīto diagrammu izmantoja kā līdzekli, lai nodotu vēstījumu par to, cik traģisks izvērtās Napoleona kara gājiena uz Maskavu 1813. gadā. 

Gaiši brūnās līnijas platums parāda karapulka lielumu, līniju virziens – karapulka ģeogrāfisko pārvietošanos, bet temperatūras atzīmes liek nojaust, ka daļa karapulka nebija gatava aukstam klimatam.

Kartē neparādās nedz karavīru nāves iemeslu statistika, nedz precīza ģeogrāfisko vietu atrašanās, taču tas netraucē uztvert gaiši brūnās līnijas bravūru un melnās līnijas kaunpilno un traģisko sagrāvi.

Līdzīgs stāsts ir arī ar britu fiziķa Džona Snova karti, kas parāda holēras izraisītos nāves gadījumus Soho rajonā Londonā.

Snovs izmantoja karti, lai pārliecinātu vietējās autoritātes slēgt Broudstrītas ūdenspumpi, kas kartē tik skaidri parāda likumsakarību starp nāvju skaitu, atrašanās vietu un ūdenspumpja tuvumu. Lai gan karte šķiet ļoti ticama, neviens nezina, vai arī pats Snovs holēras izplatības cēloni atklāja ar tās palīdzību. Nav arī zināms vai karte atspoguļo visus holēras nāves gadījumus un vai likumsakarība būtu tikpat neapstrīdama, ja kartē tiktu attēloti arī citi Londonas rajoni. Veiksme vai zinātniskā metode, bet Snovam izrādījās taisnība, kas tagad ļauj viņu dēvēt par mūsdienu epidemoloģijas pamatlicēju.

Dāma ar lukturi, Florence Naitingeila arī savā ziņā manipulēja ar datu vizualizāciju cēla mērķa vadīta. Lai uzlabotu higiēnu britu armijā, 1855. gadā viņa nolēma izmantot iespaidīgu diagrammu, kas parādīja britu kareivju patiesos nāves iemeslus Krimas kara laikā Turcijā, un ļāva pārliecināt autoritātes Londonā uzlabot higiēnas apstākļus.

Diagramma atspoguļo nāves iemeslus pa mēnešiem. Zilie laukumi ir infekciju izraisītās nāves, sarkanie – ievainojumu izraisītās nāves un melnie – visi citi nāves iemesli. 

Laikā, kad tapa Naitingeilas slavenā vizualizācija skotu inžinieris Vilijams Plejfērs jau bija izdomājis gan stabiņveida, gan apļveida diagrammas. Izmantojot stabiņveida diagrammu, zilie laukumi nebūtu tik lieli. Naitingeila visticamāk apzinājās, ka Ierastajā koordinātu plaknē viens ir tikpat liels gan lejā pie nulles atzīmes, gan stabiņa virspusē, savukārt radiālā plaknē laukums ko aizņem viena vienība pie centra ir daudz mazāks nekā laukums, ko aizņem vienība rādiusa galā. Lai gan apaļa, diagramma arī nevarētu būt klasiskā apļveida diagramma, jo tā nespētu vienlaicīgi parādīt gan nāvju iemeslus gan to sadalījumu pa mēnešiem.

Mūsdienās, vairojoties sabiedrības datu pratībai, šāda manipulatīva vizualizācija visdrīzāk izpelnītos bargu oponentu kritiku, taču Naitingeilai palīdzēja panākt pozitīvas pārmaiņas veselības aprūpē un saglabāt daudzu cilvēku dzīvības tieši sava vienkāršā, pastiprinātā vēstījuma dēļ.

________

Šis ieraksts tapa pateicoties domapmaiņai kas notika Datu skolas 6. februārī rīkotās diskusijas laikā. “Pasaules vēsmas datu vizualizācijā” diskusijas notiek katra mēneša pirmajā nedēļā. Seko līdzi Datu skolas jaunumiem Facebook un Twitter.