Categories
Datu vizualizācija

Labas datu vizualizācijas veiksmes atslēgas

Kas ir laba datu vizualizācija? Vienā no mūsu “Pasaules vēsmas datu vizualizacijā” kluba tikšanās reizēm kāda dalībniece parādīja šo.

Avots

Neviens nebija vienaldzīgs. Neviens nevarēja pateikt ko sliktu. Tā ir stabiņveida diagramma, kas attēlo kāda vīrieša bārdas garumu. Lai gan šī vizualizācija nesniedz precīzu informāciju, tā nodod galveno vēstījumu, ko nolasa jebkurš sekundes desmitdaļā. 

Diskusijas turpinājumā, apskatot citus piemērus, mūsu secinājums bija –  laba vizualizācija ir ne vien pareizi un pārdomāti noformēta, bet ietver sevī interesantu un viegli uztveramu stāstu. 

Stāsts

Stāsts ir svarīgākā labas datu vizualizācijas panākumu atslēga. Bez laba stāsta pat skaistākais dizaina risinājums ātri vien kļūs par abstraktu grafisku dizainu. Piemēram, augustā visa pasaule bažījās par lielajiem ugunsgrēkiem Amazones lietus mežos un The New York Times nopublicēja datu stāstu ar kartēm, kas attēlo degošās platības pa gadiem un mēnešiem.

Avots

Konkrētās vizualizācijas vēstījums bija parādīt, ka ugunsgrēki atkārtojas līdzīgās teritorijās un līdzīgās sezonās, ko var viegli nolasīt no vizualizācijas.

Stāsts, kur katrs atrod sevi

Gadījumā, ja ir liela un daudzdimensionāla datu kopa, kuras iecerēto vēstījumu nevar parādīt vienā statiskā attēlā lai katrs tajā varētu atrast ko savu, ir jādomā par interaktīvu vizualizāciju. Zemāk ir diezgan labs interaktīvas datu vizualizācijas piemērs, kas parāda cik lietains, vējains un auksts bija 2017. gadā dažādās pasaules pilsētās.

Avots

Tās dizains piesaista ar kontrastējošām krāsām, bet elementu ir tikai tik daudz, cik nepieciešams. Centrā ir radiāla diagramma, kas parāda cik lietains (zilie stabiņi), vējains (baltie aplīši) un auksts (sarkanie stabiņi) bija katrā 2017. gada dienā. Izmantojot izvēlni, kas neuzkrītoši novietota labajā augšējā stūrī, katrs var izvēlēties galveno pilsētu, kas parādīsies apaļajā vizualizācijā un pilsētu, ar ko to salīdzināt. Salīdzinājums parādīsies katrā no trim grafikiem, kas novietoti kraisajā pusē. Pamēģini salīdzināt Rīgu ar, piemēram, Barselonu. 

Dati

Bieži veiksmīga datu stāsta pamatā ir dati, kas sniedz pārsteidzošu un nepārprotamu rezultātu. Piemēram, zemāk redzamajā grafikā ir attēlotas mūžam svarīgas tēmas – nauda un reliģija. Vizualizācija parāda, cik lieli ienākumi ir dažādu reliģiju piederīgajiem ASV.

Avots

Grafikā uzmanību pievērš reliģijas, kurām visvairāk tic bagātākie (tumši zaļie laukumi). Izrādās pasaules bagātnieku sarakstos vispopulārākās ir hiduisms un jūdaisms. Nabadzīgākie cilvēki (gaišie laukumi) visvairāk ir kristieši un jehovas liecinieki. Protams, var būt tā, ka liela daļa bagāto cilvēku ASV neasociē sevi ar kādu reliģisko konfesiju vispār, tāpēc stāsts ir par dažādām reliģijām un cik bagāti clivēki tām tic, nevis, kam tic bagātie.

Atbilstoša grafika izvēle un noformējums

Kad stāsts ir rokā, svarīgi izvēlēties pareizo grafiku, kas spēs to attēlot. Zemāk ir “treemap” grafiks, kas ir piemērotākais veids, lai parādītu, “kas lācītim vēderā”, jeb kas veido kafejnīcā pirktas kafijas izmaksas.

Avots

Grafiks ir noformēts kafijas krūzes formā, kas nepārprotami atgādina par datu galveno tēmu. Vizualizācijas pārvēršana par “clip art” ne vienmēr ir labi. Profesionāla auditorija to varētu novērtēt kā bezgaumīgu, bet “vienkāršie cilvēki” sociālajos tīklos to visdrīzāk novērtētu ar “likes” un “shares”. Par biežākajām kļūdām datu vizualizācijā un kā tās nepieļaut iepriekš esam rakstījuši šeit.

Secinājums

Vispirms ir datu stāsts, tikai tad seko noformējums. Datu vizualizācijas fomātam jābūt atbilstošam, bet grafiskajam dizainam – “lietojamam”. Tam stāsts ir jāpapildina nevis jāizdaiļo “tukši dati”.

________

Šis ieraksts tapa pateicoties domapmaiņai kas notika Datu skolas 4. septembrī rīkotās diskusijas laikā. “Pasaules vēsmas datu vizualizācijā” diskusijas notiek katra mēneša pirmajā nedēļā. Seko līdzi Datu skolas jaunumiem Facebook un Twitter.

Categories
Datu vizualizācija

Manipulācija datu vizualizācijā

Ir meli, lielāki meli un statistika, mēdz teikt. To, kādi ir izplatītākie manipulācijas paņēmieni datu vizualizācijā apskatīsim šajā bloga rakstā.

Manipulācija ar asīm

Viens no izplatītākajiem manipulācijas paņēmieniem ir datu atspoguļošana, kas nesākas no y ass nultās atzīmes. Par to pirms pāris gadiem rakstījām, apskatot gadījumu kad Rīgas Domē valdošā partija “Saskaņa” izplatīja maldinošu grafiku par apkures tarifiem lielākajās Latvijas pilsētās. Tā radīja iespaidu, ka Rīgas tarifi ir četras reizes mazāki, lai gan patiesībā, vien aptuveni 0,3 reizes mazāki nekā Cēsīs.

Avots

Y ass apgriezšana rada iespaidu, ka atšķirība starp salīdzināmiem lielumiem ir lielākas nekā patiesībā. Tas it īpaši raksturīgs stabiņveida diagrammām. Līnijveida grafikiem Y ass vērtību nesākšana no nulles ir pieļaujama gadījumos, kad svarīgi saskatīt kāda rādītāja minimālās izmaiņas laikā. Tiek panākts “palielināmā stikla efekts”.

Manipulācija ar mērogu

Salīdzinot divas atsevišķas stabiņveida diagrammas, ir svarīgi, lai abām būtu viens mērogs. Pretējā gadījumā rodas maldinošs iespaids par patiesajām vērtībām, ko grafiks atspoguļo. Zemāk ir piemērs no TVNet raksta par dzīvnieku patversmi “Mežavairogi”, kur salīdzināti uzņemtie un mirušie dzīvnieki. 

Avots

Rodas iespaids, ka uzņemts ir mazāk dzīvnieku nekā nomiris. Tas tāpēc, ka katrai stabiņveida diagrammai ir izmantots automātisks mērogs, kā atskaites punktu izmantojot katras datu kopas maksimālo vērtību. Tas arī izskaidro, kāpēc stabiņi abās diagrammas izskatās līdzīgi, lai gan to vērtības ir stipri atšķirīgas. Zemāk parādītas abas diagrammas, bet nu jau ar vienādu mērogu.

Avots: Datu skola

Manipulācija ar korelācijām

Argumentējot par vai pret kādu lēmumu, bieži tiek izmantotas korelācijas jeb likumsakarības starp diviem vai vairākim mainīgiem lielumiem. Piemēram, stingra likumsakarība (ar retiem izņēmumiem) ir starp bērna vecumu un augumu. Jo vecāks bērns, jo garāks viņš vai viņa būs. Tikpat spēcīgas un viennozīmīgas likumsakarības mēs sastopam arī fizikā, bet daudz retāk sociālajās norisēs un ekonomikā. 

Bieži likumsakarības tiek parādītas kombinētos grafikos. Zemāk ir piemērs no Valsts ieņēmumu dienesta mājaslapā pieejamas 2018. gada prezentācijas par akcīzes nodokļa izmaiņām. Konkrētais grafiks salīdzina patēriņam nodoto alu litros un tā cenu par 100 litriem.

Avots (11. slaids)

Kā redzams, alus daudzums ir svārstījies (ne tik dramatiski, protams, Y ass ir nogriezta), bet cena pēdēlā laikā ir manāmi uzkāpusi. Kādu atbildi šis grafiks sniedz? Nekādu. Starp alus daudzumu un cenu nav manāma nekāda likumsakarība. Tā daudzums ir atkarīgs no, piemēram, izejvielu ražas, bet cena aug visdrīzāk akcīzes nodokļa un vispārējās inflācijas dēļ. Pēc būtības grafiks ir informatīvi bezjēdzīgs, lai gan rada ilūziju, ka jebkas, ko saka prezentētājs ir pamatots datos. 

Iedvesmai piedāvājam noskatīties fragmentu no Jāņa Ošleja runas vienā no konfrerences “Eiro 5 gadi Latvijā” paneļdiskusijām. Tajā viņš rāda izprintētus grafikus, kurus klātesošie un video skatītāji nespēj skaidri saredzēt. Izklausās pārliecinoši.

Manipulācija ar absolūtām un “normalizētām” vērtībām

Radio “Brīvā Eiropa” savā Facebook lapā nopublicēja grafiku, kas salīdzina nāvējošu ceļa satiksmes negadījumu skaitu Eiropā un Krievijā.

Avots

Tajā Krievijas “melnā skatistika” izskatās vizmaz piecas reizes sliktāk nekā Francijā, Itālijā un Vācijā. Latvija šajā grafikā ir vien 25. vietā no 32 valstīm. Liekas, ka varam būt lepni, bet, paga, Krievijā taču dzīvo daudz vairāk cilvēku nekā Francijā. Kā izskatās grafiks, ja dati ir “normalizēti” pret iedzīvotāju skaitu?

Nākamajā dienā Radio “Brīvā Eiropa” savā Facebook lapā nopublicēja daudz objektīvāku grafiku, kurā parādīts fatālo negadījumu skaits uz 100 tūkstošiem iedzīvotāju.

Avots

Šajā grafikā Krievija vēl joprojām ir topa augšgalā, bet nu arī Latvija ir “melnās statistikas” 6. vietā.

Cits piemērs. Latvijas Darba devēju konfederācijas mājaslapā pieejama prezentācija, kurā viens no slaidiem apgalvo, ka centralizēto eksāmenu kārtotāju skaits fizikā septiņu gadu laikā ir sarucis par 54%. Grafiks izmanto absolūtos skaitļus, parādot kopējo kārtotāju skaitu un katrā no stabiņiem atzīmē kārtotāju skatiu vispārizglītojošās skolās un to kārtotāju skatiu, kas ieguvuši vairāk nekā 60% no maksimālā vērtējuma.

Avots

Līkne tik tiešām iet uz leju un kritums no 1753 kārtotājiem vispārizglītojošās skolās uz 805 kārtotājiem ir kritums par 54%. Tomēr šis grafiks neņem vērā kopējo skolēnu skaitu katrā no mācību gadiem. Tā sauktās “demogrāfiskās bedres” dēļ arī tas ir sarucis. Lūk kāda aina paveras, ja grafikā iekļauj arī kopējo absolventu skaitu, un izrēķina procentuālo izmaiņu.

Avots

Centralizēto eksāmenu kārtotāju skaits fizikā vispārizglītojošās skolās ir krieties, bet vien par 2,2 procentpunktiem no kopējo absolventu skaita. Aina nav tik dramatiska kā to uzbūra iepriekšējais grafiks.

Manipulācija ar vēstījumu

Viena un tā pati datu kopa var pamatot dažādus vēstījumus. Labs piemērs tam ir Saimona Skara (Simon Scarr) 2011. gadā “South China Morning Post” publicētais inforgrafiks ar vēstījumu “Irākas asiņainā samaksa” (Iraq’s Bloody Toll).

Avots

Tajā sarkanie stabiņi, kas attēlo Irākā bojā gājušo skaitu, “aug” nevis uz augšu, bet uz leju, atgādinot vertikāli tekošas asinis. Vizuāli uzsvars koncentrējas uz grafika vidu, kas rāda lielu kritušo skaitu 2006. – 2007. gadā. No 2009. līdz 2011. gadam nāvju skaits ir samazinājies, un to daudz labāk parāda šī paša infografika apgrieztā versija, ko 2016, gadā radīja Endijs Kotgreivs (Andy Cotgreave).

Avots

Tajā stabiņi “aug” uz augšu un izvēlētā krāsa ir zila. Virsraksts vēsta “Irāka: nāves samazinās” (Iraq: Deaths on the decline). Dati tie paši, vēstījums pavisam cits. 

Paplašinot apvārsni

Iesakām noskatīties Alberto Kairo (Alberto Cairo), Majamī universitātes Datu vizualizācijas profesora, prezentācijas ierakstu, kurā viņš stāsta par to, kā “grafiki mums melo”.

Kairo vēstījums ir, ka datu vizualizācija parāda tikai to, ko tā parāda, bet cilvēki mēdz tās interpretēt sev izdevīgos veidos. Viņš mudina veidot labus grafikus, kas veicina diskusijas un izvairīties no sliktām vizualizācijām, kas tās traucē. Izmantojot piemērus, Kairo paskaidro, kāpēc pieņēmums, ka grafiks spēj “parādīt vairāk nekā 1000 vārdu” vai ka “dati runā paši par sevi” ir kļūdains. 

Viņš uzskaita sešus kognitīvos izaicinājumus, kas traucē mums uztvert datu vizualizācijas objektīvi:

  1. Tendence saskatīt likumsakarības (patterns) par tad, kad tās ir nejaušas sakritības nevis cēloņsakarības;
  2. Nepietiekama grafiskā datu pratība (igraphicacy). Mums jāspēj grafikus “lasīt” nevis tikai “redzēt”;
  3. Bailes no sarežģītības. Grafiku uzdevums nav vienkāršot, bet gan paskaidrot. Bieži ar vienu grafiku nepietiek. Jāapskata un jāsalīdzina vairāki, lai labāk izprastu parādību;
  4. Tendence ignorēt nenotektību. Dati nekad nav objektīvi. Bieži tie ir nepilnīgi. Tā vietā, lai ignorētu datu nepilnības ir jāizvērš diskusija par nezināmo.
  5. Tiekšanās pēc apstiprinājuma (confirmation bias). Lai pamatotu savu argumentu, mēs izmantojam datus, kas to apstiprina, ignorējot datu nepilnības un neizmērītus ietekmes faktorus;
  6. Racionalizācija. Evolūcijas laikā esam pieraduši uzņemt informāciju, kura mums šķiet pieņemama, un tālāk pārliecināt par to citus. Tā vietā, ir jāmēģina šis reflekss novirzīt spriešanas virzienā, ļaujot mainīt mūsu pasaules skatījumu.

________

Šis ieraksts tapa pateicoties domapmaiņai kas notika Datu skolas 8. augustā rīkotās diskusijas laikā. “Pasaules vēsmas datu vizualizācijā” diskusijas notiek katra mēneša pirmajā nedēļā. Seko līdzi Datu skolas jaunumiem Facebook un Twitter.

Categories
Datu vizualizācija

Biežākās datu vizualizācijas kļūdas

Neatbilstoša grafika izvēle

Katrai datu kopai ir savs atbilstošs vizualizācijas formāts. Visvieglāk ir nokļūdīties, lietojot apļveida diagrammas jeb “pīrāgus”. Ikonisks piemērs, kurā dati, kas piemēroti stabiņveida diagrammai, izmantoti “pīrāgā”, ir FOX News 2012. gada prezidenta vēlēšanu kandidātu reitingu salīdzinājums.

Avots

Vizualizācijas autors, iespējams, atcerējās, ka procentus vislabāk attēlo “pīrāgs”, taču pīrāgs attēlo procentuālo sadalījumu starp kategorijām, kas veido vienu veselumu. Šajā gadījumā procentuālo vērtību summa pārsniedza vienu veselu jeb 100%. To pamanīja konkurenti NBC un izsmēja kanāla darbinieku matemātikas spējas.

Vēl redikālāks piemērs ir šis:

Avots

ALTERNATĪVA, LAI IZVAIRĪTOS NO KĻŪDAS: 

Stabiņu diagramma.

Vēlme grafiku padarīt “interesantāku”

Iemesls neatbilstošai grafika izvēlei bieži ir vēlme padarīt vizualizāciju “interesantāku”, jo stabiņi un līnijveida grafiki visiem ir apnikuši. Zemāk redzamās vizualizācijas autors nolēma “pīrāgus” izmantot, lai attēlotu kā mainījās 10 gadu laikā to organizāciju īpatsvars, kuras uztraucas par klientu noturēšanu un kuras ne.

Avots

ALTERNATĪVA, LAI IZVAIRĪTOS NO KĻŪDAS:

Lai gan paši “pīrāgi” ir izmantoti pareizi  – katrs attēlo divas kategorijas, kas kopā veido 100%. – izmaiņu organizāciju attieksmē laikā vizlabāk parādītu līnijveida grafiks. 

Tumšā līnija ar svārstībām tiecas uz augšu, bet gaišā – uz leju. Ir skaidri redzams, ka pēc 2012. gada to organizāciju, kurām rūp klientu noturēšana, īpatsvars pārsniedza vienaldzīgās. 

Vēlme padarītu grafiku “interesantāku” bieži noved arī pie pārāk radošiem un sarežģītiem vizuāliem risinājumiem. Zemāk redzams ļoti netradicionāls datu vizualizācijas risinājums, kura nolasīšana prasa pamatīgu iedziļināšanos.

Avots

Sarežģīta datu vizualizācija pati par sevi nav kļūda, bet var “pašaut garām” savai mērķauditorijai, kas, iespējams, nevēlēsies iedziļināties.

ALTERNATĪVA, LAI IZVAIRĪTOS NO KĻŪDAS:

Šajā gadījumā jāiekāpj lasītaja “kurpēs” un jāsaprot, kā lasītājs lasa grafiku. Grafiks,kurā leģenda ir garāka par pašu grafiku, noteikti nav labākais risinājums lasītāja uzrunāšanai. 

Pārsātinājums ar datiem

Vēl viena izplatīta vizualizācijas kļūda ir pārsātinājums, kas visbiežāk izpaužas vēlmē attēlot visus pieejomos datus vienā vizualizācijā vai infografikā.

Avots

ALTERNATĪVA, LAI IZVAIRĪTOS NO KĻŪDAS:

Labākais risinājums ir vispirms saprast, kādu ziņu ar šī grafika palīdzību autors vēlas nodot, un attēlot tikai to. Pilno datu kopu var augšuplādēt kādā failu apmaiņas vietnē un hipersaiti pievienot vizualizācijas aprakstā.

Avots

Šādas datu vizualizācijas sastopamas arī Latvijā.

Avots

ALTERNATĪVA, LAI IZVAIRĪTOS NO KĻŪDAS:

Ja datu kopā ir kategorijas, kuru vērtības salīdzinot ar pārējām ir tik lielas, ka pārējās “pazūd”, bieži izmantots risinājums ir iznest “mazos datus” citā grafikā un parādīt to svārstības bez lielajiem izņēmumiem gluži kā caur palielināmo stiklu. 

Turpinājumā vairāki piemēri, kuros grafika kļūdas pavisam vienkārši varētu atrisināt, ja pirms publicēšanas ar vizualizāciju padalītos ar draugiem vai kolēģiem un ļautu vienkārši pārlasīt. Ja teksts ir saprotams un loģisks, tas būs saprotams arī lasītājiem. 

Vizualizācijas rīka ierobežojumi

Zemāk redzamajā vizualizācijā, kas radīta, izmantojot Piktochart, 100% absolventu sadalījumu pa fakultātēm attēlo 99 trijstūrīši, nevis 100. Tas radies, jo autors izmantojis tiešsaistē pieejamos rīkus, nepamanot to ierobežojumus. 

Avots

“WTF” kļūdas

Citreiz datu vizualizācija nemaz nav datu vizualizācija, bet gan skaitļu un vārdu virknējums dažādos fontos un ģeometriskās formās.

Avots

Avots

Sastopama ir arī vizuālo elementu, piemēram, stabiņu garuma, neatbilstība skaitļiem, kas tiem būtu jāattēlo.

Avots

Avots

Dažkārt vizualizācju autori arī neprot vai nevēlas skaitīt.

Avots

Avots

________
Šis ieraksts tapa pateicoties domapmaiņai kas notika Datu skolas 3. aprīlī rīkotās diskusijas laikā. “Pasaules vēsmas datu vizualizācijā” diskusijas notiek katra mēneša pirmajā nedēļā. Seko līdzi Datu skolas jaunumiem Facebook un Twitter.

Categories
Datu vizualizācija

Dzīves audits

Cik bieži mēs skatāmies pulkstenī? Parasti tik nenozīmīgas lietas mūsu aizņemtie prāti izvēlas ignorēt līdz brīdim, kad sākam apzināti pievērst uzmanību un skaitīt. 

Kāda izskatītos mūsu dzīve, ja katru nedēļu apzināti skaitītu un pēc tam apkopotu dažādus mūsu dzīves aspektus?

Tieši tā izdarīja divas informācijas dizaineres, Džordžija Lupi (Giorgia Lupi) un Stefānija Posaveka (Stefanie Posavec) projekta “Dear data” ietvaros. Katru nedēļu diazaineres sūtīja viena otrai pastkartes ar datu vizualizāciju, kas attēloja datus, kas ievākti par kādu tēmu – kartu nedēļu citu.

Izdomāt unikālu tēmu katrai nedēļai gadā nebūt nav viegli. Piedevām, dizainerēm bija arī jāatrod kāds jauns, radošs veids, kā attēlot ievāktos datus tā, lai ilustrācijas neatkārtojas. 

Izrādās, datus var attēlot arī kā notis, ziedus, un visdažādākās ģeometriskās figūras. 

Džordžija attēlo datus izmantojot negaidītas metodes, un dau vākšanas procesā iekļauj neparastus aspektus. 

Vizualizācijā A Week of complaints (sūdzību nedēļa) Džordžija attēlo datus, izmantojot nošu pierakstu, kas atvieglo uztveri un mudina skatītāju domāt par sūdzēšanos kā par mūziku, ko neesam ikdienā raduši darīt.

Vizualizācijā A Week of clocks (pulskteņu nedēļa) Džordžija ir atzīmējusi arī katru reizi, kad centusies neskatīties pulkstenī, bet tomēr ir to izdarījusi.

Stefānija izteiksmīgi darbojas ar krāsām un līnijām dažādās kombinācijās, taču kontrastu atšķirība starp, piemēram, jūraszilo un debeszilo krāsu nav izteikta, un apgrūtina datu salīdzināšanu. 

Vizualizācijā A Week of goodbyes (atvadu nedēļa) vienā kategorijā ir iekļauts gan medijs, caur kuru tika izteiktas atvadas, gan vieta, kur tās tika izteiktas. Ilustrācijas veids kategorijai ir viens, tāpēc skatītājam izpaliek iespēja meklēt likumsakarības starp šiem aspektiem atsevišķi.

Vizualizācijā A Week of laughters (Smieklu nedēļa) Stefānija izmanto vienkāršas formas un notāciju. Apļa izmērs norāda, cik lieli un sirsnīgi bija smiekli.

“Dear data” projekts ir iedvesmojis cilvēkus visā pasaulē sākt vākt un vizualizēt savas dzīves datus , un sūtīt kādam otrā pasaules galā. 

Projekta dibinātājas ir pierādījušas, ka viss, kas vajadzīga, lai veiktu savas dzīve auditu, ir uzmanība un radošums, un nebūt nav nepieciešams maģistra grāds statistikā. 

Categories
Datu politika

Aicinām publicēt valsts un pašvaldību iestāžu darbinieku atlīdzības

Biedrība Datu skola aicina Latvijas Republikas Saeimu steidzami pieņemt jaunus grozījumus Valsts un pašvaldību institūciju amatpersonu un darbinieku atlīdzības likumā, kas, atsaucoties uz Satversmes 100. pantu par vārda brīvību un informācijas atklātību, noteica, ka valsts un pašvaldību institūcijas visām amatpersonām un visiem darbiniekiem aprēķināto atalgojumu un citas naudas summas, kas viņiem pienākas, katru mēnesi publicē institūcijas mājaslapā internetā un glabā to 8 gadus vai nodod augstāk stāvošas institūcijas pārvaldībā, ja institūcija tiek likvidēta. Pieņemot jaunos grozījumus, Saeimai jāņem vērā Satversmes tiesas iebildumus, kas publicēti Latvijas Republikas Satversmes tiesas mājaslapā šeit.

Datu skola atzīst vairāku valsts dibinātu augstskolu darbinieku pieteikumā minētos argumentus par pašreizējās tiesību normas neatbilstību Satversmes 96. pantam, kurā ietvertas tiesības uz privātās dzīves neaizskaramību, un datu aizsardzības prasībām.

Vienlaikus, Datu skola uzver Satversmes 100. pantā nostiprināto cilvēktiesību uz vārda brīvību, tai skaitā informācijas atklātību nozīmīgumu. Datu skola uzskata, ka atvērti dati par visu valsts un pašvaldību strādājošo atlīdzību anonimizētā veidā:

  • Mazinās valsts publisko līdzekļu izsaimniekošanu, veicot nepamatotas prēmiju izmaksas vai uzturot darba vietas, kuru vajadzība ir apšaubāma;
  • Palīdzēs identificēt nepamatotas “nodokļu optimizācijas” shēmas;
  • Veicinās valsts un pašvaldību institūciju konkurenci, tā nodrošinot adekvāti apmaksātas vakances un samazinot nevajadzīgu vakanču skaitu;
  • Radīs sabiedrības izpratni par valsts un pašvaldību līdzekļu izlietojumu cilvēku resursiem, tā veicinot sabiedrības līdzdalību un iesaisti valsts un pašvaldību darbībā.

Datu skola arī norāda, ka ES Vispārīgā datu aizsardzības regulas 23. pants nosaka regulas ierobežojumus. Viens no panta apakšpunktiem pauž, ka regula var tikt ierobežota, lai garantētu “citus svarīgus Savienības vai dalībvalsts vispārējo sabiedrības interešu mērķus, jo īpaši Savienībai vai dalībvalstij svarīgas ekonomiskās vai finanšu intereses, tostarp monetāros, budžeta un nodokļu jautājumus, sabiedrības veselību un sociālo nodrošinājumu.”

Datu skola ir pārliecināta, ka anonimizēta valsts un pašvaldību institūciju amatpersonu un darbinieku atalgojuma publicēšana ir plašākas sabiedrības interesēs, lai veicinātu publisko līdzekļu efektīvu izlietojumu, mazinot nesaimnieciskas rīcības gadījumus.

Categories
Hakatoni

Atvērtie dati palīdz identificēt korupcijas riskus

Sestdien, 2. martā datu analītiķi, korupcijas eksperti, programmētāji un žurnālisti Pretkorupcijas datu hakatona laikā izstrādāja trīs atvērto datu risinājumus, kas palīdzēs identificēt korupcijas riskus un aizdomīgas naudas plūsmas.

Facebook video tiešraides ieraksts ir šeit.

Par labāko tika atzīts rīks, kurš palīdz identificēt aizdomīgus publiskos iepirkumus. Tas ielasa datus no Iepirkumu uzraudzības biroja (IUB) publicētajiem iepirkumiem, un apvieno ar Uzņēmumu reģistra datiem, kas pieejami caur Lursoft datu bāzi. Rīks izceļ tādus iepirkumus, kur piedalījies tikai viens pretendents, gadījumus, kad iepirkuma rezultātā rodas jauns uzņēmums, vai, ja vienīgais uzvarējušais pretindents ir bijis arzemēs. 

Avots

Komandas dalībnieki arī sniedza piemēru, kur Garkalnes pašvaldībā četros no sešiem pašvaldības iepirkumiem uzvarējis to vienīgais pretendents. Uzņēmuma valdē bijis tikai viens dalībnieks – patiesā labuma guvējs, kas savukārt ir piecas reizes ziedojis kādai partijiai. 

Avots

Ar rīka palīdzību žurnālisti varēs ātrāk nonākt līdz korupciju atmaskojošiem stāstiem.

Par otru labāko projektu tika atzīta Valsts kases atvērto datu vizualizācija, kas parāda valsts izdevumus daudz detalizētākā līmenī nekā Finanšu ministrijas Valsts budžeta vizualizācija

Avots

Tāpat grupa izveidoja sarakstu ar izdevumu grupām, kurās, kā apgalvo vizualizācijas veidotāji, ir ērti norakstīt izdevumus bez sīkākiem paskaidrojumiem. 

Trešo vietu ieguva grupa, kas pētīja kā partijām ziedojuši politiķi, valsts un pašvaldību kapitālsabiedrību valdes locekļi un viņu radinieki. Grupa noskaidroja, ka pusi no ziedojumiem, kas 2018. gadā sastādīja aptuveni trīs miljonus eiro, veica 13. Saeimas vēlēšanu kandidāti. Otru pusi sastādīja valsts kapitālsabiedrību valdes locekļi un viņu radinieki. Visvairāk ziedotāju bija saistīti ar kapitālsabiedrībām “Transporta Informācijas Aģentūra”, “SAF TEHNIKA”, “Balcia Insurance SE”, “Megape Īpašumi” un “LATVIJAS MEDIJI”. 

Avots

Plānots, ka astoņās stundās tapušie prototipi tiks attīstīti, lai rezultātā kļūtu noderīgi un pieejami plašākai pilsoniskajai sabiedrībai.

Hakatonu rīkoja Datu skola un Alianse pret korupciju Latvijā. To atbalstīja Ziemeļvalstu Ministru padomes birojs Latvijā, uzņēmumu datu bāze Lursoft, datu vizualizācijas rīks Infogram, kā arī Alianses pret korupciju Latvijā atbalstītāji.

Categories
Datu vizualizācija

Klasiķi – manipulātori

Inovatīvi stāstnieki vai manipulātori – robeža starp abiem datu vizualizācijas klasiķu raksturojumiem izrādās ir šaurāka nekā sākumā šķiet. 

Iespējams labākās statistikas vizualizācijas autors Čārlzs Džozefs Minārds 1869. gadā radīto diagrammu izmantoja kā līdzekli, lai nodotu vēstījumu par to, cik traģisks izvērtās Napoleona kara gājiena uz Maskavu 1813. gadā. 

Gaiši brūnās līnijas platums parāda karapulka lielumu, līniju virziens – karapulka ģeogrāfisko pārvietošanos, bet temperatūras atzīmes liek nojaust, ka daļa karapulka nebija gatava aukstam klimatam.

Kartē neparādās nedz karavīru nāves iemeslu statistika, nedz precīza ģeogrāfisko vietu atrašanās, taču tas netraucē uztvert gaiši brūnās līnijas bravūru un melnās līnijas kaunpilno un traģisko sagrāvi.

Līdzīgs stāsts ir arī ar britu fiziķa Džona Snova karti, kas parāda holēras izraisītos nāves gadījumus Soho rajonā Londonā.

Snovs izmantoja karti, lai pārliecinātu vietējās autoritātes slēgt Broudstrītas ūdenspumpi, kas kartē tik skaidri parāda likumsakarību starp nāvju skaitu, atrašanās vietu un ūdenspumpja tuvumu. Lai gan karte šķiet ļoti ticama, neviens nezina, vai arī pats Snovs holēras izplatības cēloni atklāja ar tās palīdzību. Nav arī zināms vai karte atspoguļo visus holēras nāves gadījumus un vai likumsakarība būtu tikpat neapstrīdama, ja kartē tiktu attēloti arī citi Londonas rajoni. Veiksme vai zinātniskā metode, bet Snovam izrādījās taisnība, kas tagad ļauj viņu dēvēt par mūsdienu epidemoloģijas pamatlicēju.

Dāma ar lukturi, Florence Naitingeila arī savā ziņā manipulēja ar datu vizualizāciju cēla mērķa vadīta. Lai uzlabotu higiēnu britu armijā, 1855. gadā viņa nolēma izmantot iespaidīgu diagrammu, kas parādīja britu kareivju patiesos nāves iemeslus Krimas kara laikā Turcijā, un ļāva pārliecināt autoritātes Londonā uzlabot higiēnas apstākļus.

Diagramma atspoguļo nāves iemeslus pa mēnešiem. Zilie laukumi ir infekciju izraisītās nāves, sarkanie – ievainojumu izraisītās nāves un melnie – visi citi nāves iemesli. 

Laikā, kad tapa Naitingeilas slavenā vizualizācija skotu inžinieris Vilijams Plejfērs jau bija izdomājis gan stabiņveida, gan apļveida diagrammas. Izmantojot stabiņveida diagrammu, zilie laukumi nebūtu tik lieli. Naitingeila visticamāk apzinājās, ka Ierastajā koordinātu plaknē viens ir tikpat liels gan lejā pie nulles atzīmes, gan stabiņa virspusē, savukārt radiālā plaknē laukums ko aizņem viena vienība pie centra ir daudz mazāks nekā laukums, ko aizņem vienība rādiusa galā. Lai gan apaļa, diagramma arī nevarētu būt klasiskā apļveida diagramma, jo tā nespētu vienlaicīgi parādīt gan nāvju iemeslus gan to sadalījumu pa mēnešiem.

Mūsdienās, vairojoties sabiedrības datu pratībai, šāda manipulatīva vizualizācija visdrīzāk izpelnītos bargu oponentu kritiku, taču Naitingeilai palīdzēja panākt pozitīvas pārmaiņas veselības aprūpē un saglabāt daudzu cilvēku dzīvības tieši sava vienkāršā, pastiprinātā vēstījuma dēļ.

________

Šis ieraksts tapa pateicoties domapmaiņai kas notika Datu skolas 6. februārī rīkotās diskusijas laikā. “Pasaules vēsmas datu vizualizācijā” diskusijas notiek katra mēneša pirmajā nedēļā. Seko līdzi Datu skolas jaunumiem Facebook un Twitter.

Categories
Hakatoni

Aicinām pieteikties Pretkorupcijas datu hakatonam 2. martā

Žurnālisti, pilsoniskie aktīvisti, programmētāji, datu analītiķi, un citi interesenti līdz 28. februārim ir aicināti pieteikties Pretkorupcijas atvērto datu hakatonam, kas notiks 2. martā plkst. 9.00 – 19.00 Rīgā. Hakatonu rīko Datu skola un Alianse pret korupciju Latvijā.

Šogad hakatons veltīts pretkorupcijas tēmai. Dalībnieki hakatona laikā meklēs korupcijas riskus un aizdomīgas naudas plūsmas. Lai to darītu, tiks izmantoti Iepirkumu uzraudzības biroja, Uzņēmumu reģistra un Saeimas atvērtie dati, kā arī citi atvērto un publisko datu avoti, piemēram, KNAB partiju ziedojumu un dāvinājumu datu bāze un VID informācija par valsts amatpersonu ienākumiem.

Aicinām žurnālistus un pretkorupcijas aktīvistus piedalīties hakatonā ar savām idejām un ekspertīzi, savukārt programmētājus un analītiķus – sniegt savas zināšanas un prasmes, lai atklātu iespējamos korupcijas gadījumus Latvijā.

Datu hakatons ir komandas darbs 8 h garumā. Komandas tiek izveidotas ap konkrētām idejām, un katrs hakatona dalībnieks var pievienoties idejai, kuru kopīgi pilnveidot un realizēt ar datu palīdzību. Komandu darba rezultāti var būt gan vizualizācija, datu analīzes rezultātā iegūta ziņa vai interaktīva tiešsaistes lietotne, kas uz Latvijas atvērtajiem datiem ļauj paraudzīties no jauna skatu punkta. 

Ideju autoriem datu hakatons ir iespēja uzrunāt plašāku sabiedrības loku ar datos balstītiem argumentiem, pārbaudīt hipotēzes un radīt materiālu, kas vēlāk var tikt izmantots savos projektos – piemēram, publikācijās vai uzrunājot politikas veidotājus ar datos balstītiem argumentiem.  Savukārt datu entuziastiem  – programmētājiem un pētniekiem – tā ir iespēja strādāt ar sabiedrībā aktuālām projektu idejām un izmēģināt jaunas metodes to apstrādē un vizualizācijā. 

Hakatons notiek Starptautiskās atvērto datu dienas ietvaros. Šogad tā ir veltīta atvērtās zinātnes datiem, sabiedriskās naudas plūsmas analizēšanai, atvērtajiem ģeotelpiskajiem datiem, kā arī atvērtajiem datiem par vienlīdzīgu attīstību (equal development).

PIETEIKUMA ANKETA IR ŠEIT.


Šis ir jau piektais Datu skolas organizētais hakatons. Pirmais hakatons notika 2016. gadā. Tā rezultātā nedēļas laikraksts “Sestdiena” publicēja rakstu par Saeimas deputātu balsojumiem, parādot, cik vienoti vai nošķirti savos balsojumos ir koalīcijas un opozīcijas deputāti. Savukārt laikraksta “Ir” žurnāliste, pateicoties hakatona laikā tapušam risinājumam, no Valsts ieņēmumu dienesta Valsts amatpersonu deklarāciju datu bāzes ieguva datus par policistu ienākumiem, kas atklāja “bagātos policistus”. Pateicoties otrajam datu hakatonam neilgi pirms pašvaldību vēlēšanām 2017. gadā, laikraksts Diena publicēja interaktīvu rīku, kas ļāva apskatīt iepriekš ievēlēto pašvaldību deputātu sēžu apmeklējumu statistiku. 

Tāpat iedvesmai var aplūkot Velodatu projektu, kurš norisinājās 2016. gada maijā, lai atklātu velosipēdistu izmantotos ceļus Rīgā.

Hakatonu rīko Datu skola un Alianse pret korupciju Latvijā ar mērķi vairot atvērto datu izmantošanu demokrātijas procesu veicināšanai.

Datu skola ir nevalstiska organizācija, kuras mērķis ir vairot datu pratību tādejādi veicinot lēmumu pieņemšanas kvalitāti Latvijas sabiedrībā.

Alianse pret korupciju Latvijā ir brīvprātīgs, neformāls sadarbības veids starp publiskā sektora iestādēm, uzņēmējiem un iedzīvotājiem, kas vēlas Latviju veidot kā godīgu un no korupcijas brīvu valsti. Aliansi koordinē “Sabiedrība par atklātību – Delna”. 

Pasākumu atbalsta Ziemeļvalstu Ministru padomes birojs Latvijā un Alianses pret korupciju Latvijā atbalstītāji.

Categories
Datu stāsti

Vai lietus paredzēs salnas? Ticējumi vs dati

Vēl šodien vieni no biežāk piesauktajiem latviešu tautas ticējumiem ir saistīti ar karstāko sarunas tematu – laikapstākļiem. Lietus Jāņos ļaujot paredzēt turpmāko vasaru, Meteņi – Lieldienu laika prognozi, bet ko stāsta dati? Citu datu hakatonā kopā ar Meteo.lv ievāktajiem laikapstākļu datiem šķetinājām ticējumus un mēģinājām rast jaunus, balstoties datos. 

Lai tiktu pie rezultāta, tika izmantoti dati, kas iever gaisa temperatūras, nokrišņu daudzuma un sniega segas biezuma diennakts novērojumus no 11 novērojumu stacijām, kas pārklāj visu Latvijas teritoriju, par laika periodu no 2001. līdz 2016. gadam.

Jāņi un vasara

Līst kā pa Jāņiem! Un tomēr, plānojot savas saulgriežu brīvdienas nomoka jautājums par to, kāds laiks gaidāms. Tāpat kā visu atlikušo vasaru. Vai sausi Jāņi tiešām bijuši saistīti ar to, ka vasara plānojas lietaina, kā to vēsta ticējums? Rīgā un Skrīveros biežāk tiešām tā arī ir bijis. 

https://lh6.googleusercontent.com/g5GhNrCT4o1XnmDbcdHQ_zPvnXPhIyKHfeEeTLehftBKgdkjHjwUQYREZvdA-G_qSZr3QKc8EqWNj404CSQ-Oc9zOvrIPHITa0A4HwnkTWzeapNr4E1yp-gBOb-9GDr0--7wf1kPsIU

Biežums, kad ticējums piepildījies, laikā no 2001. līdz 2016. gadam, %

Meteņi un Lieldienas

Latviešu ticējums vēsta, kad ap Pīrāgiem (Meteņiem) jumti ir balti ar jaunu sniegu, ap Lieldienām būs arī balti ar jaunu sniegu.  Kā var redzēt Alūksnē salīdzinājumā ar Liepāju pagātnē šis ticējums izrādījies patiess krietni biežāk. 

https://lh3.googleusercontent.com/byR4ilED2u0g5T8Qt6vCYcG9oJWnu2kEwEz9kURAxCxt183PgkykEqb7HrA3TJKS7CrLK1NVOJwAYDnwYA7wbKreiEvzSB5cfLpPjbOHaoy1xRAazJVrPmXswL-u4yi2ef2Vy3UgWy4

Biežums, kad ticējums piepildījies, laikā no 2001. līdz 2016. gadam, %

Katrīnas un Andreji

Katrīnas un Andreji apveltīti dažādiem ticējumiem, tāpēc apskatījām divus. 

Ja Katrīnas dienā salst, tad Andreja dienā līs lietus. Šāda pieredze bijusi visbiežāk Kolkā, bet retāk abās apdzīvotākajās Latvijas pilsētās – Rīgā un Daugavpilī. 

https://lh6.googleusercontent.com/gUoWJ6hqwM0B1yXRarLid-9fnH_lgd9-YTIJ-5pR6ev9dBPVDmVq_aFzNMLayhDqSQ3e9ZQfOFee41_IWuqppuUreY0_gxbRVAzBF64hcnODEsudXAkJJkAVqMP4_Qc_NX_hgaUk5G4

Biežums, kad ticējums piepildījies, laikā no 2001. līdz 2016. gadam, %

Bet, ja Katrīnas dienā līst, tad Andreja dienā būs salna. Šādu ticējumu visbiežāk varēts novērot tieši Latvijas austrumos, bet izteikti – Alūksnē un Daugavpilī. 

https://lh3.googleusercontent.com/6RLPSD7x1IM8NChzx4DrSXAjR_QFuYYNPCT6QvhOrDxahcW6BamQ3NbrLUoDThLoMAYZqQJdgAwvPvrHNsb6osVtBvxtwBfIuzi8wMo4fgXjFAP5szalSEcXhlY6X6rrUvjjCXHTICA

Biežums, kad ticējums piepildījies, laikā no 2001. līdz 2016. gadam, %

Bet vai ir ticējumi, kas piepildās?

Pieņemot, ka latviešu ticējumi balstās dabas parādību novērojumā, kur netiek meklēts cēlonis, bet kopsakarības, meklējām arī modernos ticējumus, saskatot dažādu parādību saistību,  šoreiz mūsu iecienītākajā veidā – balstoties datos, kas pieejami Centrālās statistikas pārvaldes mājaslapā.  

https://lh3.googleusercontent.com/rDQqBSWUw5pG4sGZSl2ysOfq84aRHt_pNijYQml1EfIpXCryevju3Ku_UyGjZ6cPsgiQWYZ17SS4Lcd5pzu7ns-V2PXSc1CWWHviWlOA_QRd2gMV7KoUM8xZ9MfP0LMWamInDMGMx2Q
https://lh6.googleusercontent.com/F9IVkjEgs3M6KKi2kWbdykCgPql5dA4xEJN65kaIBjOmZ3UV2ZifN4Iq3ywyvklwLqlabJr2RfXE3OIvjMqYcgR2eCkSyo54ewmk9vLxH2OH0khp776KrzCYMPq6PdG4FyXnwedRuxQ
https://lh5.googleusercontent.com/fakKDRvyeDDjZJnn2pehbb5oAAt2E0v8-TDueR83ejpUskUc0_q0YOXo7JqAtIuH7UPDfkhNNIinZ4GSH80r2H6ttY-uOQCWy4pjDXogonQoc5p0cdY2HExuHaSoiwEo0u0F6bvDW_I

Tātad – vai ticējumiem sekot?

Atbilde pavisam īsa – atkarībā, kurā vietā dzīvo. Kā atklājām ar datu palīdzību, tik tiešām ir Latvijā reģioni, kur tautas ticējumi par laikasptākļiem piepildījušies bieži. Tomēr tāpat kā otrās daļas “modernos” ticējumus, aicinām pieņemt skeptiski un labāk ieklausīties laika ziņu prognozē. 

Categories
Hakatoni

Citu datu hakatona uzvarētāji pārbaudījuši, vai gadskārtu tautas ticējumi piepildās

Sestdien, 11. novembrī “Citu datu hakatona” laikā tapa pieci radoši datu projekti. Veiksmīgākais no tiem pēc pašu dalībnieku domām bija projekts, kas gadskārtu tautas ticējumus salīdzināja ar vēsturiskiem laikapstākļu datiem. 

Rezultātā pierādījās, ka, piemēram, ticējums “kad ap Pīrāgiem (Meteņiem) jumti ir balti ar jaunu sniegu – ap Lieldienām būs arī balti” 81% gadījumā piepildās vien Alūksnē. Arī teiciens “līst kā pa Jāņiem” lielākajā Latvijas daļā izpildās aptuveni pusē gadījumos. Komandai izdevās uzģenerēt arī jaunus, modernākus ticējumus. Piemēram, ja pieaug 1996. gada automašīnu skaits, jābūt siltam gadam, vai, ja daudz sieviešu studē veselības aprūpi un sociālo labklājību, būs daudz lietainu dienu. Šie ticējumi radušies, iedvesmojoties no projekta “Nepatiesa korelācija”, kas automātiski atrod līdzīgas tendences savstarpēji nesaistītās datu kopās.

Otrās vietas ieguvēji izstrādāja tehnoloģiju, kas palīdz digitālos attēlos atpazīt sniegu un miglu, tādā veidā automātiski fiksējot faktiskos laikapstākļu novērojumus. Šo tehnoloģiju var pielietot, piemēram, sociālajos tīklos atrodamajiem attēliem, tā iesaistot sabiedrību automatizētā laikapstākļu fiksēšanā.

Cita hakatona grupa strādāja pie idejas, kā izveidot vietni, kurā brīvi pieejami būtu valsts finansēto pētījumu izejas dati. Grupas dalībnieki secināja, ka šobrīd tie paliek pašu pētījumu veicēju “atvilktnēs”. 

Vēl kāda grupa strādāja pie iespējas izstrādāt mobilu lietotni longbordistiem, skrituļdēļu un skrituļslidu, jeb “mazo riteņu” lietotājiem, kas parādītu braukšanai piemērotāko maršrutu vadoties no ielu segumu kvalitātes.

Hakatona laikā tika strādāts arī ar sociālo mediju datiem, lai izveidotu metodi, kas palīdzētu atpazīt tēmas, par kurām Twitter runā tā dēvētie “troļļu” konti. 

“Citu datu hakatonā” piedalījās programētāji, datu analītiķi, pētnieki un mākslinieki. Tas notika pasākuma galvenā atbalstītāja Tele2 apvienotā servisa centra telpās. 

Pateicamies par dalību un pasākuma atbalstu arī Latvijas Vides, ģeoloģijas un metereoloģijas centram un kim? Laikmetīgās mākslas centram.