Uncategorized

Manipulācija ar datiem: aina, ko paver aisberga neredzamā daļa

datu skola_ass no nulles

Attēli pasaka vairāk nekā 1000 vārdu, taču ne vienmēr situāciju atspoguļo patiesi.

Nesen sociālajos tīklos redzējām Re:Baltica video, kur vizualizētie skaitļi attēloja lielāku starpību, nekā patiesībā.

datu skola_ass no nulles

Zaļā līnija uz stikla vāzēm atzīmē stabiņu proporciju, ja vertikālā ass būtu sākta no nulles. Autors: Ritvars

Arī 7. februārī Nila Ušakova lapā publicētais grafiks par siltuma tarifiem lielākajās Latvijas pilsētās rādīja daudz dramatiskāku ainu, nekā tā ir realitātē. Kā tas tika panākts?

datu skola_y ass no nulles

Attēls parāda, kā grafikam būtu jāizskatās, ja vertikālā ass sākots no nulles. Labā prakse ir arī atzīmēt datu avotu. Avots: Datu skola

Vertikālās ass mērogs

Stabiņveida diagrammā tā vienmēr būtu jāsāk no nulles. Ja vertikālā ass nesākas no nulles, to būtu nepārprotami jānorāda, tomēr šeit (apzināti vai ne) tiek radīts maldīgs iespaids, ka Rīgas siltumenerģijas tarifs ir vairākas reizes zemāks nekā Cēsu.

Stabiņu diagrammās iesakām nekad neizmantot ne-nulles sākumpunktu vertikālajai asij.

Bet tas vēl nav viss.

Ko dati mēģina pateikt?

Rīgas Domes gadījumā datu vizualizācija tiek izmantota, lai argumentētu par labu noteiktas partijas darbam pilsētas domē. Tomēr jāņem vērā, ka pašvaldības ietekme uz siltumenerģijas tarifiem ir ierobežota. Kā skaidro SPRK – dažādās apdzīvotajās vietās tarifi atšķiras, un šīs atšķirības nosaka pakalpojumu sniegšanas nosacījumi:

  • izvēlētie siltumapgādes sistēmas tehnoloģiskie risinājumi;
  • siltumapgādes sistēmas kompaktums un tās tehniskais stāvoklis;
  • katras apdzīvotās vietas ģeogrāfiskās u.c. īpatnības (reljefs, apbūves blīvums, siltumapgādes lietotāju daudzums utt.).

No šiem nosacījumiem ir atkarīgas pakalpojuma sniegšanas izmaksas, kas ir nepieciešamas, lai pakalpojumu varētu nodrošināt. Tā, piemēram, Rīgas siltumenerģijas tarifu ietekmē AS “Latvenergo” Rīgas TEC darbības subsidēšana, izmantojot obligātā iepirkuma komponenti (OIK), kas būtiski samazina tarifus.

Ko dati īstenībā pasaka?

Jāņem vērā, ka iedzīvotājiem maksa par siltumenerģiju nereti tiek aprēķināta par kvadrātmetru, nevis katra dzīvokļa patērēto siltumenerģijas MWh, tādēļ zemākas MWh izmaksas vēl nenozīmē zemāku apkures rēķinu. Piemēram, renovētā mājā patērētais siltuma MWh apjoms būs zemāks, nekā nerenovētā, kā rezultātā arī ar augstāku MWh cenu apkures rēķins var būt zemāks (kā iepriekš skaidrojām – patiesībā siltumenerģijas cenas Latvijā tik būtiski kā grafikā mēģināts attēlot neatšķiras).

Labākam ieskatam tajā, kas patiesībā veido siltumenerģijas izmaksas, piedāvājam Delfi.lv rakstu.

It's only fair to share...Share on Facebook0Share on Google+0Tweet about this on TwitterShare on LinkedIn0

7 Comments

  1. Rūdolfs

    Ar to nulli jābūt uzmanīgam. Kad grafikos attēlo laika prognozes, ordināte nemēdz sākties no absolūtās nulles, jo tas arī būtu maldinoši (lai gan tehniski tas būtu korekti). Ja šodien Latvijā temperatūra paaugstinātos par 15%, nebūtu vis sals, bet svelme.

    Tāpēc lai saprastu, kā attēlot PISA testu rezultātus, vispirms jāpajautā, ko nozīmē 0 un vai tā maz ir jēgpilna vērtība? No vikipēdijas raksta par šo testu sanāk, ka vidējais pa kategorijām ir 500 (vismaz sākumā), un viena standartnovirze ir 100 punkti. Šādā situācijā rezultāts 0 ir teju neiespējams un par bāzi likt 0 būtu maldinoši.

    Vienā standartnovirzē (PISA 400–600 punktu) ietilpst 68,2% populācijas. Jeb 400–500 punktos ir 34,2%. Tā uz aci novērtējot, intervālā no [465;510] ir kādi 20% populācijas (piedodiet, Lapiņas kundze, ka nepietiekami klausījos statistikas lekcijās un nevaru izrēķināt precīzi). Šie nav 20% Latvijā, šie ir 20% pasaulē. Starpība ir liela.

    Vieglāk šos datus būtu saprast, ja tos salīdzina ar citu valstu vidējiem rādītājiem. Tātad, matemātikā ap 465 punktiem ir Izrēlai, Grieķijai un Horvātijai, bet 510 kaimiņos ir Austrija, Vjetnama un Vācija. Diemžēl par šo valstu matemātikas zināšanām mēs neko nezinām, tāpēc arī šis salīdzinājums nekam neder.

    Bet skaitļus vieglāk saprast ir, ja paskatās, kādi ir maksimumi un minimumi, piemēram, matemātikā Peru ir 360 un Ķīnai ir 613.

    • Andis

      Paldies, ļoti labs skaidrojums. Bet tieši tāds arī pietrūkst šim video. Nezinot PISA testa punktu sadales intervālu var rasties maldīgs priekšstats. Varbūt pareizāk būtu bijis runāt procentuāli vai pievienot papildus skaidrojumu

    • Mārcis

      Paldies Rūdolfam! Tieši šādu komentāru grasījos rakstīt.

  2. Rūdolfs

    Parakos tālāk par tiem PISA punktiem. Plašāks izklāsts manā blogā https://rmazurs.wordpress.com/2017/02/08/vai-rebaltica-salaida-deli-pisa-testu-vizualizaciju-ne-gluzi/ kopā ar labākas ilustrācijas piemēru.

  3. jānis

    nočekojiet mele2 4g reklāmu, kur bite ir proporcionāli pagarināta un lmt par mm samazināts, lai lmt starp abiem konkurentiem izskatītos mazāks tuvāks bitei, bet realitātē datu ātrums lmt un mele2 ir līdzīgi, atmetot bites stabu uz pusi.

    • datuskola

      Prasītos pēc attēla, mums izskatās ka tele2 reklāmā viss ir kārtībā.

Leave a Reply

Theme by Anders Norén