Projekti
Iesaisties
Blogs
Par mums
Kontakti
← ATPAKAĻ

Mašīnmācīšanās bez koda: Nekustamā īpašuma darījumu vērtību paredzēšana

2026-01-30

Vakar viesojāmies Valsts zemes dienestā (VZD), kur pārraidījām demonstrāciju “no-code” risinājumam, kā ar uzraudzītās mašīnmācīšanās palīdzību uztrenēt modeli, kas prognozē dzīvokļu darījuma cenu. Izmantojām VZD atvērtos datus par darījumiem ar telpu grupām pēdējos desmit gados. Datu kopa bija liela, tāpēc Aivis atlasīja tikai darījumus Cēsu novadā. Tādu bija vairāk nekā 1’400.

Orange ir uz Python balstīts bezmaksas atvērtā koda vizuālās programmēšanas rīks, kas ļauj ātri un interaktīvi izpētīt datus, sagatavot datu kopu tālākai analīzei un pielietot gatavus mašīnmācīšanās algoritmus. Skan lieliski, taču rīka galvenais trūkums ir veiktspēja. Aivis būtiski samazināja analizējamo ierakstu skaitu, lai rīks “neuzkaras”.

No otras puses, Aivis paskaidroja, ka datu daudzums nav izšķirošais kritērijs, lai izveidotu precīzu modeli. Tikpat svarīga ir izpratne par analizējamajiem datiem un tas, cik pateicīga datu kopa ir modeļu trenēšanai. Šī iemesla dēļ pirmais solis bija izprast datus un tikt vaļā no mainīgajiem (features), kas savā starpā pārāk korelē jeb ir mijsakarīgi (jā, Aivis iemācīja mums jaunu vārdu). Izrādās šādi mainīgie dažiem uzraudzītās mašīnmācīšanās modeļiem nepatīk. Tāpat tikām vaļā no būtiskiem izlecējiem (outliers). Piemēram, datu kopā bija viens darījums par 10 eiro un viens par vairāk nekā 300’000 eiro. Abus šos darījumus Aivis izņēma, lai neietekmētu modeļa precizitāti. 

Pēc datu sagatavošanas, Aivis tos sadalīja divās kopās – trenēšanas un testēšanas kopās. Šo sadali viegli veic Orange “vidžets” jeb gatava funkcija. Tad Aivis ar vieglām peles kustībām pieslēdza vairākus uzraudzītās mašīnmācīšanās modeļu vidžetus – lineāro regresiju, “Random forest”, neironu tīklu un citus. Galvenais bija saprast, cik precīzi modeļi spēja paredzēt darījuma summas. To palīdzēja izprast vairāki validācijas rādītāji, dažus no kuriem Aivis izskaidroja (video sākot ar 53. minūti). Piemēram, Aivis paskaidroja, ka RMSE, ko iegūst izvelkot kvadrātsakni no MSE rādītāja, ir “skarbāks” kļūdas noteikšanā nekā MAE, ko iegūst no darījuma vērtības atņemot prognozēto vērtību un aprēķinot vidējo aritmētisko no iegūtajām absolūtajām starpībām.

Rezultātā uztrenētais modelis salīdzinoši precīzi paredzēja divus no četriem darījumiem, ko Aivis ievietoja paredzēšanas kopā. Diez ko precīzi nesanāca. 

Taču precizitāti katrs var mēģināt uzlabot pats, izvēloties atbilstošākos darījuma vērtību ietekmējošos mainīgos un mašīnmācīšanās modeļus. Aivis sagatavoja Google Drive mapi, kurā ir gatavi Orange projektu faili un sagatavotie dati. Demonstrācijas video ieraksts pieejams YouTube: https://youtu.be/sR4yHNXvBWY

Dodiet mums ziņu, kā jums veicās. 

Pateicamies VZD par atbalstu. Uz tikšanos nākamajās domapmaiņās un demonstrācijās! Sekojiet līdzi ziņām par nākotnes pasākumiem mūsu Facebook un X kontos.

DATU
SKOLA
Datu skola ir daļa no
SCHOOL OF DATA
Pierādījumā ir spēks!

Datu skola ir te, lai žurnālisti, nevalstisko organizāciju aktīvisti, un citi sabiedrības locekļi iegūst spējas efektīvi strādāt ar datiem.