Projekti
Iesaisties
Blogs
Par mums
Kontakti
← ATPAKAĻ

MI aģentu tests #1 — VID amatpersonu deklarāciju izgūšana

2025-07-28

Autors: Aivis Brutāns, datu zinātnieks, Datu skolas aktīvists

Tirgū ir pieejami daudz dažādi mākslīgā intelekta (MI) aģenti. Tie ir automatizēti risinājumi, kuri autonomi veic lietotāja doto uzdevumu — atrod tīmeklī informāciju, veic [padziļinātu] datu izpēti, sagatavo prezentāciju, rezervē galdiņu restorānā, uzraksa programmēšanas kodu u.tml.

Šajā rakstā notestēju atsevišķus aģentus: kā tie spēj iegūt specifisku informāciju no tīmekļa lapām latviešu valodā.
Uzdevums visiem aģentiem bija vienāds: no VID amatpersonu deklarācijas datubāzes izgūt trīs ministru pēdējā pieejamā gada deklarāciju, taču vispirms tam vajadzēja iegūt šo ministru vārdu un uzvārdu. Uzvedne visiem aģentiem bija vienāda:

Choose any 3 ministers from this list: https://www.mk.gov.lv/lv/ministru-kabineta-sastavs and extract the latest public declaration data (from 2024, or 2023 if 2024 is unavailable) for each of those ministers from this site: https://www6.vid.gov.lv/VAD (in the form fill name and surname, then choose latest available declaration, then extract information from this declaration). Collect this information in a spreadsheet (using separate sheets if necessary).

Tātad uzdevums bija sekojošs:

  1. Ieiet MK mājaslapā, nolasīt tā saturu un izvēlēties trīs ministrus pēc aģenta ieskatiem.
  2. Tad iet uz VID amatpersonu deklarācijas datubāzi, formā ievadīt ministra vārdu un uzvārdu, izvēlēties pēdējo pieejamo deklarāciju, un izgūt visu informāciju no šīs deklarācijas. Darbības atkārtot par pārējiem diviem ministriem.
  3. Deklarācijas infromāciju par trim ministriem apkopot izklājlapā (spreadsheet).

Atsevišķos gadījumos aģents tika instruēts veikt papildu darbības, ja sākotnējā izvedne tam nebija skaidra vai uzdevumu sāka pildīt galīgi garām.

Aģentu vērtēšanas kritēriji

⭐️⭐️⭐️⭐️⭐️ — aģents izpildīja visu uzvednē prasīto (atlasīja 3 ministrus, ieguva šo ministru deklarācijas datus par 2024.gadu (vai 2023.gadu, ja 2024.gads nav), rezultāts apkopots izklājlapā), iegūtais rezultāts pilnībā sakrīt ar VID datiem. Aģents ir izpildījis papildu soļus, kas uzvednē nav norādīts, piem., ir ‘padomājis’ pie rezultāta noformēšanas — rezultātu ir iespējams ērti aplūkot, atlasītā informācija ir viegli apkopojama, ja risinājumu mērogotu ar lielāku skaitu amatpersonu.

⭐️⭐️⭐️⭐️ — izpildīja visu uzvednē prasīto un tie ir precīzi (ir pieļaujamas nebūtiskas atšķirības mazāk kritiskajos datos). Dati apkopoti veidā, kurus būtu neērti apstrādāt, ja risinājumu mērogotu ar lielāku skaitu amatpersonu.

⭐️⭐️⭐️ — MI aģents spējis atlasīt vismaz 2 ministrus un ieguvis vismaz 2 ministru VID amatpersonu deklarācijas datus. Dati lielākoties ir pareizi, bet daži kritiskie (ieņēmumi, izdevumi u.tml.) ir kļūdaini.

⭐️⭐️ — MI aģents atlasījis vismaz 1 ministru un ieguvis vismaz 1 ministra deklarācijas datus. Nav atlasīti visi deklarācijas dati, vai ir atlasījis par senāku periodu (pat ja ir pieejams jaunāks).

⭐️ — MI aģents spējis atlasīt ministru sarakstu (ieguvis 1 līdz 3 ministru vārdus un uzvārdus), bet nav varējis iegūt VID amatpersonu deklarācijas datus. Vai ir atlasījis deklarācijas datus, bet kritiskie dati ir tik kļūdaini, ka tos nav iespējams izmantot.

Vērtējums bez ⭐️nozīmē, ka aģents neko nav mācējis izdarīt.

Aģentu testēšana

Šobrīd esmu notestējis šādus aģentus: ChatGPT Agent mode, Genspark, Manus, MiniMax Agent. Aģentu rezultāti:

ChatGPT Agent Mode

  1. mēģinājums ⭐️⭐️⭐️⭐️

Aģents veiksmīgi tika galā ar ministru atlasīšanu. Problēmas sagādāja formas aizpildīšana — aģents nemācēja ievadīt mīkstinājuma zīmes vai garumzīmes. Visticamāk, ka uz virtuālā datora, kurā darbojas aģents, nav pieejami šie simboli. Bet ar šo šķērsli tas tika galā, meklējot vajadzīgos burtus tīmeklī un tad formā ievadot jau pareizu vārdu/uzvārdu.

OpenAI Agent veiktās darbības var redzēt atsevišķā logā

Datu atlasē aģents pamana, ka dati vēl nav atgriezti (redz, ka rādās t.s. spinner) un tas gaida, kad dati parādīsies.

Galarezultātu aģents ir aprakstījis čatā un pievienojis pieprasīto izklājlapu:

OpenAI Agent galarezultāts

Dati gan apkopoti veidā, kurus grūti būs vēlāk apkopot (piem., saskaitīt ieņēmumu kopsummu u.tml.), tāpēc jau pašā sākumā (uzvednē) būtu jānorāda vēlamais rezultāts. Atsevišķus teksta ierakstus aģents ir pārtulkojis angļu valodā (nevis atstājis oriģinālu), kā arī nav norādījis juridisko personu reģistrācijas numurus — ja šīs lietas ir būtiskas, tad norādi to uzvednē:

Lai gan ir pamanītas dažas kļūdas, ChatGPT aģents ar šo uzdevumu tika galā.

Genspark

1.mēģinājums ⭐️

Ar pilnu soļu izpildi var iepazīties šeit.

Jau sākumā aģents nespēja iegūt ministru sarakstu — tas saskārās ar tehniskām problēmām, nolasot informāciju. Taču tad izlēma MK sastāvu meklēt citādāk — izmantojot tīmekļa meklētāju, bet pēc atkārtotas neveiksmes tas sarakstu, beidzot, ieguva no Vikipēdijas.

Daudz grūtāk gāja ar amatpersonas deklarācijas informācijas iegūšanu: vispirms aģents izmantoja sākotnēji nodefinēto adresi, tad vairākas reizes (ar dažādām frāzēm) meklēja informāciju tīmeklī, tad meklēja informāciju starp dažādiem dokumentiem (National integrity system assessment, Transformation index report). Rezultātā, tas apkopoja informāciju, bez pieprasītās deklarācijas datiem:

1.mēģinājumā vairs necentos to pierunāt, lai sagatavo pieprasīto informāciju. Genspark aģents ar šo uzdevumu netika galā.

Manus

1.mēģinājums ⭐️⭐️⭐

Pilnu soļu izpilde pieejama šeit.

Šis aģents ar uzdevumu tika galā daļēji. Tas jau no paša sākuma spēja iegūt datus no MK mājaslapas (apstriprinot arī cookies) un veiksmīgi ieguva VID deklarāciju datus. Taču trīs ministru vietā tas ieguva informāciju par diviem. Un tas bija VID mājaslapas tehnisko iemeslu dēļ, jo par pēdējo ministru datu izguve no datubāzes bija lēnāka. Aģents negaidīja, kad tiks ielādēts deklarāciju sakrasts un pieņēma, ka datu par šo ministru nav. Tāpēc šim rīkam pirms uzdevuma došanas, ir vērts norādīt, ka šādas tehniskās problēmas varētu būt. Iespējams, ka aģents šo norādi ņemtu vērā un mēģinātu iegūt datus atkārtoti.

Galarezultātā Manus sagatavoja 5 failus:

Manus galarezultāts — tas spēja sagatavot 2 ministru datus (par katru izveidots .md fails) un kopējais rezultāts apkopots Excel darba lapās

Piemērs par vienu no amatpersonām:

Manus aģents ar šo uzdevumu tika galā daļēji.

MiniMax Agent

1.mēģinājums ⭐️⭐️⭐️⭐

Pilnu soļu izpilde pieejama šeit.

Šis aģents ar uzdevumu tika galā pilnībā. Pēc uzvednes nodefinēšanas tas sagatavoja darāmo darbu sarakstu (todo.md) un pēc saraksta precizēšanas, tas izveidoja izpētes plānu (research_plan_latvian_ministers.md) un turpināja darbu pie datu iegūšanas. Līdzīgi kā Manus un ChatGPT Agent, arī šis aģents saskārās ar tehniskajām problēmam, izgūstot datus no VID lapas, taču ar to tika galā:

Datu iegūšanas procesā rīks saskārās ar VID amatpersonu deklarācijas lapas tehniskajām problēmām, taču ar to tika galā — mēģinot iegūt datus atkārtoti

Galarezultātā MiniMax Agent sagatavoja 16 (!) failus:

MiniMax Agent galarezultāts — tas sagatavoja 3 ministru datus (par katru izveidots .txt un .csv fails) un kopējais rezultāts apkopots Excel darba lapās, kā arī teksta dokumentos (.md, .pdf, .docx)

Pēc galarezultāta redzams, ka tas ir apkopojis nepieciešamo informāciju, taču jāņem vērā sekojošais:

MiniMax Agent rezultāts par vienu amatpersonu. Trūkst juridiskās personas reģistrācijas numurs un visa iegūtā informācija ir pārtulkota uz angļu valodu

MiniMax Agent ar šo uzdevumu tika galā.


Secinājumi

  1. No šobrīd testētiem aģentiem (ChatGPT Agent mode, Genspark, Manus, MiniMax Agent) vislabāk ar uzdevumu tika galā ChatGPT Agent un MiniMax Agent.
    – Genspark
    1. mēģinājumā nespēja iegūt VID deklarācijas datus.
    Tehnisku problēmu dēļ Manus apkopoja informāciju tikai par diviem ministriem.
  2. Ja strādā ar Manus rīku, tad uzvednē norādi, ka tas varētu saskarties ar tehniskām problēmām datu izgūšanā (ja tādas lapai varētu būt). Iespējams, ka rīks tad varētu mēģināt datus iegūt atkārtoti.
    Novērots, ka tas atsevišķus vārdus pārveido, tāpēc jāievieš papildu mehānisms, kas pārbauda šādus gadījumus, vai var mēģināt papildināt uzvedni, lai tas nekādā gadījumā nepārveido tekstu.
  3. Ja strādā ar ChatGPT Agent vai MiniMax Agent, tad norādi, vai vēlies, lai galarezultāts tiktu tulkots uz angļu valodu, ja dati ir latviešu valodā. Kā arī pievērs uzmanību, vai visa informācija ir izgūta. VID deklarāciju gadījumā tas neiekļāva uzņēmumu/valsts iestāžu reģistrācijas numuru.
  4. Ja aģents ir iekļāvis kopsavilkumus, kurā ir saskaitījis ieņēmumus u.tml., pievērs uzmanību, ko aģents dara, kad ieņēmumi ir dažādās valūtās.
  5. Aģenti nav testēti uz gadījumiem, kad VID atgriež vairākas personas ar identisku vārdu un uzvārdu. Pievērs uzmanību, ko aģenti dara šādās situācijās.
  6. Ja ir kāds specifisks formāts, kādā vēlies redzēt galarezultātu, tad norādi to uzvednē.
    Piemēram, Manus par katru amatpersonu informāciju apkopojis atsevišķā Excel lapā un katra deklarācijas sadaļa ir norādīta tā, ka to būtu grūti automatizēt (atšķirībā no MiniMax Agent, kur deklarācijas dati apkopoti 4 kolonnās).
  7. Lai mazāk būtu jāprecizē nākamie soļi, jau pašā uzvednē precīzāk norādi sagaidāmo rezultātu (piem., kādā formātā vai kādā valodā atgriezt rezultātu; kādas vērtības iekļaut/neiekļaut u.tml.).
    Katrs lieks solis tev tērēs “kredītus” aģenta darbināšanai (parasti lietotājiem ir noteikts kredītu skaits, cik vari izmantot aģentu darbināšanā).
  8. Ja datu iegūšana ir jāveic par vairākām personām, tad sāc ar mazu kopu (2–3 personas) — tādā veidā sapratīsi, vai iegūtais rezultāts ir tāds, kādu vēlies, un vajadzības gadījumā varēsi precizēt uzvedni.

Tehniskā informācija

Aģenti testēti sekojošos datumos:

DATU
SKOLA
Datu skola ir daļa no
SCHOOL OF DATA
Pierādījumā ir spēks!

Datu skola ir te, lai žurnālisti, nevalstisko organizāciju aktīvisti, un citi sabiedrības locekļi iegūst spējas efektīvi strādāt ar datiem.