
Velike internetske platforme u Europskoj uniji moderiraju svoje sadržaje u skladu sa zakonom i obrazloženja svih svojih odluka objavljuju u jedinstvenoj bazi podataka. Ipak, praksa pokazuje da je stvarna transparentnost te baze podataka još uvijek uvelike manjkava.
Donošenjem Akta o digitalnim uslugama (Digital Services Act, DSA) Europska unija napravila je temeljni iskorak u reguliranju velikih internetskih platformi (very large online platforms, VLOP-ovi), kako bi pojačala odgovornost platformi, zaštitu korisnika i nadzor nad moderiranjem sadržaja.
Baza podataka o transparentnosti DSA pritom predstavlja jedan od najambicioznijih instrumenata DSA-a, jer je zamišljena tako da omogućava javni, centralizirani i kontinuirani uvid u sve odluke platformi o uklanjanju, o ograničavanju i o označavanju nezakonitih ili štetnih sadržaja (DSA, čl. 24. st. 5.).
Međutim, unatoč neospornoj važnosti Baze podataka o transparentnosti DSA, njena implementacija, otkako ju je Europska komisija pokrenula 26. rujna 2023., i dalje pokazuje niz slabosti. Ona u praksi ne omogućava cjelovitu smislenu transparentnost, upitna je kvaliteta informacija i podataka koju pruža, te je tako dizajnirana da je teško upotrebljiva bez velikih resursa i visoke stručnosti, naročito iz perspektive šire javnosti.
1. Samoinicijativno – platforma sama uklanja nezakoniti sadržaj nakon što ga prepozna pomoću svojih algoritama i mjera koje je poduzela na temelju procjene sistemskih rizika.
2. Po nalogu nadležnih nacionalnih institucija, u Hrvatskoj primjerice MUP-a. Platforma je obavezna po tome postupiti i obavijestiti HAKOM.
3. Po dojavi pouzdanih prijavitelja - kako ne postoji centralno tijelo koje bi pratilo sve nezakonite sadržaje na internetu, postoje pouzdani prijavitelji kojima se ovaj status dodjeljuje nakon njihove prijave HAKOM-u.
1. preko vizualiziranja sažetih podataka na nadzornoj ploči (dashboard),
2. pretraživanjem obrazloženja (search for statements of reasons),
3. preuzimanjem agregiranih paketa podataka (download),
4. preko istraživačkog API-ja baze, namijenjenog prvenstveno tehnički potkovanim korisnicima,
5. preko DSA-TDB paketa podataka za istraživače, osmišljenog prije svega za akademske i visoko-tehničke analize, a ne za širu javnost.
Pretraživanjem ove baze podataka vrlo brzo se uočavaju problemi koji neke analize u startu onemogućavaju. Primjerice, u obrazloženjima rješenja u kategoriji teritorijalni opseg vrlo rijetko se označava samo jedna članica EU-a. Najčešće je riječ o cijelom EU području. Tome bi se barem donekle još i moglo doskočiti selektiranjem obrazloženja po jeziku na kojem je izvorno bio objavljen moderirani sadržaj.
No, kako se u DSA-u ne navodi da platforme u obrazloženjima o razlozima moraju navesti i jezik na kojem je moderirani sadržaj objavljen, objavljivanje jezika varira od slučaja do slučaja, pa selektiranje po toj osnovi ne daje vjerne podatke za analizu.
Primjerice, ako u pokušamo istražiti koliko sadržaja na hrvatskom jeziku su u posljednjih 180 dana moderirale sve platforme ukupno, dobit ćemo rezultat da je riječ o 16.346 obrazloženja. Pregledavanjem sadržaja pojedinih obrazloženja, nećemo pronaći informacije o tome što je doista uklonjeno. Ako, pak, već primijenjenoj selekciji dodamo još i selekciju objava samo na društvenim mrežama VLOP-ova, rezultat će biti da je s njih u posljednjih 180 dana uklonjeno nula sadržaja na hrvatskom jeziku, što znamo da ne odgovara istini.
Pregled agregiranih podataka (dashboard)
Baza sadrži više od 36 milijardi obrazloženja unesenih odluka o moderiranju. Na Dashboardu korisnici mogu filtrirati agregirane statistike svih objava od uspostavljanja baze kroz nekoliko kategorija, ali ne i po jeziku objave, teritorijalnom dosegu unutar EU-a niti po drugim detaljima, što značajno ograničava mogućnosti analize.
Dublju analizu onemogućava i slabo definirana raspodjela obrazloženja odluka unutar kategorija. Oko 30 milijardi obrazloženja navedeno je da spada u kategoriju scope of platform service, približno 3 milijarde smješteno je u kategoriju other violations of providers' terms and conditions, a oko 1 milijarda u illegal or harmful speech. Takva raspodjela jasno pokazuje preklapanje definicija i nejasnoću značenja kategorija, što platformama ostavlja prostor za vlastito tumačenje, a to onda otežava dublju analizu načina na koji se moderira.
Korijen ovog problema je u tome što jedna obrazložena odluka može biti smještena u više kategorija, pri čemu platforma sama odlučuje u koju će kategoriju svrstati pojedini prekršaj. To je izravna posljedica članaka DSA u kojima se navode kategorije, ali se ne precizira kako se trebaju tretirati preklapajući slučajevi. Ova fleksibilnost, zamišljena da platformama omogućava prilagođavanje različitim vrstama sadržaja, zakonima članica i tehničkoj izvedbi, u praksi znači slabo definiranje raspodjela kategorija. Stoga mnoštvo obrazloženja završava u općenitim kategorijama, pri čemu se pojedine kategorije preklapaju; primjerice illegal or harmful speech i other violations.
Takva raspodjela otežava usporedbu, analizu trendova i pouzdano kvantificiranje podataka, i to ne samo kroz ovu opciju nego i kroz sve ostale načine analiziranja sadržaja Baze podataka o transparentnosti.
Pretraživanje obrazloženja s filtriranjem ("search for statements of reasons")
Funkcionalnost DSA baze podataka s najvećim potencijalom transparentnosti je opcija Obrazloženja u kojoj se obrazloženja odluka o moderiranju sadržaja mogu pretraživati po gotovo svim dostupnim dimenzijama: platformi, kategoriji sadržaja, izvoru prijave, teritorijalnom dosegu, vrsti računa, jeziku, vrsti sadržaja te načinu automatizacije odluke.
Ovdje su osnovni problemi to što se u rezultatima pretraživanja paginira i prikazuje samo prvih 10.000 rezultata, a u .csv formatu može se izvesti samo 1000 rezultata.
Istraživački API
Posljedica ovog ograničenja (kroz obrazloženja) očito su bili svjesni i u Europskoj komisiji kad su organizirali bazu podataka. Stoga su već u uputama za korištenje obrazloženja naveli da korisnici zainteresirani za programsko istraživanje, imaju na raspolaganju istraživački API.
No, osim problema s kategorijama, ovdje se kao novi problem pokazuje to što je starost podataka dostupnih na ovaj način, ograničena na samo posljednjih 180 dana. Kao razlog tome u Pravilima o zadržavanju podataka navodi se da je cilj ovog pravila "uravnotežiti potrebu za pristupom informacijama s obvezom zaštite osjetljivih podataka i usklađenosti s utvrđenim pravnim okvirom".
Ovakvo objašnjenje je paradoksalno u svjetlu činjenice da sva obrazloženja odluka u Bazi podataka o transparentnosti DSA ionako ne sadrže nikakve podatke kojima bi bilo moguće identificirati korisnike (bilo fizičke ili pravne osobe ili bilo kakve druge organizacije) koji su objavile moderirani sadržaj.
Uz ovo ograničenje mogući su i takvi slučajevi da neka internetska platforma zbog govora mržnje ukloni sadržaj koji je objavila, primjerice, neka politička stranka, a da obrazloženje te odluke koje dospije u Bazu podataka o transparentnosti - ne sadrži niti o kome niti o čemu je riječ. A unatoč tako rigoroznoj anonimizaciji, tom se obrazloženju 180 dana nakon odluke o moderiranju svejedno ne može pristupiti preko API-ja zbog zaštite osjetljivih podataka.
Preuzimanje paketa podataka ("download")
Stariji podaci se ipak ne brišu. Oni se čuvaju u dnevnim odlagalištima datoteka (daily dumps files), dostupnima korisnicima preko opcije Preuzimanje. Ovdje je vremensko ograničenje podataka postavljeno na pet godina, ali se pojavljuje novi problem. Obrazloženja o moderiranju mogu se pretraživati samo po datumu i platformi, dok ostali kriteriji – jezik, teritorijalni doseg, kategorija ili tip sadržaja – nisu podložni filtriranju prije preuzimanja podataka premda postoje u metapodacima CSV dumpova.
Naknadno filtriranje nakon preuzimanja jest moguće, ali tek nakon što se preuzmu nekad i preko 1 GB teški zipani paketi CSV datoteka, što ih čini iznimno teškima za obradu i filtriranje. Čak i nakon primjene filtera (po platformi i datumu), sustav ne generira novi set, već preuzima standardni dnevni paket i briše redove koji ne odgovaraju kriterijima. Rezultat mogu biti stotine ili tisuće CSV datoteka, većinom praznih ili gotovo praznih, što zahtijeva dodatnu lokalnu obradu i iziskuje velike kapacitete skladištenja podataka.
DSA-TDB package
Baza podataka o transparentnosti DSA kao jedan od načina istraživanja podataka nudi i DSA‑TDB package, istraživački podatkovni paket, dizajniran za visoko tehnički potkovane korisnike i izradu analiza, koji iziskuje i velike tehničke kapacitete. Takve kapacitete nemaju organizacije civilnog društva, što slabi njihovu mogućnost nadzora nad provedbom Akta o digitalnim uslugama.
Ovaj alat omogućava preuzimanje i obradu cjelokupnih podataka iz baze podataka, onakvih kakvi su navedeni u obrazloženjima odluka o moderiranju sadržaja, a to između ostalog znači bez podataka o tome čiji je i kakav sadržaj moderiran. Uslijed toga niti korištenje DSA‑TDB package ne može ukloniti osnovna ograničenja u kvaliteti, dosljednosti i filtriranju podataka.
Zaključak
Sve ovo rezultira formalno otvorenom bazom koja u stvarnosti ne pruža dovoljnu transparentnost i analitičke mogućnosti. Unatoč tome što Baza podataka o transparentnosti DSA pruža vrijedan uvid u trendove i regulatorne prakse, za istraživače i javnost stvarni uvid u moderaciju sadržaja ostaje fragmentiran i tehnički zahtjevan.
Drugim riječima, baza je važan, ali nedovoljno iskorišten alat – pokazuje smjer prema odgovornijim platformama, ali ne omogućuje javnosti da stvarno provjeri, analizira i shvati utjecaj moderacije na sadržaj i korisnike u praksi. Iz perspektive Gonga, koji se zalaže za javnu transparentnost i građansku kontrolu digitalnih platformi, ovo je korak naprijed, ali i upozorenje da formalni instrumenti nisu dovoljni ako nisu i operativno dostupni i razumljivi.
