Meta vēlas uzlabot Vikipēdiju ar mākslīgā intelekta atjauninājumu

Wikipediai problema

Wikipediai ir problema. Un Meta, kas nav pārāk sen pārdēvēts Facebook, varētu būt atbilde.

Apskatīsim tuvāk

Wikipedia ir viens no lielākajiem sadarbības projektiem cilvēces vēsturē, kurā piedalās vairāk nekā 100 000 brīvprātīgo redaktoru, veidojot un uzturot milzīgu daudzvalodu enciklopēdiju, kas sastāv no miljoniem rakstu. Katru mēnesi Wikipediai tiek pievienoti vairāk nekā 17 000 jaunu rakstu, kamēr esošajiem rakstiem nepārtraukti tiek veiktas izmaiņas un uzlabojumi. Populārākie Wiki raksti ir rediģēti tūkstošiem reižu, atspoguļojot visjaunākos pētījumus, atziņas un informāciju.

Precizitātes izaicinājums

Protams, izaicinājums ir precizitāte. Wikipedia pastāvēšana ir skaidrs pierādījums tam, ka liels skaits cilvēku var apvienoties, lai radītu kaut ko pozitīvu. Bet, lai būtu patiesi noderīga un nevis tikai plaša nepamatotu apgalvojumu siena, Wikipedia rakstiem jābūt balstītiem uz faktiem. Šeit noder citāti. Ideja – un lielākoties tas darbojas ļoti labi – ir tāda, ka Wikipedia lietotāji un redaktori var apstiprināt faktus, pievienojot vai noklikšķinot uz hipersaitēm, kas izteikumus atgriež atpakaļ pie avota.

Nepieciešams citāts

Piemēram, ja es gribu apstiprināt informāciju par prezidenta Baraka Obamas Wikipedia rakstu, kur teikts, ka Obama ceļoja uz Eiropu un pēc tam Keniju 1988. gadā, kur viņš pirmo reizi satika daudzus savus tēva radiniekus. Man vienkārši jāapskata teikuma citāti un, protams, tur ir trīs atsevišķas grāmatu atsauces, kas šķietami apstiprina šo faktu.

Pretstatā tam frāze “nepieciešams citāts” ir, iespējams, divi visnogurdinošākie vārdi visā Wikipedijā, jo tie norāda, ka nav pierādījumu tam, ka autors nav izdomājis vārdus no digitālā ētera. Vārdi “nepieciešams citāts”, kas pievienoti Wikipedia apgalvojumam, ir līdzvērtīgi tam, ka kādam stāsta faktu, vienlaikus gaisā veicot pirkstu citēšanas zīmes.

Meta iejaucas

Bet ko darīt, ja citāti tiek pievienoti Wikipedia redaktoru puses, pat ja tie nesasaista ar lapām, kas patiesībā atbalsta apgalvojumus? Kā piemēru var minēt nesen publicēto Wikipedia rakstu par Blackfeet ciltis locekli Joe Hippu, kur aprakstīts, ka Hipp bija pirmais amerikāņu izcelsmes bokseris, kas cīnījies par WBA pasaules smagsvara titulu un saistīts ar šķietami atbilstošu tīmekļa lapu. Tomēr attiecīgajā tīmekļa lapā nebija nekādas informācijas par boksu vai Joe Hippu.

Joe Hippa gadījumā Wikipedia fakts bija precīzs, pat ja citāts bija nepiemērots. Tomēr viegli iedomāties, kā tas varētu tikt izmantots, lai izplatītu maldinošu informāciju.

Sapratne par nozīmi

Apmacīts izmantojot datu kopu, kas sastāv no 4 miljoniem Wikipedia citātiem, Meta jaunais rīks spēj efektīvi analizēt informāciju, kas saistīta ar citātu un pēc tam to salīdzināt ar atbalstošiem pierādījumiem. Un tas nav tikai vienkāršs teksta virknes salīdzinājums.

“Ir komponents kā šis, [skatoties] leksisko līdzību starp apgalvojumu un avotu, bet tas ir vieglais gadījums,” teica Petroni. “Ar šiem modeļiem mēs esam izveidojuši indeksu visiem šiem tīmekļa lapu fragmentiem un sniedzam precīzu katras daļas reprezentāciju … Tas nenozīmē vārdu pa vārdam fragmenta reprezentēšanu, bet gan fragmenta nozīmi. Tas nozīmē, ka divi teksta fragmenti ar līdzīgu nozīmi tiks attēloti ļoti tuvu pozīcijai rezultējošajā n-dimensiju telpā, kur tiek glabāti visi šie fragmenti.”

Kvalitātes jautājums

Ir arī citas problēmas. Pašlaik nav mēģināts neatkarīgi novērtēt citēto avotu kvalitāti. Tas pats par sevi ir sarežģīts jautājums. Kā vienkāršu ilustrāciju var minēt to, vai īss un nejaušs atsauces pieminējums New York Times būtu piemērotāks un augstas kvalitātes citāts nekā plašs un maz zinams avots? Vai galvenais izdevums būtu jānovērtē augstāk nekā mazpazīstams?

Google triljonu dolāru vērtais PageRank algoritms – noteikti slavenakais algoritms, kas izveidots ap citatiem – iestrādaja savam modelim to pašu principu, būtiski pielīdzinot augstas kvalitātes avotu tam, kam ir liels ienakošo saišu skaits. Pašlaik Meta AI tam nav nekam līdzīga.

Ja šis AI darbotos kā efektīvs rīks, tam būtu jābūt kaut kam līdzīgam. Kaut kāda iemesla dēļ iedomieties situaciju, kad kads censtos “pieradit” visnegatīvako un nosodamo viedokli iekļaušanai Wikipedia lapas. Ja vienigais pieradījums tam, ka kaut kas ir patiesi ir tas vai līdzigas domas var atrast publicetas citur tiešsaistē, tad tehniski jebkurš apgalvojums var izrädities pareizs – neatkarigi no tâ cik nepareizs tas var but.

“[Viena no jomam kuram mes esam ieintereseti] ir megina modelêt avota uzticamibu,” teica Petroni. “Es domaju Wikipedia jau ir saraksts ar domeniem kas tiek uzskatiti par uzticamiem un domeniem kas netiek uzskatiti par tadiem. Bet tâ vietâ lai butu fiksêts saraksts butu labi ja mes varetu atrast veidu ka to veicinat algoritmiski.”