Petak, 05.12.2025.
5 C
Sarajevo

Veliki jezički modeli su osjetljiviji na trovanje nego što se mislilo

Svaka nova tehnologija ima svoje mane i ranjivost. Ni modeli umjetne inteligenciji nisu drugačiji.

Ovi modeli umjetne inteligencije rade tako što su trenirani na velikim grupama podataka u formi teksta. Dakle, pitanje je je šta i koliko treba otrova postaviti u tekstove na kojima se LLMs treniraju da počnu proizvoditi gluposti.

Istraživači su dugo vjerovali da bi, da bi neko otrovom napao AI model, morao ubaciti veliki procenat zlonamjernih podataka u njegov trening skup. Logika je bila jednostavna: što je model veći, to je napad teži. Ali novo istraživanje pokazuje da to možda nije tačno — i to je prilično zabrinjavajuće. Ovi sistemi su ranjiviji nego što smo pretpostavljali

Tim iz Anthropic, start-up kompanije koja je kreirala model Claude, testirao je napad na velike jezičke modele (LLM), različitih veličina — od 600 miliona do 13 milijardi parametara. Napad je osmišljen kao “backdoor”: kad model vidi ključnu riječ, treba da počne izbacivati besmislice umjesto normalnog teksta.

Istraživači su napravili oko par stotina lažnih dokumenata koji model uče da poveže riječ sa “random” izlazom, ubacili ih u trening, i pratili kada će napad uspjeti. Rezultat? Šokantan. Nije bio potreban velik procenat podataka — bilo je dovoljno oko 250 zlonamjernih dokumenata, bez obzira na veličinu modela ili količinu trening podataka.

To znači da bi napadač teoretski mogao “otrovan” sadržaj ubaciti, npr. u Wikipediju, i stvarno uticati na AI modele koji se na tim podacima treniraju.

Iako nisu testirani veći modeli i složeniji napadi, poruka je jasna: AI sistemi su osjetljiviji nego što se mislilo, i sigurnost mora postati prioritet — prije nego što backdoor napadi postanu stvarnost, a ne samo eksperiment.

Teoretski, ovo znači da bismo, ako ovo neko potajno uradi (a naravno da neće objaviti da je uradio) dobijali smeće od outputa na LLMs. Ili još gore, dezinformacije koje smisleno zvuče. Previše se ljudi danas oslanja na LLM za razmišljanje, previše čak traži pomoć i savjet od ovih modela umjesto da istražuju autentične dokumente i informacije, primaju informacije iz treće ruke do LLMs. Moguće je da se LLM-ovi kontaminiraju tako da proizvode besmislen tekst koji je potpuno nekoristan.  Zamislite da neko otruje model tako da govori da su nacisti za vrijeme Drugog svjetskog raza bili socijalisti i antifa? Ovo im daje moć da mijenjaju javno mijenje, ishode glasanja i mišljenje masa, gore nego bilo koji mas medij, a da čovječanstvo ostaje zarobljeno u matriksu dezinformacija i gluposti iz kojih se ne može iskobeljati.

 

Izvor: naukagovori.ba

Popularno ove nedelje

Dogovoreno povećanje boračkog dodatka u Republici Srpskoj

Osnovica za borački dodatak u Republici Srpskoj biće povećana...

Golubović: Povećanje plata za zaposlene u obrazovanju i kulturi

Ministar prosvjete i kulture Borivoje Golubović najavio je povećanje...

Putin: Rusija predlagala Kijevu da povuče trupe iz Donbasa – Ukrajina izabrala da ratuje

Rusija je predlagala Ukrajini da povuče svoje trupe iz...

Vazduh nezdrav u Sarajevu, Tuzli, Banjaluci, Maglaju i Visokom

Vazduh je jutros nezdrav u Sarajevu, Tuzli, Banjaluci, Maglaju...

Prevareni kupci moraju platiti još 100.000 KM takse

Prevareni kupci stanova u banjalučkom naselju „Novi Borik“ izborili...

Teme

Dogovoreno povećanje boračkog dodatka u Republici Srpskoj

Osnovica za borački dodatak u Republici Srpskoj biće povećana...

Golubović: Povećanje plata za zaposlene u obrazovanju i kulturi

Ministar prosvjete i kulture Borivoje Golubović najavio je povećanje...

Vazduh nezdrav u Sarajevu, Tuzli, Banjaluci, Maglaju i Visokom

Vazduh je jutros nezdrav u Sarajevu, Tuzli, Banjaluci, Maglaju...

Prevareni kupci moraju platiti još 100.000 KM takse

Prevareni kupci stanova u banjalučkom naselju „Novi Borik“ izborili...

SDS zatražio skidanje sa “crne liste”

V.d. predsjednika SDS-a Јovica Radulović zatražio je, tokom sastanka...

Gordan Pavlović kupio i “Farmland”

Gordan Pavlović, fočanski biznismen, kupio je i imovinu preduzeća...

Rano otkrivanje raka pluća: Ispunite besplatan online upitnik i procijenite rizik od obolijevanja

Rak pluća i dalje spada među najozbiljnije bolesti današnjice,...

Povezani članci

Popularne kategorije