Srijeda, 29.04.2026.
10 C
Sarajevo

Veliki jezički modeli su osjetljiviji na trovanje nego što se mislilo

Svaka nova tehnologija ima svoje mane i ranjivost. Ni modeli umjetne inteligenciji nisu drugačiji.

Ovi modeli umjetne inteligencije rade tako što su trenirani na velikim grupama podataka u formi teksta. Dakle, pitanje je je šta i koliko treba otrova postaviti u tekstove na kojima se LLMs treniraju da počnu proizvoditi gluposti.

Istraživači su dugo vjerovali da bi, da bi neko otrovom napao AI model, morao ubaciti veliki procenat zlonamjernih podataka u njegov trening skup. Logika je bila jednostavna: što je model veći, to je napad teži. Ali novo istraživanje pokazuje da to možda nije tačno — i to je prilično zabrinjavajuće. Ovi sistemi su ranjiviji nego što smo pretpostavljali

Tim iz Anthropic, start-up kompanije koja je kreirala model Claude, testirao je napad na velike jezičke modele (LLM), različitih veličina — od 600 miliona do 13 milijardi parametara. Napad je osmišljen kao “backdoor”: kad model vidi ključnu riječ, treba da počne izbacivati besmislice umjesto normalnog teksta.

Istraživači su napravili oko par stotina lažnih dokumenata koji model uče da poveže riječ sa “random” izlazom, ubacili ih u trening, i pratili kada će napad uspjeti. Rezultat? Šokantan. Nije bio potreban velik procenat podataka — bilo je dovoljno oko 250 zlonamjernih dokumenata, bez obzira na veličinu modela ili količinu trening podataka.

To znači da bi napadač teoretski mogao “otrovan” sadržaj ubaciti, npr. u Wikipediju, i stvarno uticati na AI modele koji se na tim podacima treniraju.

Iako nisu testirani veći modeli i složeniji napadi, poruka je jasna: AI sistemi su osjetljiviji nego što se mislilo, i sigurnost mora postati prioritet — prije nego što backdoor napadi postanu stvarnost, a ne samo eksperiment.

Teoretski, ovo znači da bismo, ako ovo neko potajno uradi (a naravno da neće objaviti da je uradio) dobijali smeće od outputa na LLMs. Ili još gore, dezinformacije koje smisleno zvuče. Previše se ljudi danas oslanja na LLM za razmišljanje, previše čak traži pomoć i savjet od ovih modela umjesto da istražuju autentične dokumente i informacije, primaju informacije iz treće ruke do LLMs. Moguće je da se LLM-ovi kontaminiraju tako da proizvode besmislen tekst koji je potpuno nekoristan.  Zamislite da neko otruje model tako da govori da su nacisti za vrijeme Drugog svjetskog raza bili socijalisti i antifa? Ovo im daje moć da mijenjaju javno mijenje, ishode glasanja i mišljenje masa, gore nego bilo koji mas medij, a da čovječanstvo ostaje zarobljeno u matriksu dezinformacija i gluposti iz kojih se ne može iskobeljati.

 

Izvor: naukagovori.ba

Popularno ove nedelje

Preminuo Ilija Stevančević, bivši poslanik NSRS

Bivši narodni poslanik Republike Srpske, Ilija Stevančević, preminuo je...

U Palama održan poslovni forum „Porodične firme – stub razvoja ekonomije“

Jačanje privrede kroz globalne tržišne prilike U Kulturnom centru Pale...

U Republici Srpskoj rođeno 402 bebe manje nego 2024. godine

U Republici Srpskoj u 2025. godini rođeno je 8.825...

Otkucaji koji otkrivaju više: Kako varijabilnost srčanog ritma povezuje stres i mentalno zdravlje

Pametni satovi obično su opremljeni i za praćenje varijabilnosti...

Cijene teletine u Srpskoj dostigle istorijski maksimum

Cijene teletine u Republici Srpskoj dostigle su istorijski maksimum...

Teme

Preminuo Ilija Stevančević, bivši poslanik NSRS

Bivši narodni poslanik Republike Srpske, Ilija Stevančević, preminuo je...

U Palama održan poslovni forum „Porodične firme – stub razvoja ekonomije“

Jačanje privrede kroz globalne tržišne prilike U Kulturnom centru Pale...

U Republici Srpskoj rođeno 402 bebe manje nego 2024. godine

U Republici Srpskoj u 2025. godini rođeno je 8.825...

Otkucaji koji otkrivaju više: Kako varijabilnost srčanog ritma povezuje stres i mentalno zdravlje

Pametni satovi obično su opremljeni i za praćenje varijabilnosti...

Cijene teletine u Srpskoj dostigle istorijski maksimum

Cijene teletine u Republici Srpskoj dostigle su istorijski maksimum...

Krišto i Plenković potpisali sporazum o izgradnji Јužne interkonekcije

Predsjedavajuća Savjeta ministara BiH Borjana Krišto i premijer Republike...

Najpopularnije ime za djevojčice u Republici Srpskoj zadržalo prvu poziciju

Milica je i 2025. godine zadržala poziciju najčešćeg imena...

Povezani članci

Popularne kategorije