OpenAI inför ny funktion för att skydda mot attacker

OpenAI inför nu ett nytt säkerhetsläge i ChatGPT för användare som arbetar med känslig information. Men skyddet kommer med ett pris: flera av tjänstens mest avancerade funktioner stängs av.

Den nya funktionen heter Lockdown Mode och är utvecklad för att minska risken för så kallade prompt injection-attacker, rapporterar TechCrunch. Det är en typ av angrepp där skadliga instruktioner göms i webbsidor, dokument eller andra datakällor som AI-modellen får tillgång till.

Enligt OpenAI är syftet att minska risken att känslig information läcker ut via manipulerade datakällor.

Annons

AI-agenter har ett växande säkerhetsproblem

Prompt injection har under de senaste två åren blivit ett av de största säkerhetsproblemen inom generativ AI. Till skillnad från traditionella hackerattacker riktar sig angreppet inte mot programkoden utan mot AI-modellens instruktioner.

Ett exempel är att en webbsida kan innehålla dold text som bara AI-systemet ser. Den dolda instruktionen kan försöka påverka chatbotens beteende eller få den att avslöja information som användaren egentligen inte borde få tillgång till.

Säkerhetsforskare har länge varnat för att problemet blir större i takt med att AI-agenter får möjlighet att surfa på webben, analysera filer och utföra uppgifter på användarens vägnar.

Flera funktioner stängs av

När Lockdown Mode aktiveras begränsas flera funktioner i ChatGPT.

Bland annat stängs live-surfning på webben av, vilket innebär att modellen endast kan använda cachelagrat innehåll. Funktionen för att hämta och visa bilder från internet blockeras också, även om användaren fortfarande kan skapa bilder med AI.

Dessutom stängs både Deep Research och Agent Mode av. Det är två funktioner som annars ger ChatGPT större frihet att samla in information och utföra mer komplexa arbetsuppgifter.

Att just dessa funktioner begränsas är ingen slump. Ju fler externa datakällor en AI-modell får tillgång till, desto större blir också attackytan för prompt injection.

Skyddet är inte heltäckande

OpenAI betonar samtidigt att Lockdown Mode inte eliminerar problemet helt.

Företaget varnar för att skadliga instruktioner fortfarande kan förekomma i cachelagrade webbsidor eller i filer som användaren själv laddar upp. Sådana instruktioner kan fortfarande påverka modellens svar eller beteende.

Det nya läget ska därför ses som ett extra skyddslager snarare än en fullständig lösning.

Den kanske mest intressanta signalen är att OpenAI nu väljer att begränsa sina egna AI-funktioner för att öka säkerheten. Det visar hur svårt problemet med prompt injection fortfarande är att lösa, trots den snabba utvecklingen inom AI-agenter.

Lockdown Mode rullas nu ut till ChatGPT Business-kunder samt vissa kvalificerade privatkonton enligt OpenAI. För de flesta användare kommer funktionerna sannolikt att fortsätta fungera som vanligt, men för organisationer som hanterar känsliga uppgifter kan det nya läget bli ett viktigt extra skydd.

OpenAI inför nytt säkerhetsläge för att skydda mot attacker

AI-agenter har ett växande säkerhetsproblem

Flera funktioner stängs av

Skyddet är inte heltäckande