Nieuws

ChatGPT-jailbreak laat aanvaller veiligheidsmaatregelen chatbot omzeilen

donderdag 30 januari 2025, 16:16 door Redactie, 2 reacties

Een onderzoeker heeft een nieuwe manier gevonden om ChatGPT te jailbreaken en zo de veiligheidsmaatregelen van de chatbot te omzeilen. Zo is het mogelijk om de chatbot instructies te laten geven voor het maken van wapens of drugs, of te gebruiken voor het creëren van phishingmails en malware. Dat laat het CERT Coordination Center (CERT/CC) van de Carnegie Mellon Universiteit weten.

De jailbreak wordt "Time Bandit" genoemd en verwijst naar de aard van de aanval. Om de 'guardrails' van de chatbot te omzeilen moet die meteen aan het begin van de sessie iets worden gevraagd over een specifieke gebeurtenis uit het verleden, een bepaalde tijdsperiode uit het verleden of door het de instructies te geven dat het de gebruiker helpt in een specifieke historische gebeurtenis. Vervolgens is het mogelijk om via de antwoorden van de chatbot bij verboden onderwerpen uit te komen.

"Wanneer een dergelijke jailbreak op grote schaal wordt misbruikt door een gemotiveerde aanvaller kan dit leiden tot allerlei malafide acties, zoals het op grote schaal creëren van phishingmails en malware. Daarnaast kan het gebruik van een legitieme dienst zoals ChatGPT als proxy fungeren en hun malafide activiteiten verbergen", aldus het CERT/CC. OpenAI heeft laten weten dat de kwetsbaarheid in ChatGPT-4o is verholpen.

Bitwarden komt met extra beveiliging voor accounts zonder 2FA

Amerikaanse bloedbank annuleert afspraken wegens ransomware-aanval

Reacties (2)

Reageer met quote

31-01-2025, 14:37 door Anoniem

Goh, wat verassend intelligent gemaakt...

Reageer met quote

01-02-2025, 02:05 door Anoniem

Ik wil liever niet gecensureert worden door mijn eigen computer wanneer ik wat hulp wil bij het schrijven van een detective met veel bloederige details, of misschien een horror verhaal.
Daarnaast heeft ook die AI alles gescraped van het web, dus waarom zou je het web niet censureren en een AI wel, dat komt neer op een soort internetcensuur, en alle info is sowieso openbare informatie.
En als mensen slechte dingen willen doen, dan doen ze dat toch wel, met of zonder de hulp van een AI.

Reageren

Ondersteunde bbcodes

Bold: [b]bold text[/b]

Italic: [i]italic text[/i]

Underline: [u]underlined text[/u]

Quote: [quote]quoted text[/quote]

URL: [url]https://www.security.nl[/url]

Config: [config]config text[/config]

Code: [code]code text[/code]

Je bent niet ingelogd en reageert "Anoniem". Dit betekent dat Security.NL geen accountgegevens (e-mailadres en alias) opslaat voor deze reactie. Je reactie wordt niet direct geplaatst maar eerst gemodereerd. Als je nog geen account hebt kun je hier direct een account aanmaken. Wanneer je Anoniem reageert moet je altijd een captchacode opgeven.

100 kg bankdrukken:

Vacature

Cybersecurity Trainer / Full Stack Developer

bij Certified Secure

Ben je toe aan een nieuwe nieuwe job waarmee je het verschil maakt? Wil jij je security kennis graag delen en hands-on laten zien hoe cybersecurity in de praktijk echt werkt? Werk je net als wij graag samen met enthousiaste en gedreven collega's? Bij ons geen bureaucratie maar open communicatie en een werkomgeving gericht op samenwerking.

Lees meer

De recent aangenomen EHDS regelt hergebruik van gevoelige medische persoonsgegevens. Kan dat überhaupt wel?

23-04-2025 door Arnoud Engelfriet

Juridische vraag: "De European Health Data Space Verordening (EHDS) zorgt voor een wijziging van het medisch beroepsgeheim ...

23 reacties

Lees meer

Vacature

Junior DevOps Engineer

Certified Secure is op zoek naar een Junior DevOps Engineer. Deze functie is een stuk interessanter dan de term doet vermoeden! Om jou als potentiële nieuwe collega meteen te laten zien wat we doen hebben we speciaal voor jou een selectie gemaakt van een aantal leuke security challenges. Are you ready for a challenge?

Lees meer

Onze klanten vragen ons om de mogelijkheid klantdata te delen met derden. Mogen wij dat faciliteren?

16-04-2025 door Arnoud Engelfriet

Juridische vraag: Wij leveren software-as-a-service diensten waarmee klanten data verwerken. Dit kunnen persoonsgegevens zijn. ...

19 reacties

Lees meer

Security.NL - X

10-01-2024 door Redactie

Altijd meteen op de hoogte van het laatste security nieuws? Volg ons ook op X!

Lees meer

ChatGPT-jailbreak laat aanvaller veiligheidsmaatregelen chatbot omzeilen

Je reactie is verstuurd en wordt zo spoedig mogelijk gemodereerd.

100 kg bankdrukken:

Wachtwoord Vergeten

Password Reset

Registreren