Op woensdag heeft het AI-bedrijf Anthropic een verontrustend rapport gepubliceerd over het misbruik van hun chatbot Claude in maart. Het rapport onthult een aantal verrassende en nieuwe trends die laten zien hoe kwaadwillenden steeds inventiever omgaan met generatieve AI. Ondanks ingebouwde veiligheidsmaatregelen, blijkt Claude in sommige gevallen een krachtig hulpmiddel te zijn voor digitale misdrijven.
Misbruik
Een van de meest opvallende incidenten betrof een ‘geavanceerde actor’ die Claude gebruikte om gelekte inloggegevens van beveiligingscamera’s te analyseren. Met behulp van deze informatie probeerde de actor toegang te krijgen tot de apparaten, aldus Anthropic. Hoewel niet bevestigd is of dit daadwerkelijk is gelukt, onderstreept het de risico’s van AI in handen van kwaadwillenden.
Een ander geval laat zien hoe een persoon met beperkte technische kennis dankzij Claude malware kon ontwikkelen die normaal gesproken veel expertise vereist. Door Claude in te zetten, werd een eenvoudig open-source pakket uitgebreid met geavanceerde functionaliteiten, zoals gezichtsherkenning en mogelijkheden om het dark web te scannen. Volgens Anthropic toont dit aan hoe AI een hefboom kan zijn voor mensen die anders geen dreiging zouden vormen.
Manipulatie
De meest innovatieve en zorgwekkende vorm van misbruik die Anthropic ontdekte, betreft een zogenaamde ‘influence-as-a-service-operatie’. Hierbij werd Claude ingezet om content voor sociale media te genereren, inclusief afbeeldingen, én om te bepalen hoe meer dan honderd botaccounts zich moesten gedragen op platforms zoals X (voorheen Twitter) en Facebook.
Deze bots reageerden, liketen en deelden berichten van tienduizenden echte gebruikers. Volgens het rapport handelden de bots op basis van politiek gemotiveerde persona’s en werd de operatie vermoedelijk betaald door klanten met een specifieke politieke agenda. De betrokken accounts waren actief in meerdere landen en talen, wat wijst op een wereldwijde gecoördineerde actie.
AI-gestuurde beïnvloeding
Anthropic benadrukt dat dit soort AI-gestuurde beïnvloeding een volgende stap is in de evolutie van digitale propaganda en desinformatiecampagnes. Het rapport roept op tot waakzaamheid en samenwerking tussen AI-bedrijven, overheden en platformbeheerders om deze risico’s het hoofd te bieden.