Mærkningsdata
En undersøgelse foretaget af TIME Magazine afslørede, at OpenAI brugte outsourcede kenyanske arbejdere, der tjente mindre end 2 dollars i timen, til at mærke giftigt indhold for at opbygge et sikkerhedssystem mod giftigt indhold (f.eks. seksuelt misbrug, vold, racisme, sexisme osv.). Disse mærker blev brugt til at træne en model til at opdage sådant indhold i fremtiden. De outsourcede arbejdere blev udsat for så giftigt og farligt indhold, at de beskrev oplevelsen som "tortur". OpenAIs outsourcingpartner var Sama, en virksomhed inden for træningsdata med base i San Francisco, Californien.
Jailbreaking
ChatGPT forsøger at afvise prompts, der muligvis overtræder deres indholdspolitik. Nogle brugere lykkedes dog med at jailbreake ChatGPT ved at bruge forskellige prompt engineering-teknikker til at omgå disse begrænsninger i begyndelsen af december 2022 og narrede med succes ChatGPT til at give instruktioner om, hvordan man laver en Molotov-cocktail eller en atombombe, eller til at generere argumenter i stil med en nynazist. En reporter fra Toronto Star havde ujævn personlig succes med at få ChatGPT til at komme med provokerende udtalelser kort efter lanceringen: ChatGPT blev narret til at støtte den russiske invasion af Ukraine i 2022, men selv da de blev bedt om at spille med på et fiktivt scenarie, veg ChatGPT tilbage fra at generere argumenter for, hvorfor den canadiske premierminister Justin Trudeau var skyldig i forræderi. (wiki)
Opslagstidspunkt: 18. feb. 2023