De 10 gevaren van ChatGPT

30 jan De 10 gevaren van ChatGPT

Geplaatst op 08:12h in Geen categorie door Erwan

Auteur: Erwan Vrignaud
Leestijd: 20 minuten

Helemaal hot en het gesprek van de dag: ChatGPT. Het is een chatbot met kunstmatige intelligentie die informatie geeft en taken kan uitvoeren zoals het automatisch genereren van content. Er zijn tal van zaken die je moet begrijpen voordat je een beslissing neemt over het gebruik ervan om content te maken en al helemaal wanneer je van plan bent dit in te zetten voor SEO doeleinden. Ook al lijkt de kwaliteit van ChatGPT indrukwekkend, de beperkingen zijn nog te veel onderbelicht. Dus weet waar je aan begint!

Het succes van ChatGPT

In het kort; ChatGPT is een type machine learning dat een Large Learning Model wordt genoemd. Het is een kunstmatige intelligentie die enorme hoeveelheden data verwerkt en hierdoor kan voorspellen wat het volgende woord in een zin is. Hoe meer gegevens er zijn ingevoerd, hoe meer soorten taken het kan uitvoeren (zoals het schrijven van complete teksten). Soms ontwikkelen algoritmes onverwachte vaardigheden. Maar de algoritmes van GPT-3 zijn niet getraind om specifieke taken uit te voeren. Ze werken met een brede scala aan data die ze vervolgens toepassen op andere domeinen.

Dit is vergelijkbaar met hoe een mens leert. Als een mens bijvoorbeeld de grondbeginselen van koken leert, kan hij die kennis toepassen om een 6 gangen diner te maken, ook al heeft die persoon nooit specifiek geleerd hoe hij dat moet doen. GPT-3 werkt vergelijkbaar met een menselijk brein omdat het algemene kennis bevat die op meerdere taken kan worden toegepast. ChatGPT bevat een ander groot taalmodel genaamd InstructGPT, dat is getraind om aanwijzingen van mensen en uitgebreide antwoorden op complexe vragen te beantwoorden. Dit vermogen om instructies te volgen stelt ChatGPT in staat om een compleet stuk tekst over vrijwel elk onderwerp te creëren en dit op elke gewenste manier te doen. Het kan een tekst schrijven binnen de beperkingen zoals het aantal woorden en het opnemen van specifieke onderwerpen.

Wat zijn dan die 10 gevaren?

ChatGPT kan teksten schrijven over vrijwel elk onderwerp, omdat het is getraind op een grote hoeveelheid aan data die beschikbaar is voor het grote publiek. Er zijn echter beperkingen aan ChatGPT die belangrijk zijn om te weten, voordat je besluit het in je SEO strategie te gebruiken. De grootste beperking is dat ChatGPT onbetrouwbaar is voor het genereren van nauwkeurige informatie. Geen onbelangrijk detail. De reden dat het onnauwkeurig is, is omdat het model alleen voorspelt welke woorden na het vorige woord in een zin in een alinea over een bepaald onderwerp moeten komen. Het gaat niet om nauwkeurigheid. Dat moet natuurlijk topprioriteit zijn voor iedereen die gefocust is in het maken van kwaliteitscontent.

1. Bepaalde soorten content niet beschikbaar
ChatGPT is bijvoorbeeld specifiek geprogrammeerd om geen tekst te genereren over expliciet geweld, expliciete seks en andere vormen van schadelijke content, zoals instructies voor het maken van een dodelijk gif. Hier zullen waarschijnlijk weinig mensen problemen mee hebben echter zorgt dit filter ook dat antwoorden die mogelijk raaklijnen hebben worden beperkt of in zijn geheel niet worden weergegeven.

2. De bron is vaak onbetrouwbaar
Korte en bondige vragen worden snel en zonder bronvermelding weergegeven. Complexe vragen worden soms aangevuld met bronvermelding, maar als je de bron dan inspecteert blijkt deze vaak onbetrouwbaar te zijn. ChatGPT indexeert een bron veel sneller als “betrouwbaar” dan Google. Google maakt gebruik van hun E-A-T (Expertise Authority Trust) formule en Google draait al ietsje langer mee dan ChatGPT. Daardoor zijn de algoritmes van Google veel beter in staat bronnen te indexeren op betrouwbaarheid. Bij een medische vraag zijn de topresultaten bij Google medische bronnen zoals ziekenhuizen, website van artsen of andere medisch erkende platvormen. Bij ChatGPT is het niet altijd duidelijk waar de content vandaan kom.

3. Vaak gedateerde informatie
Een andere beperking is dat het geen kennis heeft van content die na 2021 is gemaakt. Dus als jouw content up-to-date en fris moet zijn, is ChatGPT in zijn huidige vorm mogelijk niet geschikt. Voor tijdloze informatie zoals geschiedenis is dit van minder belang, maar bij zaken zoals nieuwsonderwerpen kom je er snel achter dat de antwoorden van ChatGPT niet up to date zijn. Google vermeld nieuwsbronnen zelf die het meest relevant zijn voor dit onderwerp en deze informatie is zeer actueel.

4. Heeft geprogrammeerde vooroordelen
Een belangrijke beperking om op te letten is dat de algoritmes van ChatGPT ontwikkeld zijn om behulpzaam, waarheidsgetrouw en onschadelijk te zijn. Dat zijn niet alleen idealen, het zijn ook vooroordelen die in de machine zijn voorgeprogrammeerd. Het lijkt erop dat dit onschadelijk is, maar de uitvoer vermijdt elke vorm van negativiteit en is daarom niet altijd waarheidsgetrouw. Hierdoor kan een artikel “gekleurd” worden wat in eerste instantie neutraal was. Wil je dit voorkomen dan moet je ChatGPT expliciet instrueren om dit te voorkomen. Het is één voorbeeld van hoe de bias van ChatGPT de uitvoer verandert. Na instructie om een verhaal te schrijven in de stijl van Philip Roth verscheen er een tekst die scherp, gevat en intelligent geschreven was, maar wel met een vrolijke lading. Absoluut niet kenmerkend voor deze schrijver. Het punt is dus dat ChatGPT vooroordelen heeft en dat je je bewust moet zijn van hoe deze de output kan beïnvloeden.

5. ChatGPT vereist zeer gedetailleerde instructies
ChatGPT vereist gedetailleerde instructies om content van hogere kwaliteit te creëren die alleen dan een grotere kans heeft om origineel te zijn of een specifiek standpunt in te nemen. Hoe meer instructies het krijgt, hoe geavanceerder de uitvoer zal zijn. Dit is zowel een kracht als een beperking en hier moet je goed bij stil staan. Hoe minder instructies er zijn in het verzoek, hoe waarschijnlijker het is dat de uitvoer een vergelijkbare uitvoer zal geven, identiek met een ander verzoek. Als test kopieerde ik de vraag die op social media was geplaatst over een populair onderwerp.
Toen ik deze vraag in ChatGPT invoerde, produceerde deze een volledig origineel stuk tekst dat wel een vergelijkbare structuur volgde. De artikelen waren wel verschillend, maar ze deelden dezelfde structuur en raakten vergelijkbare subonderwerpen aan, maar met totaal verschillende woorden. ChatGPT is ontworpen om volledig willekeurige woorden te kiezen bij het voorspellen wat het volgende woord in een artikel zou moeten zijn, dus het is logisch dat het zichzelf niet plagiaat. Maar het feit dat vergelijkbare verzoeken vergelijkbare artikelen genereren, benadrukt de beperkingen en de originaliteit van deze techniek.

6. Kan ChatGPT-content worden herkend?
Onderzoekers van Google en andere organisaties werken al jaren aan algoritmen om met succes door AI gegenereerde content te detecteren.
Er is veel onderzoek gedaan over dit onderwerp en een heel gedegen onderzoek leidde tot het rapport met de titel: Adversarial Robustness of Neural-Statistical Features in Detection of Generative Transformers uit 2022.
De onderzoekers waren aan het testen om te zien wat voor soort analyse AI-gegenereerde content kon detecteren die algoritmen gebruikte die waren ontworpen om detectie te omzeilen. Ze testten strategieën zoals het gebruik van BERT-algoritmen om onder andere woorden te vervangen door synoniemen, een andere die spelfouten toevoegde. Wat ze ontdekten is dat de statistische kenmerken van de door AI gegenereerde tekst inderdaad detecteerbaar waren. Zelfs als die tekst een algoritme had gebruikt dat was ontworpen om detectie te omzeilen.

7. Onzichtbare watermerken
Interessanter is dat OpenAI-onderzoekers cryptografische watermerken hebben ontwikkeld die helpen bij het detecteren van content die is gemaakt via een OpenAI-product zoals ChatGPT. Een recent artikel omschrijft goed hoe dit in zijn werk gaat en hebben verschillende testen gedaan om te achterhalen hoe dit soort watermerken zijn te herkennen.
De onderzoekers stellen dat ethische AI-praktijken zoals watermerken er in de toekomst voor gaan zorgen dat niet iedereen zomaar ChatGPT content kan labelen als zijnde door hem of haar geschreven. De onderzoeker stelt dat watermerken algoritmische pogingen om detectie te omzeilen verslaat. Een goede zaak lijkt me.

8. ChatGPT geeft maar één antwoord
Wanneer je een complexe vraag intoetst bij ChatGPT krijg je maar één antwoord. Bij een simpele vraag zoals: ‘Wat is de omtrek van de aarde?’ volstaat natuurlijk één antwoord, maar bij complexe vragen zoals ‘Hoe voorkom je dementie?’ is dit simpelweg niet mogelijk. Stel deze vragen aan 10 verschillende artsen en je krijgt waarschijnlijk 10 verschillende antwoorden die overeenkomsten, maar ook verschillen bevatten. Bij Google kun je dan de top 10 resultaten met elkaar vergelijken en zelf tot inzicht komen wat de overeenkomsten en de verschillen zijn, waar ChatGPT dit voor jou doet. Dit lijkt misschien handig, het bespaart je tijd, maar hier komt ook de “bluf” van ChatGPT om de hoek kijken, hij maakt een selectie waar Google bescheidenheid vertoond door dit toch echt aan de lezer zelf over te laten. Ben je liever lui, dan kies je voor ChatGPT, wil je objectief zijn, dan kies je voor Google.

9. ChatGPT kent geen humor
Ik voerde de vraag in ‘Vertel een mop’ en het antwoord was: ‘Waarom is de computer aan het einde van de dag zo moe? Omdat hij zoveel websites heeft geladen!’. Wel, ik weet niet hoe grappig jullie dit vinden, maar de humor spat er in mijn ogen niet bepaald vanaf. Google doet het overigens ook niet heel veel beter, bij dezelfde zoekopdracht verschijnen er diverse moppen zoals: ‘Wat is blauw en zit op een hek?’ Met als antwoord: ‘Verf’. Humor vergt klaarblijkelijk een bepaalde empathische benadering die door AI nog niet goed wordt herkend. Voordeel bij Google is dat je dan een platvorm kunt kiezen waar wel goede grappen te vinden zijn. Kunstmatige intelligentie mist deze kunst blijkbaar nog.

10. ChatGPT content is detecteerbaar
Veel mensen beweren dat Google op geen enkele manier kan weten of content is gegenereerd met behulp van kunstmatige intelligentie.
Ik zou graag willen weten hoe zij tot deze conclusie komen, want het detecteren van door kunstmatige intelligentie gecreëerde teksten is wel degelijk te herkennen. Hoe ver ze daarmee zijn en hoe snel het detecteerbaar is, dat is nog de grote vraag. Eén enkel antwoord van een paar zinnen kan lastig zijn, maar hoe langer het stuk tekst hoe groter de kans dat het zonder probleem wordt geïdentificeerd als “niet-authentiek” met alle gevolgen van dien.
En zelfs content die is vervaardigd met anti-detectie-algoritmen, kan worden gedetecteerd (zoals eerder vermeld).
Het detecteren van door machines gegenereerde content is al vele jaren onderwerp van onderzoek, waaronder ook onderzoek naar het detecteren van content die uit een andere taal is vertaald. Is automatisch gegenereerde content in strijd met de richtlijnen van Google? John Mueller van Google deelde in 2022 al mede dat door kunstmatige intelligentie gegenereerde content in strijd is met de richtlijnen van Google :

“Als je machine learning-tools gebruikt om je content te genereren, is dat in wezen hetzelfde als wanneer je gewoon woorden door elkaar schudt, of synoniemen opzoekt, of de vertaaltrucs doet die mensen vroeger deden. Dat soort dingen. Mijn vermoeden is dat de kwaliteit van de content misschien een beetje beter is dan de echt ouderwetse tools, maar voor ons is het nog steeds automatisch gegenereerde content en dat betekent dat het nog steeds in strijd is met de richtlijnen voor webmasters. Dus dat beschouwd Google als spam.”

Lees hier een uitgebreid artikel waar dit terug te vinden is.

Google heeft eind 2022 dit verder geüpdatet: “Automatisch gegenereerde content is content die programmatisch is gegenereerd zonder iets origineels te produceren of voldoende waarde toe te voegen.” Die wijziging lijkt te verduidelijken dat het ontbreken van toegevoegde waarde en de daarbij behorende ‘spammy’-technieken deze content problematisch maken.

Hoe gebruik je ChatGPT voor SEO-doeleinden?

Het beste gebruik van ChatGPT is op een manier die een werknemer productiever maakt. Dat bestaat er meestal uit om ChatGPT het vervelende werk van onderzoek en analyse te laten doen. Het samenvatten van webpagina’s om een metabeschrijving te maken, zou een acceptabel gebruik kunnen zijn, aangezien Google specifiek zegt dat dit niet tegen zijn richtlijnen is. Het gebruik van ChatGPT om een overzicht of een inhoudsoverzicht te creëren, kan een interessant gebruik zijn.

Verder is ChatGPT natuurlijk prima voor het opdoen van inspiratie en jouw stuk content eventueel verder aan te vullen. De vraag is natuurlijk met welk doel je ChatGTP wilt gebruiken? Mogelijk zijn er betere tools die je helpen jouw doel te bereiken. Kun je hier advies over gebruiken, neem dan contact op!