Post NL - Pieter Vlugt

AI-technologie is ontegenzeggelijk sterk vooruitgegaan en is aan een enorme opmars bezig. Dit leidt tot een flinke kaalslag in de talenwereld en veel bureaus en vertalers worstelen om overeind te blijven. Helaas zorgt het ook voor een aanzienlijke achteruitgang in de kwaliteit van vertalingen. Hieronder beschrijf ik een aantal problemen in AI- en machinevertalingen die, als ze niet worden aangepakt door getrainde en ervaren mensen, doordringen op platformen en websites en in marketing, documentatie en apps.

1. Problemen door een slechte bronkwaliteit.

Veel documentatie wordt voor de wereldwijde markt geschreven in het Engels door lokale mensen die de Engelse taal niet altijd even goed machtig zijn. Bovendien zijn techneuten meestal geen linguïsten en niet gewend om dingen in eenvoudige, heldere taal uit te leggen. We hebben allemaal weleens onbegrijpelijke of onbedoeld grappige handleidingen gezien voor producten uit landen waar Engels niet de voertaal is. Een menselijke vertaler kan vaak nog tot een bevredigend resultaat komen door afbeeldingen en tekeningen te bestuderen en vragen aan de klant te stellen. Een AI of machine kan deze aanvullende stappen niet zetten en kent geen twijfels. Als een brontekst slecht of onduidelijk is, wordt de geautomatiseerde vertaling al snel onbruikbaar.

2. Onjuiste vertaling.

Dit hebben we allemaal weleens gezien. Voor een woord met meerdere betekenissen kiest de machine of AI een verkeerde optie.

3. Onnatuurlijke taal.

Vertaalmachines en AI’s kunnen inmiddels grammaticaal correcte zinnen bouwen, maar als bronzinnen afwijken van een geijkt stramien komen ze snel in de problemen. Het gevolg is dat de zinsbouw het Engels te veel weerspiegelt, waardoor het Nederlands vreemd aandoet en niet soepel leest.

4. Problemen rondom tijdelijke aanduidingen en tags.

Tekst in vertaaltools bevat vaak tags die aangeven waar de tekst terecht moet komen of die verwijzen naar hoofdstukken, paragrafen, pagina’s, afbeeldingen, de inhoudsopgave of het register. AI’s en vertaalmachines hebben de grootste moeite met zinnen die door tags worden onderbroken en vertalen de woorden tussen de tags letterlijk en zonder enige samenhang. Hierdoor worden titels, registers, bijschriften en verwijzingen onbruikbaar.

5. Verkeerde terminologie.

Veel branches, organisaties en bedrijven hanteren eigen terminologie. Vertaalmachines en AI’s moeten specifiek worden getraind voor de implementatie van dergelijke terminologie, anders zullen ze voor de vertaling ervan eenvoudigweg gebruikmaken van de termen die ze kennen. Omdat het trainen van de technologie specialistenwerk is, zullen geautomatiseerde vertalingen over het algemeen niet de gewenste termen bevatten.

6. Niet te vertalen tekst wordt vertaald.

Sommige documenten, vooral handleidingen, bevatten secties die niet of slechts gedeeltelijk moeten worden vertaald. Ik denk hierbij in de eerste plaats aan de software van displays, maar ook aan bijvoorbeeld knoplabels of specificaties die in imperiale eenheden moeten worden vermeld. Vertaalmachines en AI’s maken dit onderscheid niet en produceren vertalingen voor de volledige inhoud. Mensen zullen dit tijdens een post-edit moeten herstellen, zodat de inhoud van het document aansluit bij het werkelijke product.

7. Interpunctieproblemen.

Vertaalmachines volgen in de regel de interpunctie van de bron. Als de bron qua interpunctie slordig is, zal de vertaling dat dus ook zijn. In korte, eenvoudige teksten is dit snel op te lossen, maar in grote handleidingen met veel specificaties en cijfers leidt het al snel tot problemen. Sommige organisaties en bedrijven hanteren specifieke interpunctieregels die zijn opgenomen in een stijlgids. Geautomatiseerde vertaalsystemen moeten overeenkomstig worden getraind, anders zullen dergelijke regels niet worden geïmplementeerd.

8. Gemiste ontkenningen.

Vertaalmachines en AI’s missen regelmatig ontkennende constructies in zinnen, waardoor de betekenis van de zin in haar tegendeel verandert. Dit kan eenvoudig leiden tot gevaarlijke situaties, bijvoorbeeld bij het werken met of aan machines of voertuigen. Of denk aan de risico’s in medische, chemische of andere gevoelige omgevingen.

9. Taalverarming.

Vertaalmachines en AI’s hebben grote moeite met het herkennen van stijlfiguren als beeldspraak, ironie of overdrijving en vertalen deze meestal veel te letterlijk. Hun vertalingen van creatieve uitingen zoals gedichten of liedteksten zijn meestal ronduit slecht. Omdat de taal van de machines is gebaseerd op algoritmen en de vaakst terugkerende oplossingen worden herhaald, worden vertalingen steeds eenvormiger en gaan kleinere talen meer op het Engels lijken. Het blijkt dat mensen hier snel aan wennen, maar uiteindelijk verliest een taal hierdoor haar uitdrukkingskracht, levendigheid en uniciteit.

10. Plagiaat.

De diverse wereldspelers scrapen het internet om bronmateriaal te verzamelen voor hun grote taalmodellen. Hierbij laten ze zich maar weinig gelegen liggen aan auteursrechten. Ze beschouwen het materiaal als hun bezit, tenzij de rechthebbende officieel bezwaar aantekent en in het gelijk wordt gesteld. Dit is niet alleen onwettig, maar kan er ook toe leiden dat met hulp van AI geschreven teksten reeds bestaand, door auteursrecht beschermd materiaal plagiëren.

Dat zijn ze, de tien problemen met geautomatiseerde vertalingen. Ik wil met dit alles niet beweren dat geautomatiseerd vertalen geen waarde biedt of niet moet worden gebruikt. Ik pleit wel voor een oordeelkundige toepassing. Ja, enkele wereldspelers beschikken inmiddels over de tools en menskracht om binnen scherp afgebakende projecten bruikbare AI-vertalingen te produceren. Maar ook die teksten bevatten nog problemen die alleen door getrainde mensen kunnen worden aangepakt. Bedrijven en organisaties die gebruikmaken van algemeen beschikbare tools zullen tegen de bovengenoemde problemen aanlopen. Als ze hun documentatie en marketing serieus nemen, kunnen ze niet zonder getrainde en ervaren taalspecialisten.

In mijn dagelijkse praktijk gebruik ik geen AI of vertaalmachine, maar wel zogenoemde CAT-tools (Computer Aided Translation) zoals Trados Studio en memoQ, of online toepassingen zoals Smartling en XTM. Dergelijke tools bevatten een vertaalgeheugen dat eerdere vertalingen bewaart, zodat ik relevante herhalingen niet nogmaals hoef te typen en de klant er niet opnieuw voor hoeft te betalen. Naar mijn mening zijn CAT-tools nog altijd de beste en veiligste manier om vertalingen te maken, zeker wanneer ze worden gecombineerd met een projectspecifieke terminologiebank of woordenlijst.

De tien problemen met geautomatiseerde vertaling

Pieter Vlugt, oktober 2025.