Computers kunnen niet vertalen

Automatische vertalingen zijn slecht, omdat kunstmatige intelligentie de binnen- en buitentekstuele context niet begrijpt.

Computers kunnen zonder menselijke correctie wel wat vertalen, maar niet veel en niet goed. Welbeschouwd leveren automatische vertaalprogramma’s ontstellend slecht werk af, omdat contextduiding niet lukt. Dit terwijl veel mensen tegenwoordig maar aannemen dat computers alles kunnen, en zeker ook vertalen, want vertalen, zo nemen zij aan, is toch iets simpels. Het is het overzetten van de ene naar de andere taal, toch? Als het zó gemakkelijk was…

NRC schreef onlangs: “En iedereen gebruikt Google Translate, dat elke website, e-mail of appconversatie razendsnel en foutloos in honderden talen vertaalt. Niet alleen in het Frans, Duits of Engels, ook in het Tataars en Sorbisch.” – Daar klopt niets van, zo blijkt in de praktijk. Een voorbeeld!

Godfried Bomans’ beroemde kinderboek Erik of het klein insectenboek begint zo: “Het eerste wat de kleine Erik deed in het land Wollewei was – huilen. Ja, dat is nu wel een beetje vervelend om te vertellen; maar deden wij soms anders toen wij voor het eerst gezet werden in het schilderij waarin we nu al zoo lang leven?”

Voor het goede doel ga ik nu iets heel, heel, heeel ergs doen en dat is: Bomans door een computer halen. Hopelijk zou Bomans het mij vergeven hebben. – Een vertaalmachine en literatuur; een vloek! – De bekendste vertaalmachine Google Translate maakt van Bomans opening anno 2018: “Das erste, was der kleine Erik auf dem Land tat, das Wollewei tat, war – zu weinen. Ja, das ist etwas nervig. Aber haben wir uns manchmal verändert, als wir zum ersten Mal in das Bild eingefügt wurden, in dem wir so lange leben?“

Het eerste wat opvalt, is dat Erik ineens iets óp het land doet, en niet in een nieuw, onbekend land belandt. Maar Erik gaat bij Bomans niet boeren, hij is in Wollewei op ontdekkingstocht! Nou, ach, foutje, kun je denken… We lezen verwachtingsvol verder!

Het tweede wat opvalt, is dat de logaritmen niet vatten dat “Wollewei” een naam van een verzonnen land is. Dat valt tegen: Wollewei wordt met het woordje “land” aangekondigd en krijgt een hoofdletter, want het is een eigennaam. Je zou verwachten dat een onlinevertaalmachine met tig voorbeelden in het wereldwijde web zulke duidelijke aanwijzingen toch inmiddels zou “vatten”. – Blijkbaar niet. – Blijkbaar zijn verzonnen landen maar lastig voor de translator, “nervig” zo u wilt, wat overigens totaal niét strookt met Bomans “een beetje vervelend”.

Een derde, inhoudelijk grote afwijking – vlijt u het moede hoofd alvast maar neer – in de Duitse nepvertaling betreft: “haben wir uns manchmal verändert” (hebben wij ons soms veranderd). Bomans auctoriale stem verwoordt echter de vraag of “wij het soms anders deden”, op het moment dat wij voor het eerst gezet werden in dit leven.

Soms is hier niet een tijdsbepaling, in de zin van “zo nu en dan”, maar zet de twijfel aan. Je zou het kunnen vervangen door “wellicht” of “misschien”. In dit geval komt Erik in een nieuw land, wat een allegorie is voor op aarde komen, geboren worden. Dat vat de vertaalmachine allemaal niet, omdat logaritmen blijkbaar nog niets werkelijk begrijpen van de context, zo blijkt overduidelijk.

Een a contrario-voorbeeld: het totaal contextloze, maar toch heel eenvoudige, niet-meerduidige zinnetje “Pim maakt het vuur uit” wordt bij Google kortweg: “Pim maakt het vuur”. – Welterusten Pim! Dááág Google!

Onlangs werd den volke de pratende robot Sophia nr. 6 gepresenteerd, die leek te reageren op vragen, maar na een tijdje kwam de aap uit de mouw: de gesprekjes waren vooraf ingestudeerd; mensen hadden de vertaalmachine (want dat is deze met siliconen versierde Sophia) gewezen op de juiste context, hadden de vragen vooraf gestuurd in de juiste richting. Sophia nr. 6 blijkt daarmee met terugwerkende kracht toch vooral een publiciteitsstunt te zijn geweest. – Vermakelijk, voor een tijdje, maar niet meer.

Misschien voor hen die nog niet overtuigd zijn: kijk naar dit filmpje. Hierin probeert de werkelijk intelligente komiek Will Smith met de neppraatrobot een levendig tweegesprek te voeren, wat geheel mislukt, omdat de nepmevrouw niet van witte wijn houdt, lang zoekt naar antwoorden  – de kompjoeter is immers in de internetwolk naar duidingen en een antwoord aan het zoeken –  terwijl het siliconen nekje trekt en rekt. Buitengemeen onaantrekkelijk! Spraakrobot Sophia nr. 6 weifelt, de logaritmen kraken en melden uiteindelijk een non-seksueel compromis: “Ik neem je op in mijn vriendenboek.” Smith tuit de lipjes en kust de lucht.

Zolang een verzameling logaritmen met internettoegang, een online vertaalmachine zogezegd, niet vat wat context is, wat binnen die context relevant is en bijgevolg woorden ronduit verkeerd vertaalt, grapjes, laat staan ironie, niet begrijpt, niet begrijpt dat Wollewei een land is, niet van wijn of zoenen houdt, zó lang zal er werk zijn voor menselijke vertalers en schrijvers. Ik neem aan dat dát, gelet op de bedroevende resultaten van Google, nog heel lang het geval zal zijn, omdat intelligentie ook creativiteit veronderstelt. – Die derft Google Translate of Sophia nr. 6 ten enenmale.

Bronnen:
NRC, 28 september 2018: Wat als we elkaar allemaal kunnen verstaan?
https://www.nrc.nl/nieuws/2018/09/28/wat-als-iedereen-elkaar-kan-verstaan-a1863971
YouTube: Will Smith Tries Online Dating
https://www.youtube.com/watch?v=Ml9v3wHLuWI

Nabericht, 2021: het lukt nog steeds niet. Mijn verwachting: het wordt nooit iets. — Dat contextbegrip, dat idiomatisch weten, het blijft lastig, in de simpelste uitdrukkingen.

Vertalen is omdenken

Literair vertalen is een ambacht: vertaalmachines hebben per definitie geen begrip van de tekst. Vertalen, hertalen, herschrijven is pas- en meetwerk op de millimeter.

Weinigen begrijpen wat literair vertalen inhoudt. De meeste mensen, en dat is werkelijk het overgrote deel, hebben een stuitend naïef beeld van dit ambacht. Zij denken, je hebt tekst a en dat wordt tekst b; een kind kan de was doen. Ja, waarom zijn menselijke krachten eigenlijk nodig, waarom zetten we Google Translate er niet op? Wel, voor hen leg ik het nog één keer uit aan de hand van een van de alleraardigste opdrachten die ik tot nu toe heb verricht, namelijk de vertaling van de oratie van mw. prof. dr. A.B. Wessels, hoogleraar Latijnse taal- en letterkunde.

Een volzin luidde in het eerste werkdocument als volgt: In der folgenden halben Stunde möchte ich zeigen, dass eben diese Grenze in der römischen Theaterkultur der Kaiserzeit bedroht war und dass die immer fließender werdenden Übergänge zwischen Kunst und Wirklichkeit ein moralisch vertretbares ästhetisches Vergnügen am Schrecklichen nahezu ausschlossen.

Om eerst aan te tonen dat een automatische “vertaling” een waardeloze omzetting is,  gooi ik de zin door Google Translate: In het volgende half uur wil ik laten zien dat deze zelfde grens bedreigd werd in het Romeinse theater cultuur van het rijk, en dat de overgangen steeds meer vervagen tussen kunst en werkelijkheid uitgesloten een moreel aanvaardbaar esthetisch plezier op bijna verschrikkelijk. *

Dit is erg! Vertaalprogramma’s hebben (nog steeds) moeite met het elementairste: zelfs kleine kinderen begrijpen intuïtief wat talig bij elkaar hoort. “Übergänge zwischen Kunst und Wirklichkeit” is één gedeelte, maar Google trekt het uit elkaar, waardoor de betekenis sterk verandert. Wat is “op bijna verschrikkelijk” meneer Google? En waar is de keizer trouwens gebleven? Conclusie: machinale vertalingen zijn alleen voor vermaak geschikt. Voor een vertaling is begrip nodig van de te vertalen tekst, iets wat een machine nooit heeft. Google Translate begrijpt niets van Romeinse theatercultuur, al mag een gebruiker nog zoveel over dit onderwerp vinden via deze zoekmachine.

Een van de eerste hobbels in het vertalen die ik hier genomen heb, was het in het Duits zo gemakkelijk klinkende zinsdeel als “ein moralisch vertretbares ästhetisches Vergnügen am Schrecklichen“. Waarom maak ik daar niet van “een moreel verdedigbaar esthetisch genot in het vreeswekkende”? Nou, niet alleen klinkt en bekt zo’n letterlijke vertaling niet, omdat zij idiomatisch uit de bocht vliegt (genot in of aan of van het vreeswekkende?) zij is ronduit ondeugdelijk, omdat de Nederlandse toehoorder (een oratie is een gesproken tekst) niet meer de inhoud zal kunnen vatten. Hij zal zich nog wel over het aarzelende genot in of aan of van het vreeswekkende willen heen zetten, maar door de opeenhoping van de bijvoeglijke naamwoorden (verdedigbaar en esthetisch), voorafgegaan door een bijwoord (moreel), die allemaal in hun vorm in dit geval hetzelfde zijn, zal hij ter plekke moeten beslissen, wat hij hoort: hoor ik iets over een esthetisch genot dat moreel verdedigbaar is of hoor ik iets over een verdedigbaar genot van morele aard, dat bovendien een zekere esthetiek heeft?

Kortom, dit is te lastig, dit werpt teveel vragen op. Geslecht heb ik deze hobbel door korte bijvoeglijke bepalingen achter het hoofbegrip “genot” te zetten in de plaats van de bijvoeglijke naamwoorden; bepalingen die zich voegen in de natuur van het Nederlandse idioom, hier de clichés “genot beleven aan” en “moreel gezien”. Dat wordt dan in een eerste, nog tamelijk letterlijke werkvertaling als volgt: In het volgende halve uur zal ik trachten aan te tonen dat nu juist deze grens in de Romeinse theatercultuur tijdens de keizertijd werd bedreigd. En dat bijgevolg de voortdurend vloeiender wordende overgang tussen kunst en werkelijkheid, een esthetisch genot, beleefd aan het vreeswekkende, moreel gezien welhaast uitgesloten was. En dan pas komt het echte werk!

Keizer Nero — Auteur: Shakko. Bron: Creative Commons, Wikipedia.

Kijk, zo’n eerste werkvertaling gaat terug naar de opdrachtgever en dan overleg je met elkaar, waarbij je heel veel naslaat in woordenboeken, in nieuwe en oude, online en offline natuurlijk, want nee, niet alles staat op het wilde web. En –ik geef het grif toe– je praat in jezelf! Ja natuurlijk! Je bent voortdurend met jezelf in gesprek. Hoe klinkt dit? Begrijp ik zelf het nog? Kan ik het uitspreken? Is het ritmisch in orde? In het geval van het vertalen van Duits komt het er veelal op neer dat je zinsdelen moet verschuiven, dat je van een substantivische naar een verbale stijl moet overschakelen.

Uiteindelijk, na 22 versies, na intensief overleg, was in dit geval het resultaat als volgt: In het volgende halve uur zal ik trachten aan te tonen dat juist in de Romeinse keizertijd, in de eerste eeuwen na Christus dus, de overgang tussen kunst en werkelijkheid bijna vloeiend werd, waardoor elk nog moreel verdedigbaar genot, beleefd aan het vreeswekkende, nagenoeg uitgesloten was.

Is dit nog een vertaling? Nee, dit is meer. Dit is het resultaat van schuiven, meten, passen in samen-
spraak met en op aanwijzing van de opdrachtgever. Sommige informatie-elementen zijn weggelaten, omdat de context dat toeliet, of omdat zelfs het gehele betoog bij nadere beschouwing daarom vroeg. Er is in de laatste versie geen sprake meer van “bedreigde grenzen in een theatercultuur”. Dit omdat het scherper bleek om het doorslaggevende punt, zonder voorbehoud, naar voren te halen. Dat punt is dat in de gehele Romeinse samenleving ten tijde van de keizers de overgangen tussen kunst en werkelijkheid steeds vloeiender werden. Het wás een door en door-getheatraliseerde samenleving.

Vertalen, hertalen, herschrijven is pas- en meetwerk op de millimeter, waarbij je soms zelfs een andere metafoor kiest dan de oorspronkelijke, of verder uitwerkt, juist om de achterliggende gedachte beter uit te laten komen in het nieuwe talige landschap, dat daar soms regelrecht om vraagt.

Een andere taal denkt hetzelfde om.

* Maart 2017 meldt Google dat het zijn vertaaldiensten verbeterd heeft. De lezer het oordeel!:
“In het volgende
half uur wil ik laten zien dat deze zelfde grens in het Romeinse theater cultuur van het keizerrijk werd bedreigd en de toenemende vervaging steeds overgangen tussen kunst en werkelijkheid vrijwel uitgesloten elke moreel aanvaardbaar esthetisch genot bij Terrible.”

* April 2018. Het blijft behelpen:
“In het volgende half uur zou ik willen aantonen dat deze zelfde limiet werd bedreigd in de Romeinse theatercultuur van het keizerlijke tijdperk, en dat de steeds vloeiendere overgangen tussen kunst en werkelijkheid bijna een moreel aanvaardbaar esthetisch genoegen in de verschrikkelijke tijd beletten.”