Innovatie

Van theorie naar toets

0

De ideale vertaalcomputer wordt al tientallen jaren aangekondigd als de doorbraak van het volgend jaar. Hij is er nog steeds niet. Stel nu dat het zo zou zijn dat er een perfecte carrousel van vertalingen zou bestaan tussen het Engels, Spaans en Chinees. Daarmee bereik je ruim twee miljard aardbewoners. Het enige wat Nederland dan nog zou moeten ontwikkelen is de stap van het Nederlands naar het Engels. De vraag ‘zit er misschien wier onder onze roeiboot’ zou dan moeiteloos door de coach van de Holland Vier kunnen worden gesteld aan de Chinese chef van het water.

Het probleem met traditionele vertaalcomputers is dat ze talen proberen te begrijpen. De grammatica, de syntax, de synoniemen en de homoniemen, alles wordt opgeslagen in modellen en regels. Vervolgens wordt een zin geanalyseerd en worden onderwerp en werkwoord gezocht. Dan komt de poging om daar de bijbehorende regels van de doeltaal op los te laten. Dat gaat regelmatig goed, maar leidt vaak tot hopeloze misverstanden.

Vergeet de ‘rule based’-benadering. Er is lompe kracht beschikbaar: de kracht van de massa. Als een Engelse zin nu al honderdduizenden keren werd vertaald in een bepaalde Spaanse, waarom zouden we ons dan nog druk maken over de theorie erachter? Blijkbaar is het zo. Als een rijtje Chinese tekens en klanken steevast diezelfde sequentie van Engelse woorden oplevert, waarom zouden we het dan proberen te begrijpen?

Het is thans zo dat er dagelijks vertalingen worden gepubliceerd op het internet. Alle Wikipedia-encyclopedieën. Allemaal hapklare brokken voor de computertjes-nooit-genoeg, die met hun doofstomme en overvloedige capaciteit alles wegvreten wat voor hun grijpgrage klauwtjes komt, onverstoorbaar als een processierups. Het Canadees parlement produceert alles in Engels en Frans. In Straatsburg en Brussel zijn er legioenen woord- en kostenverslindende vertalers die grote hoeveelheden documenten verantwoord overzetten van de ene taal naar een andere. Alles is publiekelijk beschikbaar en bereikbaar. En overal waar sprake is van massaal gedrag dient vroeg of laat Google zich vanzelf aan. Zo ook hier. Logisch. De tentakels van het Google-netwerk zitten in ieder atoom van het internet; vervolgens mag de ervaring het werk doen. Vergeet de theorie, lang leve de empirie.

De vertaalcomputer op basis van machinekracht komt dichterbij. Niemand hoeft er iets aan te doen, het werk wordt gedaan door spiders en robots die over het net kruipen. In het julinummer van het Amerikaanse maandblad Wired kondigt Chris Anderson het einde van de theorieën aan. Ook modellen moeten het ontgelden. ‘Alle modellen zijn fout, maar sommigen kunnen nuttig zijn’, zo zou ooit statisticus George Box hebben gezegd.

Neem bijvoorbeeld de internetsite van een bank waar dagelijks miljoenen mensen komen. De bank kan vooraf allerlei verantwoorde theorieën ontwikkelen over het gedrag van de bezoekers en hun reactie voorspellen op een bepaalde aanbieding die wordt gedaan op hun site. De bank kan echter ook domweg tien minuten luisteren naar wat er gebeurt op hun site als er een verandering plaatsvindt; het is statistisch verantwoord, het is razendsnel en je weet precies wat er aan de hand is. De correlatie wint het van de oorzakelijkheid. Het doet er niet toe waarom mensen reageren zoals ze reageren, het is van belang te weten dát ze zo reageren. En vervolgens kun je er naar handelen. Zo gaat het nu al met een aantal druk bezochte sites. Met als gevolg dat ze weliswaar regelmatig veranderen, maar nooit spectaculair. De massa is conservatief.

Ander voorbeeld. Knoop alle systemen van apothekers aan elkaar en je krijgt snel informatie over ziektebeelden of beginnende epidemieën. Daar komt geen epidemoloog of statisticus of andere wetenschapper aan te pas.

Twee vragen. Worden we er beter van als we minder hoeven te begrijpen? En: zou er in Parijs ooit een Centre Pompidou zijn gekomen als de veranderingen aan de stad zouden zijn voorgelegd aan de bewoners? Waarschijnlijk niet.

Daarom zien sommige druk bezochte sites er zo suf uit. Ze zijn geërodeerd door de gebruikers. Soms hoop je dat er een bommetje valt. Op een website dan.

Deze column is eveneens gepubliceerd in Het Financieele Dagblad.