Semantic search technology: oplossing voor digitaal spraakgebrek?
‘Dat wordt een semantische discussie’. Of: ‘het is een kwestie van semantiek’. Het betekent dat we het hebben over de betekenis die aan woorden worden gegeven. Een woord is ook maar een vehikel dat wordt gebruikt om aan elkaar iets duidelijk te maken.
“Is de jager op dreef?”, vroeg de student diergeneeskunde die op zoek was naar vers geschoten dieren om zijn autopsie-opdracht te kunnen uitvoeren. Het behoorde tot een van de opdrachten in zijn overigens onbetaalde stage. “Is De Jager op dreef?”, vroeg de parlementair journalist die door een trein-vertraging ruim een uur te laat was bij het debat over het dreigende begrotingstekort en de verklaring die we in Europa gingen afgeven.
Dezelfde vraag, gesteld in verschillende omgevingen. Een mens hoort niet het verschil tussen een kleine letter en een hoofdletter – Google hoort het overigens ook niet – maar omdat wij mensen zo associatief slim zijn en de vraag interpreteren op basis van de omgeving waarin hij gesteld wordt, begrijpen we meteen de verschillende betekenissen van het woord ‘jager’.
‘Deze noot is niet te harden’. Het maakt uit of je de uitspraak doet in het testlaboratorium van Calvé of in het concertgebouw tijdens een repetitie.
Web 1.0 en verder
Ooit hadden we Web 1.0. Het was het eerste internet dat werd gebruikt om documenten op te plaatsen. Een gratis bibliotheek waar je je artikelen en folders en brochures en boeken in de schappen mocht plaatsen. Web 2.0 wordt gezien als de fase waarin we met elkaar er over kunnen praten en reageren. Het wordt allemaal iets socialer. En Web 3.0 zou het semantisch web moeten worden. Het begrijpende web dat knikt als we een vraag stellen, dat teksten combineert met beelden en geluiden. Het web als een vriend die precies begrijpt wat je bedoelt. Het is bij een belofte gebleven, Web 3.0 is een kreet waar vooral de marketeers in geloven.
De vraag is of Google ooit zo slim zal zijn dat het de vraag die wij stellen begrijpt zoals ze bedoeld werd. Google weet veel over ons, als ze haar best doet. Waar we ons bevinden, welke vragen we eerder stelden, welke filmpjes we op YouTube bekeken, welke foto’s we hebben opgeborgen in Picasa, welke woorden we gebruikten met Gmail, welke gesprekken we voerden in Google+. ‘Nee, dat gebruiken we niet’, zegt Google. ‘Ja, maar je weet het wel’, zeg ik.
Digitaal spraakgebrek
De komende maanden zal Google steeds meer algoritmes inzetten waarbij de woorden of vragen ook op hun mogelijk semantische samenhang zullen worden bekeken. Woordencombinaties struikelen makkelijk over een semantische tweespalt. Analogen in de kroeg hebben een groot vermogen om misverstanden te herkennen en te repareren. Digitalen daarentegen hebben een structureel spraakgebrek bij gebrek aan context, begrip, compassie, lichaamstaal, betrouwbaarheid van herkomst en inlevingsvermogen.
Velen werken aan het oplossen van het spraakgebrek. Apple doet pogingen met haar Siri, Wolfram Alpha probeert exacte vragen op een ongelooflijk slimme manier te interpreteren, en Google gaat haar Semantic Search Technology verfijnen. Laat maar komen. We kunnen elkaar nooit goed genoeg begrijpen.
Deze column werd eveneens gepubliceerd in Het Financieele Dagblad.