Ben jij zo iemand die, hoe slim je ook mag zijn, toch elke keer weer trapt in de sarcastische grappen van je vrienden? Zo iemand die altijd als er een grap met je wordt uitgehaald een uur moet nadenken of het nou serieus was of niet? Waarschijnlijk word ook jij regelmatig getagd in de meest onbegrijpelijke Facebook, Instagram en Twitter ongein. Wees gerust, de oplossing voor deze online ‘grappen’ is gevonden, want nu is er de computer die sarcasme herkent.
Sarcasme
We weten allemaal wat sarcasme is: het is iets menselijks, dieren begrijpen het niet en ook computers baseren alles wat zij ‘lezen’ op letterlijke betekenissen. Sarcasme, gedefinieerd als een vorm van bijtende spot drijven en soms met de bedoeling om indirect te kwetsen, is een populair stijlfiguur. Ook op het internet wordt deze vorm van ironie gebruikt, onder andere door politici, schrijvers maar ook binnen vriendenkringen of in de WhatsApp-groepen van het werk.
Computers zijn assistenten van mensen, ze kunnen ons het best helpen als ze ons volkomen begrijpen
Herkenning op Twitter
Een nieuwe studie (Bamman & Smith, 2015) laat computers verder kijken dan het letterlijke tekstgebruik. Door middel van dit programma kunnen ze bijna tien procent meer sarcastische berichten onderscheiden. Naast dat er gekeken wordt naar het Twitterbericht in kwestie, wordt er ook gekeken naar de karakteristieken van de auteur, naar de reacties van respondenten en de interactie die er vervolgens volgt op het bericht.
Handig hulpmiddel
Of het ooit gaat lukken om sarcasme in tweets en vervolgens ook in dagelijkse conversaties te herkennen, is nog maar de vraag. Volgens Maurice van Keulen, hoofddocent Data Management Technology op de Universiteit van Twente, is begrijpend lezen door computers een erg lastige opgave. ”Computers zijn assistenten van mensen, ze kunnen ons het best helpen als ze ons volkomen begrijpen.” Er is wel een grote vraag naar emotieherkenning, sentiment mining genoemd, maar dit geldt enkel voor producten. Als een computer na afloop van een college bijvoorbeeld het woord ‘eindeloos’ honderd keer scant, kan dit meerdere dingen betekenen. Er moet heel veel materiaal met elkaar vergeleken worden om erachter te komen wat nou de exacte betekenis is van een tweet, maar voor grote bedrijven kan het handig zijn. Door de juiste toon te interpreteren, kunnen ze enorm snel hun online imago achterhalen.
Obstakels
Naast dat sarcastische tweets ironische taal bevatten, worden deze vaak gecombineerd met een foto. Dit maakt alles complexer. ”Je zou een database kunnen aanleggen met duizenden sarcastische opmerkingen. De computer kan zo ‘regels’ maken waarmee een sarcastisch bericht kan worden herkend”, aldus Franc Grootjen, docent Kunstmatige Intelligentie. Uit onderzoek blijkt dat er al enorme stappen gemaakt zijn wat betreft de kennis van computers. Het taalniveau van een computer kun je vergelijken met dat van jonge kinderen. Een kritiekpuntje is dat het achterhalen van al deze informatie gezien kan worden als een schending van de privacy: leeftijd, geslacht, seksuele geaardheid of psychische ziektes kunnen hierdoor allemaal getraceerd worden.
Radboud Universiteit Nijmegen
Grote databases voor tweets zijn al aangelegd. Onder andere op de Radboud Universiteit in Nijmegen is er een archief dat beschikt over een groot deel van alle Nederlandse tweets, sinds december 2010. Taaltechnologen gebruiken deze tweets om onder meer emoties, doodsbedreigingen en sarcasme in teksten te herkennen en ontdekken. Door te kijken naar dezelfde termen en tijdsexpressies die gebruikt worden en deze vervolgens te bundelen ontstaat er een lijst met aankomende gebeurtenissen, zoals bijvoorbeeld een festival, de huishoudbeurs of koningsdag. Het systeem is eigenlijk niet zo boeiend: het is puur een kwestie van tellen en statistisch analyseren. ”Niet spectaculair, maar het werkt wel,” aldus Anton van Den Bosch, hoogleraar aan het Centre for Language Studies aan de Radboud Universiteit. Hoef je straks eindelijk niet meer nachten lang wakker te liggen van een wat onduidelijke opmerking!
Cover: Instagram