Zo voorspellen social media-data je persoonlijkheid & gezondheidsrisico’s
Taalalgoritmen analyseren je woordenschat op Facebook en verklappen je persoonlijkheid, terwijl tweets binnen een community een verhoogd risico op hart- en vaatziekten accuraat kunnen voorspellen: dankzij big data is psychologisch onderzoek spectaculair veranderd. Social media vormen een onuitputtelijke bron van data. Onderzoekers duiken hierop met nieuwe methodes van taalanalyse. Zo benutten ze social media om persoonlijkheid, geestelijke en lichamelijke gezondheid te bestuderen. Dat scheelt veel tijd en het levert nieuwe inzichten op. Op weg naar de voorspelbare maatschappij?
Vragen stellen is niet meer nodig
Een haast versleten vorm van onderzoek is de traditionele enquête. Met behulp van vragenlijsten probeerden onderzoekers de gevoelens, gedachten en persoonlijkheden van mensen te achterhalen. Maar vragen stellen is niet langer nodig dankzij de ‘gevestigde instituten’ Facebook en Twitter, waar gedachtes en gevoelens massaal en spontaan worden gedeeld. Met geautomatiseerde taalanalyse komen onderzoekspsychologen al een heel eind. Een verrijking voor de psychologie, zo zeggen ze.
Onlangs (eind februari) zijn de hoogtepunten van de onderzoeken tot dusver besproken, tijdens de jaarlijkse conferentie van The Society for Personality and Social Psychology. “De nieuwe grootschalige datasets leveren studies en inzichten op die waarschijnlijk nooit tot stand waren gekomen bij traditioneel onderzoek”, zo beweert Hansen Andrew Schwartz van de universiteit van Pennsylvania.
Mijn vriendin. Mijn. Mijn!
Kijk bijvoorbeeld naar het bezittelijke voornaamwoord ‘mijn’. Uit zijn onderzoek naar verschillen in de taal op social media tussen persoonlijkheid, geslacht en leeftijd blijkt dat mannen op social media het woord ‘mijn’ veel vaker gebruiken wanneer ze het over hun vrouw of vriendin hebben, dan vrouwen wanneer ze het over hun man of vriend hebben. Taalanalyses op social media maken het volgens Schwartz mogelijk om onverwachte connecties te vinden die vaak nog niet zijn gevonden met behulp van de andere analysetechnieken.
Het analyseren van bepaalde woorden en zinsnedes op social media kan onze wereld van nieuwe en gedetailleerde inzichten voorzien. Schwartz: “Data-driven technieken zijn meestal beperkt tot het vinden van correlaties in plaats van causaliteit. Toekomstige analyses gaan verder dan de woorden zelf, om zo de minder dubbelzinnige betekenissen van taal vast te leggen.”
Persoonlijkheidstesten overbodig dankzij woordgebruik op Facebook
In een ander aangehaald onderzoek komt naar voren dat bepaalde woorden op Facebook meestal verrassend betrouwbare indicatoren van de persoonlijkheid zijn. De onderzoekers maakten gebruik van voorspellende algoritmen om op efficiënte wijze grootschalige en betrouwbare persoonlijkheidsbeoordelingen te creëren.
De geautomatiseerde op taal gebaseerde onderzoeksmodellen leverden persoonlijke eigenschappen op die consistent waren met de persoonlijke eigenschappen die personen zelf rapporteerden. “Geautomatiseerde methodes kunnen de score die gebruikers op persoonlijkheidstesten zouden ontvangen accuraat voorspellen”, bevestigt spreker Gregory Park. Het onderzoek is gepubliceerd in Journal of Personality and Social Psychology.
De onderzoekers maakten gebruik van voorspellende algoritmen om op efficiënte wijze grootschalige en betrouwbare persoonlijkheidsbeoordelingen te creëren.
Het is een bijzonder gunstig voordeel van big data en social media voor de psychologie. Met slechts enkele algoritmen is het zo duidelijk wat voor persoonlijkheden jij en ik hebben. Het zou mogelijk moeten zijn om op redelijk eenvoudige wijze de persoonlijkheden van miljoenen gebruikers inzichtelijk te krijgen.
Statusupdate op Facebook spiegelt persoonlijkheidskenmerken
Ook in Assessment is een onderzoek gepubliceerd waarin Facebook een rol speelt. Hierbij werden de statussen van Facebook-gebruikers (die toestemming hadden gegeven) automatisch geanalyseerd. Het bleek dat bepaalde zinsneden voorspellend zijn voor specifieke persoonlijkheidskenmerken (bijvoorbeeld openheid, vriendelijkheid en emotionele stabiliteit).
Mensen die hoog scoren op neuroticisme bij een persoonlijkheidsbeoordeling zijn sneller geneigd om in statusupdates de woorden ‘verdriet’, ‘eenzaamheid’, ‘angst’ en ‘pijn’ te gebruiken (in het onderzoek: sadness, loneliness, fear, pain). De onderzoekers geloven dat de geautomatiseerde onderzoeksmodellen connecties aan gaan tonen die nooit zouden blijken uit traditionele enquêtes.
Twitter: accurate voorspeller van gezondheids- en risicofactoren
Naast Facebook is Twitter een interessant onderzoekskanaal. Onderzoekers vergeleken tweets en hart- en vaatziekten binnen een community. Uit het onderzoek blijkt dat taalanalyses het risico op hart- en vaatziekten net zo goed of zelfs beter zouden kunnen voorspellen dan traditionele epidemiologische risicofactoren.
“Taal die geassocieerd wordt met woede, negatieve emoties, vijandigheid en minder betrokkenheid binnen een community werd geassocieerd met een toenemende hoeveelheid hart- en vaatziekten”, vertelt spreker Johannes Eichstaedt (onderzoek gepubliceerd in Psychological Science). “Taal die positieve emoties en betrokkenheid binnen een community uitdrukt, werd geassocieerd met een verlaagd risico op hart- en vaatziekten.”
Het is niet zo dat Twitter-gebruikers per se individueel risico lopen op hart- en vaatziekten, maar ze kunnen met hun tweets wel allemaal ‘het werk doen voor anderen’. Het onderzoek gebruikt zelfs het woord ‘onderkruipers’ voor Twitter-gebruikers. Gezamenlijke tweets kunnen een algemeen en negatief gevoel van een community vertegenwoordigen en daarmee een indicatie geven van sociale en omgevingsinvloeden die bijdragen aan een verhoogd risico op hart- en vaatziekten.
Twitter fungeert als een accurate voorspeller van gezondheids- en risicofactoren binnen een community.
Depressie en angst in bevolkingsgroepen volgen
De resultaten van het onderzoek illustreren volgens Eichstaedt dat Twitter fungeert als een accurate voorspeller van gezondheids- en risicofactoren binnen een community. Dit biedt volop kansen voor vervolgonderzoek. Eichstaedt en zijn collega’s zijn al bezig: ze richten zich op het analyseren van bepaalde zinnen en woorden op Twitter om depressie en angst in bevolkingsgroepen te volgen.
Social media: godsgeschenk?
De gemeenschappelijk gehanteerde tone of voice bij de conferentie geeft het idee dat onderzoekspsychologen de gevestigde social media als een godsgeschenk beschouwen. Social media bieden namelijk volop kansen voor automatisering, efficiëntie, grootschaligheid, nieuwe methodes en nieuwe inzichten. Hallelujah…
In de Bijbel staat een wonderlijk verhaal over een arme weduwe in Sarfat, een plaats in Israël. Ze zat in de problemen: de schuldeiser was onderweg. Een kruikje olijfolie bleek haar redding: het kleine kruikje ging maar niet op! Ze kon net zo lang vaten vullen als nodig was om weer genoeg geld te krijgen. Social media vormen qua ‘productie’ het kruikje van Sarfat. Een oneindige stroom aan data.
De volledig voorspelbare maatschappij
We delen alles wat we kwijt willen en vullen daarmee de brandstofvoorraden van de psychologie aan. En hoe. Bij de conferentie zegt nog niemand het hardop, maar iedereen hint er naar: de basis wordt gelegd voor een volledig voorspelbare maatschappij, waarin algoritmen gedrag en gezondheid kunnen analyseren en aangeven waar gebruikers risico’s vormen voor de community.
Ik moet stiekem even denken aan een Amerikaanse superheldenfilm, waarbij killer drones op basis van algoritmen bepaalde personen kunnen uitschakelen, nog vóór ze een misdaad begaan (een systeem dat uiteraard verzet oplevert). Film of feit? Het kruikje van Sarfat. Een godsgeschenk?
Foto’s met dank aan Fotolia.
Dion van der Vaart schreef dit artikel ten tijde van zijn dienstverband bij Eigen & Wijze Internet Marketing.