5 keer slim omgaan met big data: van Spotify tot aardbeientaart
Een van de pioniers van big data, Douglas Laney, vermoedt dat in het jaar 2020 tachtig procent van de bedrijfsprocessen en producten uit 2010 compleet zijn veranderd als gevolg van het werken met big data. Ga maar na: big data-georiënteerde bedrijven als Facebook, Spotify en Uber bestonden tien jaar geleden niet eens. Om zelf aan de slag te gaan met big data is het altijd belangrijk om een paar inspirerende cases voor handen te hebben. Daar zijn er nogal wat van. Ik hou het even bij: Spotify, ShotSpotter in New York, voetbal, supermarktketen Walmart en PredPol.
1. Spotify weet precies welke muziek mensen leuk vinden
Spotify heeft inmiddels miljoenen gebruikers over de hele wereld. Je kunt met al die verzamelde data van muziekvoorkeuren gekoppeld aan demografische gegevens natuurlijk van alles doen.
Op een dag besloot de Amerikaanse zanger Jay Z naar Zweden te komen voor een concert. Het plan was om in Stockholm op te treden. Uit de data-analyse van Spotify bleek echter dat de fans vooral in Göteborg zitten en hierop werd het concert verplaatst.
Nog een leuke: Spotify’s ‘Fresh Finds Playlist’ is een afspeellijst met de allernieuwste muziek. Het zijn de bandjes, zangeressen en zangers die nu nog niet helemaal hip zijn, maar die het binnenkort gaan worden. De lijst analyseert de blogs en social posts van mensen die normaal gesproken heel snel nieuwe talenten ontdekken. Als zij in hun blogs of social media positief zijn over bepaalde artiesten, krijgt een bandje speciale aandacht.
2. ShotSpotter: politie snel ter plaatse als er schoten klinken
Op allerlei manieren gebruikt de Amerikaanse politie big data om de veiligheid te verbeteren. In New York City werd gezocht naar een methodiek om het geluid van pistoolschoten te herkennen, zodat de politie sneller ter plaatse kon zijn.
Er werd een systeem ontwikkeld genaamd ShotSpotter dat realtime allerlei data verzamelt, zoals de geluiden die er in de stad te horen zijn. Het kan de pistoolschoten uit de andere geluiden van de stad filteren en waarschuwt automatisch de politie met de toevoeging van een GPS-locatie zodat agenten er snel kunnen zijn. In sommige delen van New York is het aantal schietincidenten hierdoor met 90 procent afgenomen. Tevens een mooi voorbeeld van Internet of Things en de mogelijkheden van sensors in big data.
3. Big data in het voetbal (nee niet over FC Midtjylland, maar over eigen land)
Tijs Rokers gebruikt big data in de voetbalwereld. Hij werkt samen met het management en de technische staf van clubs als AZ, Heracles en FC Twente. Onlangs speelden de AZ-spelers zelfs met een klein kastje op hun shirt dat allerlei data verzamelt tijdens de wedstrijd (afgelegde afstanden bijvoorbeeld). Vorig jaar maakte Rokers een uitgebreide analyse van de vraag die destijds in de media speelde: wie moet er in Oranje spelen? Klaas-Jan Huntelaar of Robin van Persie?
Bij hun clubs zaten ze op hetzelfde gemiddelde, ongeveer één goal per 130 minuten, maar verschillen zijn er vooral in de optredens bij Oranje. Huntelaar maakte één keer in de 99 minuten een interlandgoal en Van Persie deed daar 143 minuten over. Bovendien scoorde Van Persie weinig tegen de toplanden. Diezelfde cijfers boden weinig aanknopingspunten voor een goed vervolg van de loopbaan van Van Persie; zijn rendement liep de afgelopen seizoenen flink terug. Zo maakte Van Persie vier seizoenen geleden 0,8 doelpunt per wedstrijd, als benutte strafschoppen niet worden meegerekend. Later zakte dat tot minder dan de helft: 0,36 doelpunt per wedstrijd. Ook het aantal passes per wedstrijd daalde van 34 naar 23, net als het aantal assists en het aantal steekpasses. Zijn rendement wordt dus steeds lager. Heeft bondscoach Danny Blind misschien toch een beetje gelijk gehad door Van Persie niet meer op te roepen?
4. Walmart laat orkanen de vraag naar aardbeientaart voorspellen
Een grote big dataverzamelaar is de Amerikaanse supermarktketen Walmart. De analyse van grote bakken cijfers is erop gericht om de voorkeuren van consumenten te meten voordat hij of zij een stap in de winkel heeft gezet. Door het verzamelen en analyseren van bergen data kwam de supermarktketen erachter dat de verkoop van bevroren aardbeientaart met een zevenvoud toeneemt op het moment dat er een orkaan wordt voorspeld. Blijkbaar willen mensen dat in huis hebben als ze geen kant op kunnen. Ook het bier vliegt op zo’n moment de winkel uit.
Als grootste supermarkt van de wereld zit big data zo in het DNA van het bedrijf dat het assortiment wordt gebaseerd op wat er op social media allemaal gezegd wordt. Als er een run te verwachten is op allerlei bakproducten, zal Walmart het zeker niet missen. Voor Walmart zijn data zó belangrijk dat een analyse zelfs een rol speelt bij het werven van nieuw personeel. Walmart organiseerde een wedstrijd waarbij potentiële werknemers gedrag van consumenten moesten voorspellen op basis van data. Het leverde verschillende nieuwe knappe koppen op die zich maar met één ding bezighouden: voorspellen wat consumenten doen.
5. Predpol voorspelt waar de politie moet surveilleren
In de VS gebruiken verschillende politiekorpsen big data om te voorspellen waar misdrijven plaatsvinden. Het gaat om de toepassing genaamd Predpol, die aan de hand van plaats, tijd en soort criminaliteit kan voorspellen waar de inzet van de politie gewenst is om erger te voorkomen. Niet langer surveilleren politiekorpsen op willekeurige plekken in de stad, maar zorgen de data ervoor dat ze precies weten waar ze moeten staan. PredPol gebruikt ingewikkelde wiskundige formules om deze plekken realtime te voorspellen. De basis van de kennis wordt echter gevormd door simpele uitgangspunten: dat er nu eenmaal plekken bestaan waar van nature veel criminaliteit plaatsvindt zoals winkelcentra, herhalingscriminaliteit (als er wordt ingebroken, is de kans dat het opnieuw gebeurt groter) en nabijheid van criminaliteit (als er in jouw huis wordt ingebroken, is de kans op een inbraak groter bij je buren).
De resultaten van PredPol zijn goed. Toen in 2013 in Alhambra Predpol werd ingevoerd, nam datzelfde jaar het aantal auto-inbraken met 21 procent af ten opzichte van 2012. En in LA zag het politiebureau Foothill op 13 februari 2014 iets bijzonders gebeuren. Voor het eerst in vijftig jaar vond er die dag geen criminaliteit plaats. Ook het aantal slachtoffers van criminaliteit nam tussen 2009 en 2013 af met 23 procent. Bijzonder, voor een plek in de San Fernando vallei waar 250.000 mensen wonen.
Steeds meer cases die het succes onderstrepen
Big Data is geen doel op zich. Het gaat erom welke toepassingen je hebt na het analyseren ervan. De komende jaren komen er steeds meer mooie cases bij die het succes van big data onderstrepen. Denk aan slimme marketingtoepassingen, maar ook aan de cases op het gebied van veiligheid, mobiliteit en politiek. Toepassingen die we nu nog niet kunnen bevroeden. Ik kan niet wachten om te zien welke toepassingen de wereld op ons los zal laten. Watch this space!
Afbeeldingen met dank aan 123RF.com