Content 29 mei 2009 om 09:00 0 9 min lezen

5 reacties

De succesfactoren van usability onderzoek bij NS en SNS

Ronald Verschueren van Netmarketing UX

Woensdag 27 mei 2009 is wederom de Usability award toegekend. NS en SNS waren beiden door een jury van deskundigen genomineerd. Beide organisaties pasten een vergelijkbare methode toe bij het onderzoeken en verbeteren van de usability van hun ‘site in ontwikkeling’. In dit artikel gaan we in op de onderzoeksaanpak bij NS en SNS.

Zowel NS als SNS hebben gekozen om op een vergelijkbare iteratieve manier tijdens de ontwikkelingsfase van de site onafhankelijk usability onderzoek te laten uitvoeren. Na een korte inleiding volgen in dit artikel de belangrijkste factoren die tot het succes van het onderzoek en dus de usability van de sites van NS en SNS hebben bijgedragen.

Usability en usability onderzoek

Om tot een goede usable site te komen, is het van belang om met een groot aantal factoren rekening te houden. Voor beide sites was het webontwikkelbureau naast de websitebouwpartij verantwoordelijk voor zaken als het ontwikkelen van een site-concept op basis van klant- en merkwaarden, het in kaart brengen van behoeftes en het ontwikkelen van persona’s (archetypische beschrijvingen van gebruikers) en scenario’s. Zowel NS als SNS hebben daarnaast bewust gekozen voor een onafhankelijk usability onderzoek door een gespecialiseerd usability bureau (bij beide ging het om Netmarketing).

“Doelgericht iteratief onderzoeken tijdens de ontwikkelfase is de snelste weg naar maximale verbeteringen.”

Usability onderzoek heeft NS en SNS vooral (nieuwe) gebruikersinput gebracht. Globaal kan deze gebruikersinput betrekking hebben op zowel usability issues (verbeterpunten) als gedragsvoorkeuren van de doelgroep. Deze door het usability bureau op basis van onderzoek aangeleverde nieuwe gebruikersinput werd telkens door de bouwende partij in een nieuwe conceptversie van de te ontwikkelen site verwerkt. Vervolgens werd waar budgettair en tijdtechnisch mogelijk het geheel op iteratieve wijze opnieuw onderzocht zodat de sites steeds beter werden afgestemd op de doelgroep. Doelgericht iteratief onderzoeken is de snelste weg naar maximale verbeteringen.

Usability onderzoek bij NS en SNS

De NS heeft aparte onderzoeken laten uitvoeren voor de diverse onderdelen van de website, de Reisplanner en de menustructuren (door middel van cardsorting). De Reisplanner en site werden daarbij elk in opeenvolgende ontwikkelfasen onderzocht. Aanvullend op de onderzoeken met gebruikers uit de doelgroep werden diverse concepten en tussenontwerpen aan kort pragmatische expert reviews onderworpen.

SNS heeft eveneens haar site in verschillende ontwikkelfasen laten onderzoeken. Daarbij werden net als bij de NS telkens onderdelen apart onderzocht, zodat per onderzoek de scope van het onderzoek niet te breed zou worden ten koste van de diepgang. Zo is het onderdeel Hypotheken separaat onderzocht, evenals de onderdelen Betalen, Homepage en Klantenservice.

Voor zowel SNS als NS gold dat door verschillende onderdelen te onderzoeken er op algemene onderdelen (bijv. vlakverdeling, menu’s) ervaring kon worden opgedaan en lering kon worden getrokken voor andere site onderdelen. Het iteratieve karakter (onderzoeken, aanpassen en wederom met onderzoek toetsen) heeft in beide gevallen bijgedragen tot een bepaalde mate van user centered design met als gevolg een usable site.

De kwaliteitsbepalende factoren

Diverse factoren hebben voor NS en SNS de kwaliteit van het onderzoek beïnvloed, we noemen hieronder de belangrijkste:

Het belang van vroegtijdige aandacht voor usability.
De invloed van het aantal onderzoekers.
De invloed van de ervaring van onderzoekers.
Creëren van een realistische situatie:
o Kwaliteit van het klikmodel.
o Kwaliteit van de respondenten (deelnemers aan onderzoek).
Het aantal respondenten.
De noodzaak en kwaliteit van een onderzoeksplan

Ik behandel hieronder elk van deze factoren en geef aansluitend volgen nog enkele ervaringen en leerpunten.

1. Het belang van vroegtijdige aandacht voor usability

Circa vier jaar geleden vond nagenoeg 100% van het usability onderzoek voor websites plaats voor live sites. Een steekproef in een beperkte klantenkring onder bedrijven met omvang en profiel als NS en SNS leert dat dit in 2009 nog maar 20%-30% bedraagt. De overige 70%-80% van alle usability investeringen worden doorgaans besteed aan sites in ontwikkeling. Ook NS en SNS hebben het merendeel van hun investering gericht op de site in de ontwikkelfase. Met name NS (met een langere ontwikkelfase dan SNS voor de site tot nu toe) was er relatief erg vroeg bij in deze professioneel belangrijke trend.

Hiervoor bestaan duidelijke rationele redenen. Uit onderzoek van Prof. Dr Mark Neerincx blijkt dat het vroegtijdig detecteren van verbeterpunten in de ontwerpfase een factor 40 kostenverschil uitmaakt in vergelijking met het detecteren en verbeteren van dezelfde punten in de live fase.

Pressman wijst er in lijn met Neerincx op dat elke dollar geïnvesteerd in user-centered design (inbreng van usability tijdens de ontwerpfase) tussen de $2 en $100 opbrengt.

2. Twee onderzoekers zien meer dan één. Drie ook?

Uit eerder onderzoek van ondermeer Nielsen bleek dat twee onderzoekers tijdens het veldwerk meer usability issues vinden dan één onderzoeker. Dit mag als niet al te verrassend lijken, toch is de vraag of a) dit verschil groot is en b) het dan ook de moeite waard is om een derde of vierde onderzoeker toe te voegen.

Figuur 1: 3 onderzoekers vinden drastisch meer verbeterpunten dan 1 (bron: Nielsen)

Er blijkt hierbij sprake te zijn van een sterk afnemende meercurve: twee onderzoekers (die het veldwerk verdelen c.q. ieder voor de helft uitvoeren) nemen drastisch meer waar dan één. Het aantal extra gevonden usability issues bij het toevoegen van een derde of vierde onderzoeker neemt echter weer degressief verder af.

Bij zowel NS als SNS zijn daarom telkens twee tot drie onderzoekers per onderzoek ingezet. Nog meer onderzoekers leidt tot nog eens meer complexiteit tijdens de verwerking van de onderzoeksgegevens (analyse, conclusies, rapportage).

Het is daarom veelal niet aan te bevelen meer dan twee tot drie onderzoekers voor het veldwerk in te zetten. De geïnvesteerde tijd (en daarmee kosten) neemt hiermee niet toe, de kwaliteitstoename van het eindresultaat is echter erg groot te noemen.

3. Ervaring: ieder ziet wat, maar wie ziet het meest?

Tijdens het bijwonen van een usability onderzoek zullen alle meekijkers usability problemen waarnemen. De vraag is echter hoeveel problemen men waarneemt en of dit de belangrijkste problemen zijn.

“Ervaren specialisten zien tot bijna drie maal zoveel usability issues”.

Ook hier heeft Nielsen cs. meta-onderzoek verricht. Het blijkt dat de ervaring van de onderzoekers een groot effect heeft op het aantal te detecteren usability issues. In een case study van Nielsen werd aangetoond dat specialisten 2.7 maal zoveel issues vonden dan personen met geen usability specialisatie.

Ook ziet de specialist 1.5 maal meer dan personen met alleen algemene basiskennis over usability. De impact van ervaring is dus groot en blijft niet enkel beperkt tot de wijze van onderzoeksuitvoering of kwaliteit van de analyse. Ervaren onderzoekers detecteren dan ook sneller problemen en zien dus meer usability issues.

4a. Realistisch situatie: kwaliteit van het klikmodel

Het onderzoeken van een site in de ontwikkelingsfase vereist een weergave van de toekomstige situatie. Hiertoe kan een klikmodel worden ontwikkeld of kunnen afbeeldingen worden getoond. De ervaring leert dat:

respondenten in het algemeen doorgaans moeilijk kunnen omgaan met abstracte situaties
abstracte situaties tot minder betrouwbare metingen leiden
alle afwijkingen van de reële situatie verstorend op het onderzoek werken.

Voor betrouwbare metingen is het dus van belang dat een zo reëel mogelijke situatie wordt gepresenteerd aan gebruikers. Schema’s en schetsen toepassen in onderzoek zijn daarom vaak te beperkend en minder gewenst. Beter is het om een interactief klikmodel toe te passen.

Een interactief klikmodel kan vrij eenvoudig worden ontwikkeld op basis van het interaction design en het grafisch ontwerp. Echter, voor een grote en/of complexe site kan dit leiden tot veel ontwikkeluren voor het klikmodel. Dit werkt doorlooptijdverhogend, kostenverhogend en is vaak niet nodig. Beter is het om vanuit onderzoeksdoelen, taken en scenario’s de pagina’s van het klikmodel te bepalen. Op basis daarvan kan vervolgens meer gericht worden gewerkt aan een zo reëel mogelijke situatie. Reëel impliceert dat teksten, getallen, simulaties en weergaven zo realistisch mogelijk zijn.

Concreet heeft dit voor de NS bijvoorbeeld geleid tot weergave van data in de te onderzoeken NS Reisplanner die overeen kwamen met de onderzoeksdata, personalisatie van pagina’s op naam van de deelnemende respondent, Bij SNS ging het bijvoorbeeld om hypotheekberekeningen op basis van het budget van de respondent. Let wel: het betreft dus onderzoek met behulp van een realistisch klikmodel, waarbij ook deze variabelen per respondent gesimuleerd werden.

“Een enkel onrealistisch getal kan het onderzoek al drastisch verstoren”.

Het kan niet voldoende benadrukt worden dat hier zeer grote zorg aan moet worden besteed. Een enkel onrealistisch getal, per abuis achterblijvende Lorum Ipsum-tekst of haperende rekenmodule kan het onderzoek al drastisch verstoren met als gevolg een veel minder meetresultaat. Anderzijds kan met een onderzoekstechnisch zorgvuldig samengesteld model de hierover geïnformeerde respondent dusdanig in zijn of haar rol brengen dat deze vergeet in een klikmodel te surfen.

4b. Realistische situatie: soort en kwaliteit van respondenten

Ook de selectie van de juiste deelnemers aan het onderzoek is van grote invloed op de kwaliteit ervan. Respondenten die niet in de rol kunnen worden gebracht om de eenvoudige reden dat men de betreffende rol in real life ook niet aanneemt zijn per definitie ongeschikt. Wanneer bijvoorbeeld een rekenmodule voor hypotheken is bedoeld voor doorstromers boven de 40 jaar met een budget van € 400.000, dan zullen ook personen met exact dit profiel in het usability lab moeten verschijnen.

De kwaliteit van deelnemers kan geborgd worden door een juiste en tijdige briefing als ook een kwaliteitscontrole bij de ontvangst van de respondent. Dit laatste kan eenvoudigweg door de respondent een vragenlijst te laten invullen. Wanneer de respondent alsnog niet aan het profiel blijkt te voldoen rest maar één weg: die naar de deur.

5. Hoeveel respondenten zijn er nodig voor goed usability onderzoek?

Uit onderzoek van J. Nielsen bleek dat met vijf gebruikers ongeveer 80% van de usability problemen worden gevonden (Virzi, Nielsen). Nielsen definieert daarbij zorgvuldig confidence intervals. Het getal vijf is echter ten onrechte een eigen leven gaan leiden en voor een betrouwbaar usability onderzoek veelal niet voldoende.

Volgens Spool en Schroeder (2001) worden met vijf testpersonen slechts 35% van de problemen ontdekt uit het totaal aan problemen wat door een grotere groep werd ontdekt. Bovendien bleek uit onderzoek van Perfetti en Landesman (2002) dat elke persoon meer dan vijf en tot zeker de achttiende persoon vijf of meer problemen ontdekte die niet door de eerst vijf personen waren ontdekt.

Figuur 2: Bij toepassing van meer testgebruikers neemt het aantal gevonden usability problemen snel af (Nielsen, 2000).

Faulkner (2003) ontdekte dat het testen met vijf personen gemiddelde 85% van de usability problemen ontdekte. Echter, het percentage varieerde van bijna 100% tot slechts 55%. Het is dan ook niet binnen een acceptabele bandbreedte te stellen welk percentage van de usability issues zijn gedetecteerd. Gemiddelden zijn slechts bruikbaar indien de spreiding beperkt is.

Direct uitgaan van 5 testpersonen leidt dus tot de kans dat bijna de helft van de usability problemen niet worden gevonden. Met 10 deelnemers ontdekte zij gemiddeld 95% van de problemen, met minder spreiding: minimaal 82% werd in ieder geval gevonden.

Met 15 deelnemers werd 97% van de usability problemen gevonden met een minimum van 90%. Met meer onderzoeksdeelnemers neemt dus het aantal gevonden usability issues toe en neemt de spreiding af. Dat laatste is gunstig, we weten dan immers binnen een kleinere bandbreedte welk percentage van de usability issues zijn gevonden.

“Met 5 respondenten tast je in het duister over het percentage gevonden issues”.

Het kostenverschil tussen 10 of 15 respondenten hoeft niet groot te zijn: in beide gevallen moet er een onderzoeksplan worden gemaakt, onderzoek georganiseerd, data worden verzameld en geanalyseerd op vervolgens te rapporteren. De relatief geringe meerkosten geven de mogelijkheid meer issues te vinden door zowel dieper als breder te onderzoeken. Tijdens een onderzoek wordt daarmee met enkele extra respondenten ruimte gecreëerd om onverwachte zaken in observaties nader te kunnen onderzoeken.

6. Onderzoeksplan: test de test

In theorie zou men kort door de bocht enkele voor de hand liggende taken aan respondenten voor kunnen leggen, om deze vervolgens te observeren. Echter, enerzijds moeten deze taken rechtstreeks verband houden met onderzoeksdoelen en use cases.

Anderzijds is het scala van mogelijke onderzoeksmethoden en af te wegen registratiemethoden doorgaans dusdanig groot dat 60 minuten bruto onderzoekstijd per respondent te kort is. Er moeten dus afwegingen en keuzes worden gemaakt. Kortom: het onderzoek moet vooraf grondig worden ontworpen voor de betreffende situatie en vast worden gelegd in een onderzoeksplan.

“Het eerste wat getest moet worden is de test zelf.”

Voor zowel SNS als NS heeft het ontwerpen van een onderzoeksplan per onderzoek één tot twee dagen gevergd. Daarbij moet dit plan worden kortgesloten met de opdrachtgever en vooraf worden getest. Dit vooraf testen van de test is een cruciaal punt in het borgen van de kwaliteit van het onderzoeksplan en de uitvoering van het onderzoek.

Ervaringen en leerpunten

In het algemeen (en los van de hier aangeduide cases) blijkt nog vaak dat meekijkende ontwerpers zelf weinig tot soms nog nooit een usability onderzoek hebben meegemaakt. De grote vraag is dan waar de veronderstellingen met betrekking tot het gebruikersgedrag op zijn gebaseerd.

Beter is het om deze te baseren op onderzoekservaring, bijvoorbeeld opgedaan in een vergelijkend usability onderzoek. Door respondenten telkens voor de site belangrijk taken te laten uitvoeren op sites van anderen (bijv. concurrenten) kan meer diepgaande kennis van het gebruikersgedrag en de gebruikersvoorkeuren worden verkregen. Deze gedragscomponent kan als belangrijke bouwsteen dienen voor het uiteindelijke siteontwerp.

In bredere zin kan daaraan voorafgaand het hele gebruikersproces in onder meer focusgroeponderzoek worden achterhaald. Het gebruikersproces is het proces wat de gebruiker doorloopt in het bereiken van zijn of haar doel. De site is daarin een ondersteunend middel. In geheel andere situaties is achterhaald hoe mensen zich oriënteren op een nieuwe woning of een weekendje weg. In het klantproces van initieel idee naar uiteindelijke aankoop kan vervolgens worden bepaald hoe het middel site het proces ondersteunt.

Last but not least blijkt telkens weer dat niemand alle gevonden usability issues kan voorspellen. Hoe goed ook de ontwerper en de onderzoeker, hoe grondig ook het voortraject: onderzoek met respondenten uit de doelgroep levert altijd welkome verassingen op. De interpretatie van de verassingen vormt vaak een uitdaging. En zowel verassing als de interpretatie maken usability onderzoek een blijvend interessante zoektocht en nooit eindigend leerproces. Met als hoofddoel een optimale site, bij voorkeur net als NS en SNS geschikt voor een nominatie voor de Usability Award.

Lees 5 reacties

Over de auteur

Ronald Verschueren van Netmarketing UX Ronald Verschueren is oprichter en directeur van NetMarketing UX

8 artikelen Meer over Ronald Verschueren

Reacties (5)

Reactie annuleren

Karl Gilis

15 september 2009 om 9:09

Vreemd dat je beweert dat testen met 5 personen niet volstaat en dat je moet mikken op 10 à 15 personen. Nog vreemder dat je daarvoor refereeert naar Nielsen, die al jaren voorstander is van de beperkte methode met 5 à 6 personen per iteratie. Zie ook http://www.useit.com/alertbox/discount-usability.html
Ook in onze praktijk zie ik dat het veel efficienter is om te testen met 6 personen (da’s 1 dag) in plaats van 2 (da’s 2 dagen werk). Pas op: het is gemakkelijk geld verdienen met 2 dagen testen maar de meerwaarde is toch wel zeer beperkt. Hoe graag de klanten het ook willen, wij zullen het afraden en doorgaans zelfs weigeren.
Als de klant het budget heeft om 2x te testen, kan je beter 2x testen met 6 personen op 2 iteraties. Zo ontdek je vaak subtielere gebreken of eventueel selfs tekortkomingen die het gevalg zijn van aanpassingen. Een echte win-win situatie dus.

0 likes

reageer
Ronald Verschueren

15 september 2009 om 10:08

@Karl Ik geef de afweging weer tussen de verschillende onderzoeken en noem Nielsen in dat kader als slechts een van de partijen. Nielsen roept telkens vijf en blijft dit hardnekkig ongenuanceerd doen, ook op congressen. Als je zijn werk nader bekijkt (en zijn replieken op de vele kritieken) dan zien we meer nuance, nl. dat het gaat om a) vijf personen uit dezelfde doelgroep die b) telkens dezelfde taken uitvoeren. Daarbij noemt hij ook nog (brede) spreidingsintervallen. Nielsen en Virzi vermelden verder in gezamenlijke publikatie dat pas wanneer het aantal gevonden problemen bij telkens een extra testpersoon drastisch daalt geen testpersoon meer toe te voegen. Ook de in mijn artikel genoemde opmerking van Perfetti en Landesman is in dat kader belangrijk.

Nielsen heeft niet zomaar het absolute gelijk, zo blijkt uit bovengoemde afweging. Spool en Schroeder tonen aan dat soms slechts 35% van de usability problemen met 5 respondenten worden gevonden, wat m.i. een erg mager resultaat zou zijn. Wat we uit meta-onderzoek zeker weten is dat daaronder zich de belangrijkste usability problemen zullen bevinden, echter de spreiding in mogelijk gevonden usability problemen is met 5 personen vaak te groot. Je weet dan immers helemaal niet welk percentage dan gevonden is. Dat weet je wel bij inzet van een groter aantal respondenten. Een dag extra onderzoek leidt daarbij niet tot belangrijke extra kosten, echter het verhoogt de kwaliteit van het geheel in erg belangrijke mate.
Het ligt m.i. dus aan je onderzoeksdoel en kaders. Snel de belangrijkste zaken boven water, dan ben ik het met je eens: dan is 5-8 (1 dag testen) voor de paar belangrijkste issues mogelijk. Je laat dan wel mogelijk een groot deel liggen. Het is efficient en snel, verre van allesomvattend. Voor grote sites en diepgaandere onderzoeken (lees: veel taakopdrachten) en meerdere doelgroepen ontkom je op basis van bovenstaande wetenschappers in de praktijk voor een goed gefundeerd oordeel niet aan meer respondenten.
Bovenal is het m.i. niet zo dat een extra dag de onderzoekskosten drastisch verhoogd, bij lange na niet. De extra onderzoeksdag is dan in het totale kader een inspanning van relatief beperkte omvang daar alleen al het voorbereiden van een goed onderzoek (oa onderzoeksplan) vaak ruim een dag werk kost, naast de dagen voor analyse en rapportage. Dit voorbereiden, analyseren en rapporteren verandert niet in hoge mate als er een extra onderzoeksdag aan wordt toegevoegd.

0 likes

reageer
Karl Gilis

15 september 2009 om 10:45

Ik denk dat de grootte van het aantal te testen taken (en dus de website of het intranet) belangrijker is dan de doelgroep om het aantal respondenten te bepalen. Om echte verschillen tussen doelgroepen te zien, moeten deze toch al erg uiteenlopend zijn (bv. particulier versus businessklant) is onze ervaring. Ik heb de indruk dat veel onderzoeksbureau’s doelgroep zien als iets geslachts-, leeftijds- of opleidingsniveau gebonden. Eerlijk gezegd zie ik tussen dat soort ‘doelgroepen’ weinig verschillen als het echt op usability aankomt.
Als het gaat over de opdrachten of taken, denk ik dat er weinig websites zijn die meer dan een 5 totaal verschillende toptaken hebben. Veel webuitbaters denken (hopen?) misschien dat ze veel meer hebben, maar meestal valt dat toch tegen. Dus ook op dat vlak kunnen de meeste onderzoeken zich toch beperken tot een minimum aantal personen.
De allerbelangrijkste factor lijkt mij de ervaring van het team te zijn. Daar geef ik je absoluut gelijk dat er minstens 2 zeer ervaren experts moeten analyseren en noteren. Vermits zowat alle studies aangeven dat verschillende mensen (bureau’s?) verschillende zaken zien, vermindert daardoor voor een stuk de nood aan een grotere groep participanten. (Erlijk gezegd: als ik offertes van concullega’s zie waarin ze beweren dat er met 20 of 30 of zelfs 40 participanten getest moet worden, stel ik me veel vragen bij de bekwaamheid van hun experts.)
Het is goed dat verschillende onderzoeksbureaus verschillende visies hebben, en ik denk niet dat het grote gelijk bestaat. Ik wou alleen toch even je stelling van 10 tot 15 personen nuanceren. Ik ben akkoord dat voor zeer grote websites met zeer uiteenlopende doelgroepen en taken 12 personen nuttig zijn, maar voor de meeste websites volstaat het te testen met 6 personen. En als het qua budget mogelijk is liefst op 2 iteraties. Dat laatste is niet zo’n grote meerkost want het testplan kan waarschijnlijk voor een groot stuk behouden behouden blijven…
En laten we vooral aanraden aan bedrijven om regelmatig te testen en daarbij een beroep te doen op verschillende bureau’s. Want elke expert ziet andere dingen…

0 likes

reageer
Ronald Verschueren

21 september 2009 om 8:44

@Karl We gaan het denk ik niet helemaal eens worden, wat ook niet erg is. Ik ga voor de fundering uit van (wetenschappelijke) feiten en maak een afweging uit 6 op onderzoek gebaseerde papers van in totaal 8 wetenschappers. Gedreven door feiten uit metaonderzoek dus.
Het aantal verschillende ‘doelgroepen’ wordt vooral door het aantal taken en de functionele overlap hierin bepaald. Mee eens dus. Geslacht- en leeftijdsniveau zijn daarbij inderdaad niet vaak erg onderscheidend. Surfervaring is dat wel. Surfervaring is vaak weer gecorreleerd met leeftijds- en opleidingsniveau. Wij merken dat opleidingsniveau verder van belang is vanwege woordbegrip en abstract denkniveau. Dat hoeft inderdaad nog lang niet altijd te betekenen dat we een andere opleiding als een andere doelgroep hoeven te zien.
Al met al ben ik het er mee eens dat 20-40 respondenten in de meeste gevallen onzinnig is, vijf tot zes is echter op basis van de bovengenoemde uitgangspunten die ik hanteer te mager.
Onderzoeken laten zien dat meer researchers meer zien. Jij haalt dit terecht aan, evenals bovenstaand artikel. Daarbij tellen de persoonlijke observatiekwaliteiten van de onderzoeker, niet het bureau. Bovendien geldt dat per onderzoek. Als je echter klanten wilt doorverwijzen hou ik mij aanbevolen 😉

0 likes

reageer
Edwin Waelbers

27 maart 2011 om 8:48

Berucht is het filmpje van een groepje mensen die met een bal naar elkaar gooit. Vooraf vraagt men om het aantal passen te tellen die het witte team maakt.

Op een bepaald moment verschijnt een man verkleed als aap in beeld.

Als men achteraf vraagt of men iets vreemd heeft opgemerkt, dan zegt de meerderheid van niet en kunnen ze niet geloven dat er even een aap in beeld was.

Mensen die het filmpje niet kennen: Test je bewustzijn

M.a.w. vraag jezelf eens af hoeveel apen jij al niet gezien hebt tijdens het evalueren van gebruikers.

Leeftijd, geslacht, opleiding e.a. zaken zijn wÃ©l interessante kenmerken bij gebruikers. Er geen rekening mee houden is fout. Stel dat je wil meten of Daft Punk goede muziek maakt en dat je dit wel testen in een dans club.

Als je test participanten bestaan enkel uit oma’s en opa’s, dan zal na de eerste beats al, de dansvloer wellicht leeglopen.

Conclusie: Daft Punkt maakt geen goede muziek. Je kan niet veel eenvoudiger een foute conclusie trekken, me dunkt.

Zo is dat met interfaces ook. Een interface moet afgestemd zijn op 4 belangrijke peilers:

* de gebruiker zijn kenmerken
* de taak die hij met de interface verricht
* de omgeving (fysiek maar ook o.a. technisch)
* het doel

Je brengt die dingen in kaart en zal hiermee rekening houden in het selecteren van je test gebruikers. Het risico bestaat dat je anders al snel conclusies trekt zoals in het oma-opa-Daftpunk verhaal.

Laten we even naar een paar zo’n kenmerken kijken:

Animaties en muziek kunnen wel bij kinderen, maar niet bij andere groepen. Het Korte Termijn Geheugen is bij iedereen beperkt, maar vanaf ongeveer 55 jaar gaan de prestaties op dit facet nog meer achteruit. Vanaf ongeveer 50 jaar worden we allemaal een beetje kleurenblind, de lens wordt geler (door ouderdom), waardoor blauw als lichter wordt ervaren.

Ook het geslacht heeft een impact. Vrouwen en mannen zijn niet gelijk, maar wel gelijkwaardig. Ze hebben beide andere motorische en cognitieve vaardigheden. Vrouwen presteren bv. minder goed met commando-taal dialogen (Google gebruikt er Ã©Ã©n, maar brengt die wel gelaagd).

Opleiding is een ander nuttig kenmerk. Hoog opgeleiden zoeken anders en beter dan laag opgeleiden. Ze kunnen doorgaans ook een rijkere woordenschat aan, hebben minder nood aan “betutteling”.

Niet aanvaarden dat deze dingen bestaan en een invloed hebben op de usability, creÃ«ert dus apen. De apen die je niet ziet.

0 likes

reageer