index.html

In de inleiding van zijn boek vertelt Kahneman dat híj weliswaar het boek geschreven heeft maar dat de onderzoeken die eraan ten grondslag liggen zijn uitgevoerd in nauwe samenwerking met zijn vriend en collega Amos Tversky. De bedoeling van het boek voert hij terug op een artikel dat zij samen in 1974 publiceerden (Besluitvorming in onzekerheid: heuristiek en biases) en de bedoeling die zij daarmee hadden verwoordt hij als volgt.

“In de jaren zeventig van de vorige eeuw accepteerden sociale wetenschappers breed genomen twee ideeën over de menselijke natuur. Ten eerste dat mensen over het algemeen rationeel zijn en dat hun denken normaliter deugdelijk verloopt. En ten tweede dat emoties als angst, liefde en haat de meeste situaties verklaren waarin mensen hun rationaliteit laten schieten. Ons artikel stelde beide veronderstellingen ter discussie zonder ze direct te bespreken: we gaven voorbeelden van stelselmatige fouten in het denken van normale mensen en we brachten deze fouten in verband met het ontwerp van onze cognitieve toerusting en niet met de aantasting van ons denken door emoties”.

Deze verwoording is goed bruikbaar om ook de bedoeling van Kahnemans boek mee aan te geven. Want inhoudelijk gaat het in op de vraag hoe betrouwbaar en deugdelijk ons denken eigenlijk is. Daarbij besteedt hij veel aandacht aan de werking van causale intuïtie, dat wil zeggen: ons vermogen om overal oorzakelijke verbanden te zien, ook waar die er misschien niet zijn. Zoals Kahneman zegt: “omdat mensen geneigd zijn causaal te denken wanneer statistische redenatie passend en noodzakelijk is”.

Voor wat betreft presentatie sluit het boek aan bij het genoemde artikel doordat het boek eveneens uit wil gaan van “stelselmatige fouten in het denken van normale mensen”, zoals dat plaats vindt rond het koffieapparaat. Daar zijn eindeloos veel voorbeelden van stelselmatige denkfouten te signaleren. En omgekeerd: versterking van ons vermogen om beoordelings- en keuzefouten te herkennen en te begrijpen, bij anderen en uiteindelijk bij onszelf, kan daar, rond het koffieapparaat, beginnen door een rijkere en preciezere taal te gebruiken om deze fouten te bespreken. Het doel van zijn boek is om die taal aan te bieden.

Systeem 1 en Systeem 2

Door het hele boek heen maakt die taal gebruik van twee aanduidingen waaromheen Kahneman zijn verhaal drapeert. Dat zijn de aanduidingen ‘Systeem 1’ en ‘Systeem 2’. Die verwijzen naar twee manieren van menselijk denken over oorzaken. Systeem 1 doet dat door van gebeurtenissen steeds één of meer directe oorzaken aan te wijzen; het zoekt causale verklaringen. Systeem 2 doet dit door gebeurtenissen statistisch te verklaren.

Ik begin met korte omschrijvingen van aspecten van Systeem 1 en 2, om een eerste, globale indruk te geven van waar ze voor staan.

Systeem 1:

Machinerie van intuïtief denken, werkt snel
Impulsief, meer onbewust
Vertelt (of verzint) graag verhalen
Verzorgt de geheugenfunctie.

Illustratie:

Een honkbalknuppel met bal kost $ 1,10. De knuppel kost 1 dollar meer dan de bal. Hoe duur is de bal?

Waarschijnlijk dacht u direct aan tien.

Kahneman: “Dit experiment schetst een negatief beeld van beredenering in het dagelijks leven”.

Systeem 2:

Is in staat tot meer bewuste beredenering
Verzorgt een langzamere, meer weloverwogen en moeizamere vorm van denken
Maar is ook lui, in elk geval bij sommige mensen
Als het zijn luiheid overwint: betrokken, analytisch
Verantwoordelijk voor onze zelfbeheersing.

Zo dadelijk ga ik uitgebreider in op zowel Systeem 1 als Systeem 2, maar voor de presentatie van een beeld van de beide systemen geef ik eerst een paar omschrijvingen van de rolverdeling van de beide systemen ten opzichte van elkaar.

“‘Systeem 1 doet X’ is kortschrift voor ‘X komt automatisch tot stand’. En ‘Systeem 2 wordt opgeroepen om Y te doen’ is kortschrift voor ‘er komt opwekking tot stand, de pupillen verwijden zich, er ontstaat gerichte aandacht, en activiteit Y wordt uitgevoerd’.”
“De combinatie van het verhalen verzinnende Systeem 1 en het luie Systeem 2 impliceert dat Systeem 2 veel intuïtieve overtuigingen accepteert, die een nauwe weerspiegeling vormen van de door Systeem 1 gegenereerde indrukken. Systeem 2 kan wel checken, maar de input van Systeem 1 houdt nooit op”. Dat kun je dus niet uitzetten.
Systeem 1 houdt niet bij welke alternatieven voor een verhaal werden verworpen of dat er überhaupt alternatieven waren, bewuste twijfel behoort niet tot het takenpakket van Systeem 1. Dit vereist het bewaren van niet-gerelateerde interpretaties en alleen Systeem 2 is daartoe in staat. Onzekerheid en twijfel behoren tot het domein van Systeem 2.
“Systeem 2 wordt geactiveerd wanneer er iets plaatsvindt wat inbreuk doet op het wereldbeeld van Systeem 1. Dat is meestal wanneer een en ander ingewikkeld wordt en Systeem 2 heeft dan meestal het laatste woord”.
“Wanneer indrukken, ingevingen, intenties en gevoelens door Systeem 2 worden opgepikt, veranderen ze in overtuigingen. Impulsen veranderen in vrijwillig ondernomen handelingen. Als alles soepeltjes verloopt, wat meestal het geval is, pikt Systeem 2 de suggesties van Systeem 1 op met weinig of geen aanpassingen. U gelooft in de indrukken die u krijgt en handelt op basis van uw gevoelens. En dat is prima – meestal”.

Overigens heeft Kahneman geen voorkeur voor een van beide systemen, het ene is niet beter dan het andere. “Systeem 1 is de held van dit boek”, zegt hij wel ergens, maar dat vind ik inhoudelijk niet direct terug.

Systeem 1

“De voornaamste functie van Systeem 1”, zegt Kahneman, “is om een model van uw persoonlijke belevingswereld te onderhouden en bij te werken. Dit model wordt opgebouwd uit associaties tussen ideeën, gebeurtenissen, handelingen en ontwikkelingen die met enige regelmaat plaatsvinden, tegelijkertijd of binnen een redelijk kort tijdsbestek. Naarmate deze associaties sterker worden, zullen ze de structuur van de gebeurtenissen in uw leven gaan vertegenwoordigen en zowel uw interpretatie van het heden als uw toekomstverwachtingen bepalen”.

Wat hoort daar zoal bij?

Gevoeligheid voor priming. Priming is het verschijnsel dat blootstelling aan een bepaalde prikkel je geneigd maakt om een daarop volgende actie met die eerdere prikkel te verbinden. Dat gaat onbewust, denk aan de invloed van niet bewust waargenomen Coca-cola reclame tijdens een film. De kans dat je daarna zin hebt in Coca-cola is groot. Priming is dus het beïnvloeden van gedrag door een idee.
We weten dat priming invloed heeft op elk aspect van ons leven. Uit proeven is bijvoorbeeld gebleken dat het idee van geld ons gedrag beïnvloedt. Als we eerst aan geld gedacht hebben zijn we minder geneigd tot samenwerken en meer tot individualistisch gedrag dan als we daar niet aan gedacht hebben. Geld doet ons richting individualisme neigen.
Systeem 1 is niet statistisch aangelegd; het heeft een voorliefde voor directe, causale verbanden. Statistiek vereist dat we over veel verschillende dingen tegelijk nadenken, waaronder dingen die niet met elkaar te rijmen zijn en dat is iets waarvoor Systeem 1 niet ontworpen is.
Inconsistenties verstoren onze gedachten en de helderheid van onze gevoelens, dus als het werkelijk ingewikkeld wordt en de samenhang door Systeem 1 niet meer in stand kan worden gehouden maakt Systeem 1 ruimte voor Systeem 2.
De voorliefde van Systeem 1 voor overzichtelijkheid maakt dat het graag grijpt naar stereotypen en gemiddelden om zich een voorstelling te maken van dingen en gebeurtenissen. Dat hoeft niet negatief opgevat te worden, aldus Kahneman: “Stereotypering is in onze cultuur een beladen begrip, maar zoals ik het hier gebruik, is de betekenis neutraal. Een van de voornaamste kenmerken van Systeem 1 is dat het categorieën als normen of prototypen interpreteert. Dit is hoe we paarden, koelkasten en politieagenten opvatten”.
Je zou kunnen denken dat de geneigdheid tot gemiddelden toch wijst op een statistische aanleg van Systeem 1. Maar dat is niet zo. Want het zijn slordige gemiddelden die Systeem 1 gebruikt, op basis van slordige inschattingen, want Systeem 1 kan niet goed inschatten. De set van basisgegevens is over het algemeen te klein (dus: de steekproefomvang), Kahneman noemt dit soort ongefundeerde inschattingen een ‘mentaal hagelschot’.
Systeem 1 houdt van een goed verhaal, en dat valt vaak samen met de mogelijkheid van het aanwijzen van een duidelijke oorzaak. Neem de uitspraak: “Zeer intelligente vrouwen trouwen over het algemeen met minder intelligente mannen en omgekeerd”. De verklaring daarvoor is simpelweg dat er meer minder intelligente mannen beschikbaar zijn dan zeer intelligente mannen, dus statistisch van aard. Maar, zegt Kahneman, dat is niet echt een verhaal dat veel voldoening schenkt, omdat we allemaal liever horen dat er iets is in zeer intelligente vrouwen dat maakt dat ze vallen op minder intelligente mannen, maar helaas het is niet anders.
Nog zoiets. Als een bedrijf vorig jaar uitzonderlijk slecht gedraaid heeft, dan ligt het alleen al vanuit statistisch oogpunt voor de hand om te denken dat het dit jaar beter zal gaan. Maar, aldus Kahneman, “een deskundige die verkondigt dat een bedrijf ‘het beter doet dan vorig jaar omdat het vorig jaar slecht had gepresteerd’ zal weinig zendtijd worden gegund. In plaats hiervan betalen we mensen heel aardige bedragen om interessante verklaringen voor regressie-effecten (neiging tot het gemiddelde) te verzinnen”.

Als Systeem 1 zo duidelijk de mist in gaat in allerlei situaties, waarom heeft het zich evolutionair dan toch bewezen, en zijn we er allemaal mee uitgerust? Dat komt omdat de snelheid en twijfelloosheid ervan ook evolutionair voordeel bood; het is onderdeel van onze overgeërfde waakzaamheid. Systeem 1 biedt het zekere voor het onzekere. En in noodsituaties, als er actie vereist is, heb je liever geen twijfel. “Systeem 1 is ongetwijfeld de bron van veel wat we verkeerd doen, maar daarnaast ook de oorsprong van het meeste van wat we goed doen – wat ook het meeste is dat we doen”.

Systeem 2

Systeem 2 is wél in staat tot twijfel, omdat het verschillende niet-rijmende, dus niet bij elkaar passende mogelijkheden kan verwerken. Twijfel vergt echter meer inspanning dan geloof ergens in. Dat is een probleem, want Systeem 2 is lui en levert die inspanning niet graag. De mensen die de zonde van intellectuele luiheid kunnen weerstaan, kunnen we meer ‘betrokken’ noemen. Deze individuen zijn alerter, intellectueel actiever, minder snel bereid om genoegen te nemen met op het eerste gezicht aanlokkelijke antwoorden, sceptischer ten opzichte van hun eigen ingevingen.

Wat hoort daarbij?

Een statistische aanleg. Systeem 2 is in tegenstelling tot Systeem 1 wél statistisch aangelegd. Dat wil zeggen, het bezit de capaciteit om snelle grote conclusies die worden getrokken op basis van kleine getallen, dus te kleine steekproeven, in twijfel te trekken. Het kan opvattingen falsifiëren.
Maar, in de uitoefening van die functie is Systeem 2 beslist geen toonbeeld van rationaliteit. Ons denken verloopt niet altijd foutloos en daarvoor geeft Kahneman drie oorzaken. Systeem 2 is lui, het vermijdt mentale inspanning en vaak zal het de suggesties van Systeem 1 klakkeloos overnemen. Soms is Systeem 2 met andere dingen bezig en soms is Systeem 2 onwetend.
Systeem 2 komt nauwelijks zelf in actie, de aanzet daartoe komt meestal van een cognitieve crisis van Systeem 1. Daardoor wordt Systeem 2 gemobiliseerd dat vervolgens het intuïtieve, door Systeem 1 aangedragen antwoord kan verwerpen.
Systeem 2 heeft een ondankbare taak. Je scoort niet makkelijk met de ontmaskering van bias. Bovendien is voor sommige positieve actie een optimistische bias wel nodig, en dat maakt de taak voor Systeem 2 nog ondankbaarder.

Overigens, als er een fout intuïtief oordeel wordt geveld, is zowel Systeem 1 als Systeem 2 hier schuldig aan.

Humans en Econs

Het onderscheid tussen Systeem 1 en Systeem 2 kan gekoppeld worden aan een andere onderscheiding die soms gemaakt wordt, met name op het terrein van de economische wetenschap.

Daar kent men namelijk het concept van ‘de rationele actor’ dat inhoudt dat deelnemers aan het economische verkeer geacht worden strikt rationeel te handelen. Zij zijn uit op het behalen van eigen voordeel binnen de kaders van de wet; zij zijn op de hoogte van wat voordelig is voor hen, kennen via het marktmechanisme de prijs daarvan en nemen op basis daarvan hun strikt rationele beslissingen.

Maar het concept van de rationele actor stuit ook op veel weerstand. Tegenstanders, vooral te vinden binnen de gedragseconomie, noemen het beeld van de strikt rationeel handelende mens een fictie. In werkelijkheid is de mens volgens hen een vat vol tegenstrijdigheden en zijn zijn beslissingen, ook economische, het resultaat van een mengsel van intuïtie, grilligheid en denkwerk.

Vanuit dit perspectief zou je kunnen zeggen dat de wereld bevolkt wordt door twee mensentypen, en daarop voortbordurend hebben in 2008 de econoom Richard Thaler en de jurist Cass Sunstein in hun gedragseconomische boek Nudge de woorden ‘Econs’ en ‘Humans’ ingevoerd. Daarbij staat Econ voor de rationele actor van de hardcore economische wetenschap, die eigenlijk in een theoretische wereld leeft; en Human voor de grillige mens zoals we die uit de werkelijkheid kennen.

Hier liggen aanknopingspunten voor de begrippen Systeem 1 en Systeem 2, hoewel ze niet één op één te koppelen zijn aan Human en Econ. Het volgende voorbeeld toont ons de aanknopingspunten.

“Twee fanatieke sportliefhebbers zijn van plan 70 kilometer te reizen om een basketbalwerdstrijd te zien. Eén van hen heeft voor zijn kaartje betaald; de andere was op weg om een kaartje te kopen toen hij er een voor niets door een vriend kreeg aangeboden. Het weerbericht waarschuwt voor een sneeuwstorm op de avond van de wedstrijd. Welke van de twee kaarthouders zal de sneeuwstorm eerder trotseren om de wedstrijd te zien?”

“We hoeven niet lang over het antwoord na te denken: we weten dat de liefhebber die voor zijn kaartje betaald heeft, zich niet door de storm zal laten afschrikken. Het verschijnsel Mentale rekening maakt dit verklaarbaar, dat wil zeggen: het bestaan van een rekening waarin ook de emotionele betrokkenheid van de actor verwerkt is. Het saldo van die rekening is duidelijk negatiever voor degene die een kaartje gekocht heeft en die er, behalve dat hij de wedstrijd heeft gemist, ook financieel bij is ingeschoten. Omdat thuisblijven voor deze fan een slechtere zaak is, is hij sterker gemotiveerd om de wedstrijd bij te wonen en daarom ook meer geneigd om de sneeuwstorm te trotseren. Dit zijn onbewuste berekeningen van emotioneel evenwicht, van het soort dat Systeem 1 zonder nadere overwegingen uitvoert.”

“Econs hebben daar geen last van. De emoties die mensen met de stand van hun mentale rekeningen verbinden, worden in de economische standaardtheorie niet erkend. Een Econ zou zich realiseren dat het kaartje al betaald is en niet ingewisseld kan worden. De kosten van het kaartje zijn reeds gemaakt en voor de Econ zou het niet uitmaken of hij het kaartje voor de wedstrijd gekocht had of het van een vriend had gekregen (aangenomen dat Econs vrienden hebben). Om dit rationele gedrag ten uitvoer te brengen zou Systeem 2 van de betalende liefhebber zich bewust moeten zijn van de contrafeitelijke mogelijkheid: ‘Zou ik nog steeds bereid zijn om de sneeuwstorm te trotseren als ik het kaartje voor niets van een vriend had gekregen?’ Het vraagt actief en gedisciplineerd denken om zo’n moeilijke vraag te formuleren.”

In het schema van Econs versus Humans zijn dus de begrippen Systeem 1 en Systeem 2 in te brengen. In dit geval Systeem 1 aan de kant van de Human met zijn emotionele afgeleidheid, en Systeem 2 aan de kant van de Econ die zich niet van de rationele wijs laat brengen.

Maar geheel eenduidig is het niet, met name niet aan de kant van de Econs. Want in hun kritiek op de emotionaliteit van Systeem 1 maken ze misschien wel gebruik van Systeem 2, namelijk de mogelijkheid tot kritische afstand van Systeem 2. Maar vervolgens vervallen de Econs op hun beurt in Systeem 1.

Econs hebben namelijk een absolute voorliefde voor consistentie. De enige toets voor economen en beslissingstheoretici van rationaliteit is niet of iemands overtuigingen en voorkeuren redelijk zijn, maar of ze onderling consistent zijn. Een rationele persoon mag in spoken geloven zolang al zijn andere overtuigingen met het bestaan van spoken overeenstemmen. Een rationele persoon kan ervoor kiezen om gehaat in plaats van geliefd te worden zolang zijn voorkeuren consistent zijn. Rationaliteit is logische samenhang, redelijk of niet.

Maar was het creëren of zelfs forceren van samenhang niet juist een trekje van Systeem 1? Het kenmerkende van Systeem 2 is dat het kan omgaan met niet-samenhangende, niet-rijmende, niet bij elkaar passende gegevens. Dat is wat anders dan de rücksichtlose consistentie van de Econs. Econs maken dus op hun beurt het verhaal iets te mooi en samenhangend, en vertonen daarmee een typisch Systeem 1 trekje.

Iets soortgelijks paradoxaals zit er in de bewoordingen waarin Kahneman de relatie tot de werkelijkheid benoemt van Systeem 1 en 2 en van Econs en Humans. Van Systeem 1 zegt hij dat de keuzen van Systeem 1 niet in de werkelijkheid verankerd zijn omdat Systeem 1 niet in de werkelijkheid verankerd is. Maar de Humans, die primair met Systeem 1 geassocieerd worden, zijn voor hem degenen die juist in de echte wereld optreden, terwijl voor hem de Econs wonen in het land van de theorie.

Tenslotte nog een opmerking over de politieke consequenties van de twee gezichtspunten van Econs en Humans, als het gaat om keuzen te maken. De Econs zijn bij uitstek te vinden in de aanhangers van de economische leer die bekend staat als de Chicago School, waarvan Milton Friedman een exponent is. Voor die school is het maken van keuzen en beslissingen in wezen een kwestie van strikt rationeel doorredeneren, en daarmee niet zo moeilijk omdat mensen die rationeel handelen geen fouten maken. Daar hoeft de regering burgers niet bij te helpen. “In een natie van Econs moet de regering zich afzijdig houden en Econs de vrijheid geven”.

Voor gedragseconomen die eerder Humans zien dan Econs is het leven complexer dan voor de belijders van menselijke rationaliteit. Volgens hen is er een rol weggelegd voor de overheid om mensen te ondersteunen in het maken van hun keuzen. De overheid mag prikkelen of afremmen, vandaar de titel Nudge (‘een zetje geven’) voor het boek van Thaler en Sunstein.

Expertise versus algoritmen

Een ander begrippenpaar dat je tot op zekere hoogt kunt koppelen aan het begrippenpaar Systeem 1 en Systeem 2 is dat van expertise en algoritmen. Daarbij staat expertise voor de door een ervaren vakman verworven vaardigheden en intuïtie; expertise sluit daardoor aan bij Systeem 1. Algoritmen staan voor de kennis van een proces die is vastgelegd in formules; daarbij wordt gebruik gemaakt van statistische informatie, zodat algoritmen goed aansluiten bij Systeem 2.

Wanneer je deze koppeling maakt worden Systeem 1 en Systeem 2 regelrecht het conflict ingezogen dat uitgevochten wordt op het terrein van de besliskunde, dat wil zeggen van de wetenschap die zich bezighoudt met de vraag hoe goede beslissingen tot stand komen. Want daarbinnen bevinden zich scholen die zweren bij geïnformeerde intuïtie, dus zeg maar expertise. En andere scholen stellen dat geobjectiveerde formules de beste beslissingen opleveren.

Bij die laatste groep hoort de Amerikaanse psycholoog Paul Meehl. Paul Meehl hield zich in de jaren vijftig en zestig bezig met de vraag of beslissingen van geschoolde professionals op grond van subjectieve indrukken nauwkeuriger waren dan statistische voorspellingen op grond van een klein aantal scores of beoordelingen aan de hand van een regel. Uit zijn onderzoek kwam naar voren dat de algoritmen het beter deden. Bijvoorbeeld als het ging om voorspellingen en daarop gebaseerde beslissingen aangaande voorwaardelijke invrijheidstelling van gedetineerden, de cijfers van eerstejaarsstudenten en succes in de opleiding van piloten.

Voor mensen die in experts geloven, waren de resultaten vernietigend. Men was geschokt en een groot aantal vervolgonderzoeken volgde. Het aantal onderzoeken naar de vergelijking van klinische voorspellingen (dus op basis van expertise) en statistische voorspellingen is opgelopen tot ruwweg 200, maar de score in de strijd tussen algoritmen en mensen is onveranderd gebleven. Rond 60 procent van de onderzoeken heeft een significant hogere nauwkeurigheid voor de algoritmen aangegeven.

De belangrijkste tendens in de conclusies uit al die onderzoeken is dat een algoritme dat op de achterkant van een envelop wordt gekrabbeld, vaak goed genoeg is om het oordeel van een expert te overtreffen.

Een klassieke toepassing van deze benadering is een simpel algoritme dat het leven van honderdduizenden zuigelingen heeft gered. Verloskundigen wisten altijd al dat een zuigeling die binnen enkele minuten na de geboorte niet normaal ademhaalt, een grote kans loopt op hersenschade of overlijden. Tot 1953, toen anesthesiologe Virginia Apgar de Apgar-test ontwikkelde, vertrouwden artsen en verloskundigen op hun klinische oordeel om vast te stellen of een baby problemen had. Ze baseerden zich daarbij strikt persoonlijk op verschillende aanwijzingen. Sommigen richtten zich op ademhalingsproblemen, terwijl anderen erop letten hoe snel de baby ging huilen. Bij gebrek aan een gestandaardiseerde procedure werden alarmerende symptomen vaak over het hoofd gezien, waardoor veel pasgeboren baby’s overleden.

De systematische beoordeling die Apgar daarvoor in de plaats stelde behelsde de vaststelling van vijf belangrijke variabelen, namelijk: hartslag, ademhaling, reflex, spiertonus en kleur; en drie mogelijke kwaliteitsscores voor elke variabele, namelijk: 0, 1, of 2. Een baby met een totaalscore van 8 was doorgaans roze, kronkelde, huilde, trok gezichten en had een pols van honderd of meer: tekenen van goede gezondheid. Een baby met een score van 4 of minder was meestal blauw, slap en passief en had een langzame of zwakke pols: een aanleiding om direct in te grijpen. De Apgar-test wordt nog steeds dagelijks in elke verloskamer gebruikt. De formule wordt aangemerkt als een belangrijke bijdrage aan het terugdringen van zuigelingensterfte.

Een ander voorbeeld betreft de beoordeling van Bordeauxwijnen. De econoom aan Princeton en wijnliefhebber Orley Ashenfelter heeft een overtuigende demonstratie gegeven van het vermogen van simpele cijfers om wereldberoemde experts voorbij te streven. Ashenfelter wilde de toekomstige waarde van superieure bordeauxwijnen voorspellen aan de hand van informatie die beschikbaar is in het jaar dat ze gemaakt worden zoals de gemiddelde temperatuur tijdens het groeiseizoen in de zomer, de hoeveelheid regen in het oogstseizoen en de totale regenval in de afgelopen winter. Die gegevens stopte hij in een formule, en die levert vervolgens nauwkeurige prijsvoorspellingen op voor jaren en decennia in de toekomst, zelfs veel nauwkeuriger dan de courante prijzen van jonge wijnen dit doen. Deze uitkomst zet vraagtekens bij de expertise van de deskundigen die met hun beoordeling aan de prijsvorming van jonge wijnen hebben bijgedragen.

Waarom doen experts het minder goed dan algoritmen? Een door Meehl veronderstelde reden is dat experts proberen slim te zijn. Zij treden in hun denken buiten de gebruikelijke kaders en nemen bij het maken van hun voorspellingen complexe combinaties van kenmerken in beschouwing, bijvoorbeeld – in het geval van wijn – door te proeven. Ze weten vaak ook meer, maar daardoor gaat de illusie met hen op de loop. Mensen die meer weten, voorspellen iets beter. Maar de mensen met de meeste kennis zijn vaak weer minder betrouwbaar. De reden is dat iemand die meer kennis vergaart dan anderen, ook een sterkere illusie van vaardigheid ontwikkelt en door overmatig vertrouwen zijn zicht op de werkelijkheid verliest.

Een andere reden is dat mensen onverbeterlijk inconsistent zijn in het samenvattend beoordelen van complexe informatie. Wanneer hun gevraagd wordt dezelfde informatie twee keer te beoordelen, geven ze vaak verschillende antwoorden. Deze inconsistentie kan ernstige vormen aannemen. Bijvoorbeeld: ervaren radiologen die thoraxfoto’s als ‘normaal’ of ‘abnormaal’ beoordelen, spreken zichzelf 20 procent van de keren tegen als ze op verschillende momenten dezelfde foto onder ogen krijgen. Uit een onderzoek onder 101 zelfstandige accountants die gevraagd werden de betrouwbaarheid van interne controles van ondernemingen te beoordelen, bleek eenzelfde hoge mate van inconsistentie. Een vergelijkende analyse van 41 afzonderlijke onderzoeken naar de betrouwbaarheid van accountants, pathologen, psychologen, managers en andere professionals doet vermoeden dat dit niveau van inconsistentie algemeen voorkomt, zelfs wanneer een bepaald geval binnen enkele minuten opnieuw wordt beoordeeld. Deze wijdverbreide inconsistentie is waarschijnlijk te wijten aan de sterke contextafhankelijkheid van Systeem 1. Dat kijkt vaak niet langer dan zijn neus lang is. Mensen voelen maar zelden de behoefte om de cijfers te kennen van de klasse waartoe het geval behoort, dus zaken in breder verband te zetten. Statistische informatie wordt als saai ervaren en stelselmatig opzijgeschoven wanneer deze niet overeenstemt met persoonlijke indrukken van een geval.

De eerste les die we hieruit kunnen trekken, aldus Kahneman, is dat voorspellingsfouten onvermijdelijk zijn omdat de wereld complex en onvoorspelbaar is. De tweede dat een sterk subjectief vertrouwen niet mag worden gezien als een indicatie van nauwkeurigheid.

Alles bij elkaar luidt volgens Kahneman de conclusie dat er maar weinig omstandigheden zijn waarin het verstandig is om een formule door een beoordeling te vervangen. Dat besef heeft de aanzet gegeven tot het recente boek A checklist Manifesto van Atul Gawande waarin nog veel meer voorbeelden staan van het nut van controlelijsten en eenvoudige regels.

Tegelijkertijd valt op dat algoritmen en formules veel vijandigheid opwekken. De reacties in Franse wijnkringen liepen volgens The New York Times uiteen tussen heftig en hysterisch, het gebruik van algoritmen werd vergeleken met het recenseren van films zonder die zelf gezien te hebben. Vaak hebben de debatten die daaruit voortkomen een morele dimensie. In de medische beroepsgroep komt dit tot uiting in een trotse nadruk op het unieke karakter van gevallen en weerzin tegen evidence-based werken. De onpersoonlijkheid van werkwijzen die door statistieken en controlelijsten worden bepaald stuit tegen de borst. “U maakt robots van ons!”, is dan het commentaar.

Relevant voor management en organisatie

De relevantie van deze kwesties voor management en organisatie heeft zich waarschijnlijk al aan jullie opgedrongen, want zitten we hier niet midden in het debat over de verhouding tussen management en professionals (denk aan het boek van Matthieu Weggeman Leidinggeven aan professionals? Niet doen!)? Daarom is het eerste onderwerp om hieronder te behandelen: In hoeverre kun je professionals vertrouwen? Daarnaast zal het gaan over de mogelijkheden tot inschatting van leiderschapskwaliteiten.

In hoeverre kun je professionals vertrouwen?

Meehls publicatie en de stroom van daarop volgende onderzoeken hadden Kahneman op een bepaald spoor gezet. En dat spoor luidde als volgt: statistische algoritmen zijn mensen in omgevingen met veel ruis veruit de baas om twee redenen: ze zijn beter in staat dan menselijke beoordelaars om laagvalide aanwijzingen te ontdekken; en ze zijn veel beter in staat om een bescheiden niveau van nauwkeurigheid in stand te houden door zulke aanwijzingen consistent te gebruiken.

Nu waren er in Kahnemans omgeving wel wetenschappers met een diepe aversie tegen algoritmen en checklists, die hij als wetenschappers toch zeer waardeerde. Eén van hen was Gary Klein, die hij onder andere bewonderde om zijn onderzoeken naar de expertise van brandweerlieden. Klein vertelde daarover het volgende verhaal.

“Een ploeg brandweerlieden ging een huis binnen waar de keuken in brand stond. Kort na het moment waarop de mannen de waterslangen op het vuur hadden gericht, hoorde de commandant zichzelf roepen: “Wegwezen allemaal!”, zonder te beseffen waarom. Bijna direct nadat de brandweerlieden zich hadden teruggetrokken, stortte de vloer in. Pas naderhand besefte de commandant dat het vuur ongebruikelijk rustig was geweest en zijn oren ongebruikelijk heet. Deze indrukken alarmeerden bij hem wat hij een ‘zesde zintuig voor gevaar’ noemde. Hij had geen idee van wat er fout kon gaan, maar hij wist dat er iets niet klopte. De brandhaard bleek niet in de keuken te liggen maar in de kelder onder de plek waar de mannen gestaan hadden.”

Kahneman vond het wel een uitdaging om met deze duidelijk andersgezinde maar bekwame wetenschapper nader te kijken naar de problematiek rondom expertise en professionals. Zij besloten tot de opzet van een gezamenlijk onderzoek en richtten zich op de volgende vraag: wanneer kun je een ervaren professional vertrouwen als deze zich op een intuïtie beroept? Het lag voor de hand dat Klein eerder geneigd zou zijn deze persoon te vertrouwen en dat Kahneman sceptischer zou zijn. Maar zouden ze het eens kunnen worden over principes om de algemene vraag te beantwoorden?

Klein en Kahneman werden het al gauw eens over de aard van intuïtieve vaardigheid en hoe deze verworven wordt. Maar de hamvraag was: wanneer kun je daar vertrouwen in stellen?
Voor het antwoord dat zij daarop gaven volg ik nu even de beschrijving van Kahneman.

“Uiteindelijk kwamen we tot de conclusie dat ons verschil van mening voor een deel te wijten was aan het feit dat we verschillende soorten experts in gedachten hadden. Klein had veel gewerkt met brandweercommandanten, verpleegkundigen en andere professionals met werkelijke expertise. Ik had me vaker beziggehouden met medici en therapeuten, beleggingsadviseurs en politieke wetenschappers die proberen onhoudbare voorspellingen op lange termijn te doen. Daarom was het niet verrassend dat hij uitging van vertrouwen en respect, en ik van scepsis.”

“Hij was eerder bereid om experts die zich op een intuïtie beroepen te vertrouwen omdat echte experts, zoals hij me vertelde, de grenzen van hun kennis kennen. Ik bracht daartegen in dat er veel pseudo-experts zijn die er geen idee van hebben dat ze niet weten wat ze doen (de illusie van validiteit) en dat mensen over het algemeen op ontoereikende gronden te zelfverzekerd zijn.”

“Klein en ik werden het uiteindelijk eens over een belangrijk principe: het vertrouwen dat mensen stellen in hun intuïties is geen betrouwbare aanwijzing voor hun validiteit. Met andere woorden: vertrouw niemand – met inbegrip van jezelf – die je voorhoudt dat je je sterk op je intuïtieve oordeel moet verlaten.”

“Hoe kunnen we, als intuïtieve zekerheid niet vertrouwd mag worden, de waarschijnlijke validiteit van een intuïtieve beoordeling evalueren? Wanneer geven zulke oordelen blijk van werkelijke expertise? En wanneer van een illusie? Het antwoord komt voort uit de twee basisvoorwaarden voor het verwerven van een vaardigheid: ten eerste een omgeving die voldoende regelmatig is om voorspelbaar te zijn; en ten tweede de gelegenheid om deze regelmatigheden door langdurige oefening te leren. Wanneer aan deze beide condities wordt voldaan, zijn intuïties waarschijnlijk te vertrouwen.”

“Aan het eind van ons project werden Gary Klein en ik het eens over een algemeen antwoord op onze aanvankelijke vraag: wanneer kun je een ervaren professional vertrouwen die zich op een intuïtie beroept. Onze conclusie was dat het in de meeste gevallen mogelijk is onderscheid te maken tussen intuïties die waarschijnlijk valide zijn en intuïties die dat niet zijn”.

En daarbij is het oppassen geblazen, voegt Kahneman nog toe, voor de overtuiging van professionals dat ze een onmogelijke taak met succes kunnen volbrengen. Aanspraken op trefzekere intuïties in een onvoorspelbare situatie getuigen op zijn best van zelfmisleiding, en soms van iets wat kwalijker is. Intuïtie is niet iets magisch en is niet te vertrouwen bij afwezigheid van stabiele regelmatigheden in de omgeving.

Wat bleef, ook na de samenwerking tussen Kahneman en Klein, waren hun verschillende attitudes. “We ontdekten ook dat onze eerdere verschillen meer inhielden dan een intellectueel meningsverschil. We hadden verschillende attitudes, emoties en voorkeuren, en die veranderden in de loop van de jaren opmerkelijk weinig”.

En, zo moet Kahneman toegeven: Het statistische bewijs voor de inferioriteit van het oordeel van experts is in tegenspraak met hun alledaagse ervaring van de kwaliteit van hun oordelen. Dat kan de vijandigheid tegenover algoritmen van veel mensen verklaren.

Inschatting van leiderschapskwaliteiten

Kahneman is niet bang om de werking van illusies ook bij zichzelf te signaleren. Hij vertelt hoe hij tijdens zijn dienstplicht in het Israëlische leger als net afgestudeerde psycholoog moest helpen bij het beoordelen van kandidaten voor de officiersopleiding. Daarvoor moest hij met collega’s observeren hoe een groep kandidaten een bepaalde opdracht uitvoerde.

Dan vertelt hij: “Terwijl een collega en ik het verloop van deze oefening volgden, legden we vast wie de leiding nam, wie probeerde te leiden maar werd afgewezen, en hoe coöperatief elke soldaat zich opstelde bij het volbrengen van deze groepsopdracht. We zagen deelnemers die eigenzinnig, onderdanig, arrogant, geduldig, heetgebakerd of vasthoudend leken, of het al snel opgaven. We kregen het gevoel dat de ware aard van elk van deze mannen zich onder de druk van deze opdracht openbaarde. De indruk die we kregen van het karakter van elke kandidaat, was even direct en dwingend als de kleur van de hemel.”

“Na onze waarnemingen moesten we onze indrukken van de leiderschapskwaliteiten van de soldaten samenvatten en aan de hand van een cijferscore vaststellen wie van hen in aanmerking kwam voor de officiersopleiding. Deze taak was niet moeilijk omdat we het gevoel hadden dat we de leiderschapsvaardigheden van al deze soldaten al gezien hadden. Wanneer onze gebundelde observaties van elke kandidaat zich tot een samenhangend verhaal verenigden, waren we volstrekt overtuigd van onze beoordeling en kregen we het gevoel dat wat we hadden waargenomen, direct voorspellend was voor de toekomst. De soldaat die het overnam toen de groep in moeilijkheden was geraakt en het team over de muur wist te krijgen, was op dat moment een leider. De voor de hand liggende verwachting over hoe hij het zou doen in de opleiding of in het gevecht, was dat hij daar even effectief zou zijn als bij de muur.”

“De aanwijzingen die enige tijd later loskwamen dat we niet met nauwkeurigheid succes konden voorspellen, waren overweldigend. Om de paar maanden hadden we een feed-backsessie waarbij we te horen kregen hoe de cadetten het ervan afbrachten tijdens de officiersopleiding. Het verhaal was steeds hetzelfde: ons vermogen om prestaties in de opleiding te voorspellen was te verwaarlozen. Onze voorspellingen waren beter dan blinde gissingen, maar niet veel beter. Maar het was nog erger: die treurige waarheid had maar heel weinig effect op het vertrouwen dat we hadden in onze oordelen en voorspellingen over individuen.”

“Achteraf vond ik wat er met ons gebeurde heel opmerkelijk. Het deed me denken aan de Müller-Lyer-illusie, die van het vinnenplaatje, en ik noemde deze illusie: de illusie van validiteit, mijn eerste cognitieve illusie. Die hield dus in dat, zelfs bij aanwezigheid van gegevens die duidelijk maken dat onze oordelen meestal waardeloos zijn, onze subjectieve ervaring van zekerheid onaangetast blijft.”

Kahneman verbindt hieraan de conclusie dat de kwaliteit van leiderschap en managementpraktijken niet betrouwbaar uit waarnemingen van succes kan worden afgeleid. Daarvoor speelt het toeval een te belangrijke rol. Ondertussen dénken we wel dat we dat kunnen.

Veilig bij

Een groot vertrouwen in de ratio heeft mij altijd argwaan ingeboezemd. Welnu, daar kun je Kahneman niet van betichten, dus daar voel ik me wel veilig bij. Hij wordt niet moe te benadrukken hoezeer belangrijke keuzen gemaakt worden onder invloed van volstrekt irrelevante kenmerken van de situatie. En hoezeer dat indruist tegen de manier waarop we ons denken (willen) ervaren, namelijk als iets waarin we autonoom zijn. Helaas, zegt hij, het bewijs voor deze cognitieve illusies is onbetwistbaar. Dat bewijs vindt hij onder andere in het optreden van priming en van overmatig zelfvertrouwen op basis van te weinig gegevens.

“De sceptici over rationaliteit worden hierdoor niet verrast. Ze hebben geleerd gevoelig te zijn voor de invloed van irrelevante factoren bij het vaststellen van voorkeuren, en ik hoop dat de lezers van dit boek deze gevoeligheid hebben verworven”.

Belangrijke verschillen met Levinas

Maar misschien is hij wel iets té sceptisch. Dat sluit aan bij het eerste van de verschillen die ik wil aanwijzen tussen het denken van Kahneman en Levinas, namelijk over het leervermogen van de mens. Kahneman heeft daar niet veel vertrouwen in en dat is, zoals we gezien hebben, voor hem reden om formules de voorkeur te geven boven expertise.

Het tweede verschil betreft de vraag of Levinas niet een soort ontspanning kan brengen in de beheersingsdrang die Kahneman vertoont in zijn wens om fouten te voorkomen.

Een mens leert niet veel

Kahneman is sceptisch over de menselijke mogelijkheden om eigen biases te leren kennen. Hij beschouwt het leervermogen van mensen in dit opzicht als heel beperkt.

Allereerst omdat de omgeving stabiel moet zijn. Wat we als expertise beschouwen, heeft doorgaans veel tijd nodig om tot ontwikkeling te komen, zegt Kahneman. Ik denk dat hij daar wel gelijk in heeft. Waar aan die voorwaarde niet is voldaan is het moeilijk of onmogelijk om te leren.

De tweede reden, en daar gaat het mij nu om, is volgens Kahneman dat een mens de alternatieven die zich als onjuist of niet bestaand hebben bewezen, niet serieus neemt of vergeet. Psychologen hebben al vaak onderzocht wat er gebeurt als mensen van gedachten veranderen. Bij wendingen en verrassingen verlies je direct veel van je vermogen om je te herinneren wat je geloofde voordat je van gedachten veranderde. Dat is het ‘dat dacht ik altijd al’ effect, en dat effect is niet bevorderlijk voor het leervermogen.

Kahneman heeft hier een grappig verhaal over, naar aanleiding van wat mensen in 1972 verwachtten van de reis die president Nixon maakte naar China en Rusland. Daar werd onderzoek naar gedaan en de respondenten werd gevraagd om waarschijnlijkheid toe te kennen aan vijftien mogelijke uitkomsten van Nixons diplomatieke initiatieven. Zou Mao ermee instemmen om Nixon te ontmoeten? Zouden de Verenigde Staten China diplomatiek erkennen? Zouden de Verenigde Staten en de Sovjet Unie, na tientallen jaren van onderlinge vijandschap, over iets belangrijks overeenstemming kunnen bereiken?

Nadat Nixon was teruggekeerd van zijn reizen vroegen de onderzoekers dezelfde mensen om zich de waarschijnlijkheid te herinneren die zij eerder aan elk van de vijftien mogelijke uitkomsten hadden toegekend. De resultaten waren duidelijk. Als een mogelijke uitkomst zich inderdaad had voorgedaan, overdreven de deelnemers de waarschijnlijkheid die zij daaraan in de eerdere vragenlijst hadden toegekend. Wanneer de mogelijke gebeurtenis zich niet had voorgedaan, herinnerden de deelnemers zich abusievelijk dat ze deze mogelijkheid altijd al onwaarschijnlijk hadden gevonden. Kennelijk heeft de bias van achterafkennis verderfelijke effecten op de oordeelsvorming van beslissers.

Dat komt omdat de menselijke geest, die verhalen opstelt over het verleden, een orgaan is van zingeving. Dat fabuleert er lustig op los, en doet ooit aanwezige alternatieve gedachten verdwijnen. Bovendien, omdat je maar weinig directe kennis hebt van wat er in je hoofd omgaat, zul je nooit te weten komen dat je onder net iets andere omstandigheden tot een ander oordeel had kunnen komen of een andere beslissing had kunnen nemen.

Levinas

Over die twee laatstgenoemde argumenten denkt Levinas soms heel anders. Het eerste argument van Kahneman om ons leren gebrekkig te noemen luidt: ooit aanwezige, maar ontmaskerde gedachten worden weggemaakt.

Levinas brengt daartegen in: in het geval van denkschaamte weet je heel goed wat je dacht (‘je vooroordeel’) toen je bij de ander over de grens ging. Want de ander, die zich overlopen voelde, verwees je precies naar jouw euforie, jouw goede bedoelingen en jouw heilig geloof in iets, waarmee je hem overliep. Je leerde dat de ander daar niet van gediend was. Je weet daardoor heel goed wat je geleerd hebt, én dus ook wat je áfgeleerd hebt. Je onthoudt je vooroordeel. Je maakt afgewezen gedachten niet wég.

Het tweede argument van Kahneman om ons leervermogen gebrekkig te noemen: je hebt maar weinig directe kennis hebt van wat er in je hoofd omgaat, daarom zul je nooit te weten komen dat je onder net iets andere omstandigheden tot een ander oordeel had kunnen komen of een andere beslissing had kunnen nemen. Weerstand bieden tegen de biases in je hoofd is, zo niet onmogelijk, dan toch zeker zeer vermoeiend.

Levinas brengt daartegen in: de ander laat je zien hoe net andere omstandigheden (namelijk zoals die van die ander) je tot een heel ander oordeel kunnen brengen. Dus je kunt dat wel weten. Alleen, misschien niet op de manier die Kahneman voorstelt, namelijk door via introspectie erachter komen wat er in je hoofd omgaat. Wel door je te laten raken door wat een ander, vaak iemand onder “net iets andere omstandigheden”, van zijn gewaarwordingen vertelt.

Hoewel Kahneman en Levinas over dit onderwerp dus behoorlijk van opvatting verschillen, kruipt Kahneman op een bepaald punt in zijn betoog behoorlijk dicht tegen Levinas aan. Kahneman maakt namelijk een uitzondering voor een bepaald soort bias, die mogelijk wel makkelijker kan worden gekend en weggenomen. Hij heeft het dan over biases die optreden binnen kleine verbanden zoals een huwelijk of een overzichtelijk groepje samenwerkende mensen.

Dat leidt hij af uit een onderzoek waarin aan gehuwden werd gevraagd: ‘Hoeveel draag je zelf bij aan het schoonhouden van het huis, uitgedrukt in een percentage?’Vergelijkbare vragen werden gesteld over het buitenzetten van de vuilniszakken, het initiatief voor sociale activiteiten nemen enzovoort. Zoals verwacht werd de 100 procent overschreden: beide partners zijn vooringenomen voor zichzelf en herinneren zich hun eigen bijdrage veel beter dan die van de ander. Deze bias is niet noodzakelijk in het eigen voordeel: de gehuwden overschatten ook hun eigen schuld aan ruzies, hoewel in mindere mate dan bij de ‘voordelige’ uitkomsten.

Vervolgens zegt Kahneman: “Over het algemeen ben ik nogal pessimistisch over de mogelijkheden van het controleren van bias, maar dit vormt hierop een uitzondering. De mogelijkheid tot het succesvol wegnemen van bias bestaat omdat de omstandigheden waarin individuele erkenning moet worden verleend, duidelijk identificeerbaar zijn, temeer omdat er vaak spanningen ontstaan wanneer mensen vinden dat hun inbreng niet voldoende wordt onderkend”. Dit komt mogelijk in de buurt van het grote leereffect dat Levinas toekent aan de directe interactie tussen mensen.

Alles vóór willen zijn

Op een aantal plaatsen in zijn boek stelt Kahneman dat het vermijden van fouten is wat we allemaal willen. Het boek wil daarbij aansluiten en op die manier een bijdrage leveren aan de mate waarin we onszelf en de wereld beheersen. Een manier daartoe is systematisch te redeneren, “Het sleutelbegrip is stelselmatigheid”, zo vat hij samen.

Een ander sleutelbegrip is ‘organiseren’: “Als het gaat om het vermijden van fouten zijn organisaties beter dan individuen, omdat ze naar hun aard langzamer denken en in staat zijn ordelijke procedures op te leggen”.

Je zou kunnen zeggen: Kahneman wordt in belangrijke mate gedreven door het verlangen om fouten vóór te zijn. En daar zit wat in natuurlijk: we zouden allemaal graag beschikken over een alarmbel die afgaat als we op het punt staan een ernstige fout te maken. Maar: daar gaat regelmatig een licht gespannen gerichtheid op beheersing van uit. Plus de nodige scepsis. Want, zo’n bel bestaat niet en cognitieve illusies worden doorgaans moeilijk herkend, tenzij je heel diep graaft in jezelf en je biases.

Levinas

Op die onderdelen kan Levinas wat ontspanning inbrengen. Want: soms bestaat zo’n bel dus wel, namelijk: de ander. En hoef je niet onwaarschijnlijk diep in jezelf te gaan graven.

Je hoeft ook niet alles vóór te zijn, want er is een correctiemechanisme: de ander meldt zich wel. Dat laat de nodige ruimte voor de luiheid die volgens Kahneman bij ons ook zo’n prominente plaats inneemt.

Werk en Reflectie over Daniël Kahneman

Inhoudsopgave

Inleiding

Systeem 1 en Systeem 2

Systeem 1

Systeem 2

Humans en Econs

Expertise versus algoritmen

Relevant voor management en organisatie

In hoeverre kun je professionals vertrouwen?

Inschatting van leiderschapskwaliteiten

Veilig bij

Belangrijke verschillen met Levinas

Een mens leert niet veel

Levinas

Alles vóór willen zijn

Levinas