Het beoordelingscijfer ligt aan de basis van een range van HR-beslissingen die enorm belangrijk zijn voor medewerker en organisatie. Het is niet niks om dat af te schaffen. Toch staan we denk ik nog maar aan het begin van een blijvende verandering. En wel hierom.

Van overheid tot bedrijfsleven, van dienstverlening tot productie, de jaarlijkse beoordelingssystematiek ziet er bij een hele verschillende organisaties opmerkelijk gelijkvormig uit. Medewerkers spreken met hun leidinggevende doelen af voor het komende jaar. Naast deze doelen wordt er vaak gesproken over ontwikkelen van competenties die nodig zijn om deze doelen te behalen. Aan het einde van het jaar wordt beoordeeld of de doelen zijn behaald. Dat wordt gescoord, vaak op een schaal van één tot vijf.

Van de leidinggevende wordt vaak verwacht dat hij / zij een normaalverdeling hanteert bij het geven van de beoordelingen. Als dit een expliciete verplichting is, heet dit een ‘forced distribution’ of ‘forced fit’. Als dit minder expliciet wordt gevraagd, maar wel wordt geadviseerd, dan heet dit een ‘guided distribution’. Hoe dan ook, dit betekent dat er in een bepaald team een maximum is van het aantal mensen dat een ‘zeer goed’ beoordeling krijgt. Er is vaak ook een focus om tenminste 5% van het team een ‘onvoldoende’ beoordeling te geven. Daarmee resteert een 75% van de mensen die een ‘gewoon goed’  of ‘effectief’ beoordeling krijgen. 

Het meest directe effect van dit jaarlijkse beoordelingscijfer zit vaak in de beloning. Een ‘zeer goed’ beoordeling betekent vaak een extra periodieke verhoging of een andere vorm van financiële beloning voor de medewerker. Een slechte beoordeling betekent vaak geen periodieke verhoging, geen bonus, en een aantekening in het dossier dat gebruikt kan worden in een ontslagdossier.

De praktijk kent nog wel wat variatie in details zoals: moet het gesprek waarin doelen worden gesteld per se apart worden gedaan van het gesprek waarin de beoordeling plaatsvindt? Of kan dit ook in één gesprek? Is er een halfjaarlijkse terugkoppeling, of niet? Dit zijn in feite kleine variëteiten in het sterk gestandaardiseerde gesprek zoals hierboven omschreven.

Eerlijk en objectief beoordelen, kan dat?

Als er zoveel afhangt van een beoordeling dan is het toch zeker zo dat een eerlijke en objectieve beoordeling de standaard is?
Helaas. Inmiddels is er veel onderzoek gedaan naar de objectiviteit en eerlijkheid van beoordelingen. Het is verontrustend om te constateren dat de wetenschappelijke literatuur aangeeft dat objectief beoordelen vrijwel onmogelijk is. Ook als er geen sprake is van kantoorpolitiek, ook als in een proefsetting mensen hun uiterste best doen om volstrekt eerlijk te oordelen, ze doen het vaak niet.

Wat gaat er dan mis bij het beoordelen van medewerkers? Er zijn een aantal wetenschappelijk bewezen fenomenen die optreden zodra de ene persoon de prestaties van een ander persoon gaat beoordelen.

Halo en horn-effect

Men spreekt van een halo of horn-effect als op basis van één aspect, één observatie, een reeks van eigenschappen wordt toegedicht (Thorndike 1920, Cooper 1981). Een voetballer staat voor open doel en schiet naast. Als dit de reden is voor de jaarlijkse ‘onvoldoende’ beoordeling, dan is er sprake van het horn-effect. Zeker, dat was geen sterk optreden, maar een gemiste kans is geen reden om het hele functioneren als onvoldoende te beoordelen. Het halo-effect is van hetzelfde laken een pak: een prachtig doelpunt is mooi, maar onvoldoende om het hele functioneren van deze voetballer als excellent te beschouwen.
Van alle effecten die een eerlijke beoordeling belemmeren zijn het halo en horn-effect het meest bekend. In veel HRM-opleidingen komen zij ook aan bod. Dus ook al weten veel mensen die betrokken zijn bij beoordelen dat dit effect kan optreden, toch gebeurt het steeds weer.

Hiërarchie effect

Veel minder algemeen bekend is dat er vertekening optreedt in beoordelingen die het gevolv zijn van verschillen in hiërarchie. Naarmate de macht van een manager toeneemt, wordt zijn / haar beoordeling van het functioneren van anderen negatiever en het oordeel over het eigen functioneren positiever, onafhankelijk van de werkelijke prestatie (Georgesen en Harris, 1998).

De beoordeling van de beoordelaar

Een leidinggevende die zelf een positieve beoordeling heeft gehad, is meer geneigd naar een positieve beoordeling van de teamleden. Omgekeerd, een beoordelaar die zelf een negatieve beoordeling heeft gehad, neigt naar een meer negatieve beoordeling van de eigen teamleden. Dit effect is zo sterk, dat het zelfs optreedt als de beoordelaar weet dat de eigen beoordeling in het kader van een experiment nep was (Latham et al 2008).

Wonderkind/mentor effect

Een beoordelaar die zelf een medewerker heeft aangenomen of daar positief over heeft geadviseerd, beoordeelt deze veel positiever, onafhankelijk van het daadwerkelijke functioneren (Slaughter en Greguras 2008).

Persoonlijke voorkeur

Beoordelaars die een medewerker persoonlijk graag mogen geven deze persoon veel hogere beoordeling dan degenen die ze persoonlijk niet mogen, onafhankelijk van het daadwerkelijke functioneren (Sutton et al 2013).

Vaste mindset of groei mindset

Een vaste mindset betekent de impliciete overtuiging hebben dat de kwaliteiten van een persoon min of meer vaststaan. Een groei mindset betekent de impliciete overtuiging hebben dat een persoon altijd kan leren en zich kan ontwikkelen. Het blijkt dat beoordelaars met een vaste mindset lagere beoordelingen geven voor goed functioneren als de medewerker in kwestie eerder een negatieve beoordeling heeft gehad (Heslin at al 2005).

Match introversie / extraversie

Een beoordelaar die zelf extravert is, heeft de neiging introverte medewerkers lager te beoordelen dan extraverte medewerkers, onafhankelijk van het daadwerkelijke functioneren. Overigens treedt dit negatieve effect het sterkst op bij de beoordeling van extraverte medewerkers door introverte beoordelaars (Erez et al 2015).

Interessant genoeg is ook onderzocht of een collega, een ‘peer’ kwalitatief beter kan beoordelen dan een leidinggevende. Ik hoop dat u daar niet al uw kaarten op heeft gezet, want dat is niet het geval. Collega’s zijn nog minder in staat om het functioneren van een collega eerlijk en objectief te beoordelen dan een leidinggevende.

Kortom, onderzoek toont aan dat eerlijk en objectief beoordelen zo goed als onmogelijk is. De mensen die claimen oneerlijk beoordeeld te zijn, vinden heel wat wetenschap aan hun zijde. Er is een grote kans dat zij gelijk hebben. Dat is een teleurstellende vaststelling voor de beoordeelden, beoordelaars en alle HR-mensen die hemel en aarde hebben bewogen om de beoordelingen voor elkaar te krijgen vanuit een overtuiging dat mensen en organisatie hier beter van worden.

Valt er iets te doen om de kwaliteit en objectiviteit van het beoordelen te verbeteren? Jazeker. We noemen hier twee mogelijke interventies. Ten eerste, het trainen van beoordelaars, zodat zij zich bewust zijn van deze valkuilen. Ten tweede, kalibreren, waarmee wordt gedoeld op het van meerdere mensen input vragen in de beoordeling. Als deze interventies worden gecombineerd, dan komt dat de kwaliteit van de beoordeling ten goede. Het nadeel hiervan is dat deze acties veel tijd en inspanning vragen. Een in de praktijk veelgehoorde klacht is dat er in organisaties zoveel gepraat wordt óver mensen en niet mét mensen. Deze training en kalibratiesessies dragen zeker bij aan het praten over mensen. En als dragen training en kalibratie bij aan een eerlijker beoordeling, het is nog steeds geen garantie daarop.

Als het dan zo is dat goed beoordelen veel tijd en energie vraagt om enigszins goed te doen, waarbij er een aanzienlijk risico blijft dat een beoordeling niet correct is, waarom gaan we er dan toch mee door? Als HR-practicioner heb ik altijd geloofd dat een beoordeling uiteindelijk bijdraagt aan beter functioneren. Het beoordelen is niet voor niets onderdeel van het zogenaamde performancemanagementsysteem. Maar is dat ook zo? Leidt een beoordeling tot beter functioneren?

Leidt beoordelen tot beter functioneren?

Het antwoord is nee. Een beoordeling leidt in 33% van de gevallen tot beter functioneren, in 33% van de gevallen tot slechter functioneren en in 33% van de gevallen heeft het geen enkel effect op functioneren (Edward en DeNisi 1996).
Wanneer leidt een beoordeling tot beter functioneren en wanneer leidt een beoordeling tot slechter functioneren? Ook daar geven Edward en DeNisi inzicht in. Een beoordeling leidt tot beter functioneren als in de perceptie van de beoordeelde het beoordelingsproces eerlijk is geweest. En dat hangt weer af van de zaken als de relatie tussen de beoordelaar en beoordeelde en de focus van de feedback.

Dus voor alle HR mensen en leidinggevenden: is er iemand in uw team met wie u geen goede relatie heeft en gaat u deze persoon een slechte beoordeling geven?  Dan moet u iets anders doen.

Hoe komt u er nu achter of een recent gegeven beoordeling tot beter functioneren van de medewerker zal leiden? Heel simpel. Vraag de beoordeelde hoe hij/zij de kwaliteit van de beoordeling waardeert. Is dat positief, dan helpt dat het functioneren van de medewerker. Is dat negatief, dan heeft de beoordeling geen of een negatief effect op het functioneren.

Conclusie

Er zijn fundamentele redenen om de huidige, traditionele manier van beoordelen te herzien. Want een beoordeling leidt over het geheel genomen niet tot beter functioneren. Onderzoek wijst uit dat beoordelingen in 33% van de gevallen leidt tot beter functioneren; in 33% van de gevallen tot slechter functioneren en in 33% van de gevallen gebeurt er helemaal niets met het niveau van functioneren.

Een beoordeling leidt alleen tot beter functioneren als het beoordelingsproces door de beoordeelde als eerlijk wordt ervaren. Maar in het beoordelen komen onherroepelijk vertekeningen voor die ervoor zorgen dat de werkelijke prestatie wordt over- of ondergewaardeerd door de beoordelaar. Dit ligt niet aan de intentie van de beoordelaar. Ook als mensen hun uiterste best doen om in een proefsetting een eerlijke beoordeling van functioneren te geven, dan lukt dit vaak niet. Door training van beoordelaars en kalibratie van de beoordelingscijfers kan de kwaliteit van de beoordeling worden verhoog. Dit kost veel tijd en het resultaat is niet gegarandeerd.

Dit leidt mij tot de conclusie dat de discussie over de beoordelingen van de afgelopen periode niet gaat overwaaien. Dit is geen hype. Er zijn fundamentele redenen om de praktijk van het beoordelen te herzien. De traditionele beoordelingen leiden niet tot beter functioneren en gaan dit ook niet doen. Die wetenschap is al 20 jaar beschikbaar en pas nu passen we deze kennis toe. Hoe is het mogelijk dat wetenschappelijke inzichten er zo lang over doen om de praktijk van alledag te verbeteren? Ik houd me graag aanbevolen voor mensen die daar iets verstandigs over kunnen zeggen. Ik ben een HR-practicioner. De vraag waar ik verder mee ben gegaan is de volgende. Als organisaties stoppen met beoordelen, wat gaan ze dan wel doen om tot goed/beter functionerende medewerkers te komen? Daarover meer in mijn volgende artikel.


Ik bedank drs. Aart Eliens en drs Marike Balster voor hun commentaar op eerdere versies van dit artikel.