Training, Coaching, Beratung | 30.11.2021

Was taugen KI-gestützte Bewerbertests?

von Dr. Walter Simon

Es war zu erwarten, dass die Anbieter von Persönlichkeitstests künstliche Intelligenz für ihre Zwecke nutzbar machen. Mit dem Einzug der KI in das Personalwesen wollte man auch die Personalauswahl auf ein absolut sicheres Fundament stellen. Das Buzzword Künstliche Intelligenz suggeriert Objektivität, Fairness, Passgenauigkeit, Schnelligkeit und das alles bei minimalen Kosten, so die Erwartung und die Werbeversprechen. Kapitalgeber öffnen ihre Ohren, wenn sie diesen Begriff hören. Dem deutschen Testanbieter Retorio fiel es leicht, Investoren zu überzeugen und einen siebenstelligen Betrag einzusammeln.  

 

Für etablierte Testanbieter wird es notwendig, künstliche Intelligenz als Ingredienz ihrem Produkt beizumischen, um nicht von Google Hire, SAP-Recruiting und IBM-Amazon abgehängt zu werden. Unternehmen oder Bewerber sollten gesichtsbasierte Persönlichkeitstests, die als Produkt künstlicher Intelligenz deklariert werden, mit Skepsis begegnen. Die vorliegenden Befunde bieten dafür reichlich Anlass.  

 

Bewerbertests im Praxischeck: Das Beispiel Retorio  

 

Das Start-up-Unternehmen Retorio mit Sitz in München verspricht, seine Software könne, ausgehend von einem kurzen Videointerview, „Verhaltensweisen erkennen und darauf aufbauend ein Persönlichkeitsprofil erstellen“. Mimik, Gestik und Sprache durchlaufen hier eine psychologische Sortiermaschine. Das Ergebnis ist ein Persönlichkeitsprofil mit einer angeblichen Genauigkeit von 90 Prozent im Vergleich zur Bewertung durch Menschen. In Windeseile können so Hunderte Bewerber einem Psychocheck unterzogen werden, um einige wenige Kandidat*innen auszufiltern, denen die Ehre eines vertiefenden Bewerbergesprächs zuteilwird. Ein Unternehmen erhält so Gewissheit, ob ein Bewerber auf die offene Stelle passt. Als testpsychologische Grundlage dient das sogenannte Big-Five-Modell, das vielen Persönlichkeitstests als eine Art Urmeter dient. Demnach sind diese fünf Grunddimensionen für die Persönlichkeit prägend: Offenheit, Gewissenhaftigkeit, Extraversion, Verträglichkeit und Neurotizismus.  

 

Was taugen KI-gestützte Bewerbertests?
Was taugen KI-gestützte Bewerbertests?

 

 

Vielleicht war das neuartige Angebot eines von künstlicher Intelligenz getriebenen Persönlichkeitstest einer der Gründe, warum Reporter*innen des Bayerischen Rundfunks (BR) das Produkt 2020 einem Praxistest unterzogen. Das BR-Team zeichnete mit zehn Darstellern mehrere Hundert Bewerbungsgespräche auf Video auf und prüfte, wie die Software reagierte. Das erstaunliche Ergebnis: Wechselte eine Probandin beispielsweise von Hemd oder Pulli zu einem T-Shirt, veränderte die Frisur oder setzte eine Brille auf, verschoben sich die Ergebnisse der Persönlichkeitsbewertung teilweise deutlich. Wer eine Brille trug wurde als intelligenter eingestuft als jemand, der weder kurz- noch weitsichtig ist. Trug eine Brillenträgerin ein Kopftuch gab es einen Punkteabzug bei der Intelligenz. Andererseits wurde eine Kopftuchträgerin als gewissenhaft, offener und weniger neurotisch als das Gros der Menschen beurteilt.  

 

Änderte sich der Hintergrund bei ein- und derselben Probandin wurde diese anders beurteilt. Eine Bücherwand im Hintergrund macht aus einem bodenständigen und zurückhaltenden Bewerber eine interessante und lebhafte Persönlichkeit (siehe Foto). Bei unterschiedlichen Hintergründen verschoben sich die Persönlichkeitswerte um bis zu 15 Prozent. Selbst Helligkeits- oder Sättigungswerte beeinflussten das Ergebnis. Der gesprochene Text des Interviewers blieb stets gleich.  

 

Diese Merkwürdigkeiten erklärt der Testanbieter damit, dass, wie bei einem normalen Bewerbungsgespräch, auch nichtpersonelle Faktoren in die Situation und Bewertung eingehen. Darum fließen auch die Außenwirkung des Bewerbers, seine Kleidung und Frisur, Accessoires und Sprachstil in die Beurteilung ein. Hier stellt sich die Frage: Geht es um die Persönlichkeit als solche oder deren äußeres Erscheinungsbild? Ist es letzteres, bieten sich Blendern und Selbstdarstellern gute Chancen. Als Ergebnis der Testreihe gab es Zweifel an der Intelligenz des mit künstlicher Intelligenz ausgestatteten Persönlichkeitstests.  

Zweifel und Kritik an KI-Bewerbertests 

 

Retorio ist nicht der einzige Anbieter KI-basierter Psychoanalytik. Mitbewerber agieren in vielen Ländern dieser Welt, darunter das US-amerikanische Unternehmen HireVue im Bundesstaat Utah. Die Kundenliste umfasst 700 Namen. Es gibt Zuspruch aus der Wirtschaft und Ablehnung durch KI-Experten. Diese bemängeln, dass die Ergebnisse undurchsichtig seien. HireVue seinerseits erkannte, dass die Ergebnisse aus der Bildanalyse des Gesichts nur schwache Hinweise zum Leistungsverhalten liefern. Man analysiert deshalb nur noch die Tonspur.  

Digitale Gesichtsanalyse hat Konjunktur. Sie ist wegen ihrer Fehleranfälligkeit umstritten. Anbietern von Gesichtserkennungstechnologien aus den USA und China wurden Fehlschlüsse, unsaubere Daten und unklare Begriffsdefinitionen angelastet, vor allem ihre Nähe zur pseudowissenschaftlichen Physiognomik. 

An Europas Grenzen befragt ein virtueller Polizist zu Testzwecken Reisende nach ihren Reisegründen und analysiert währenddessen deren Gesichtsausdrücke, Blicke und Haltung. Dabei erkannte dieser Lügendetektor Lügen, die aber keine waren. Warum Menschen anhand von Gesichtserkennungsmerkmalen als Verbrecher erkannt werden sollen, wurde bisher nicht schlüssig dargelegt. Die Analyse der Gesichter von Mitgliedern des US- Kongresses ergab, dass 28 von ihnen angeblich kriminell sind. Technologisch bedingte Fehleinschätzungen können Lebenswege und Berufskarrieren zerstören.  

Kritik erfuhren auch Wissenschaftler der renommierten Stanford-University für ihre Behauptung, sexuelle Präferenzen im Gesicht mit Hilfe Künstlicher Intelligenz erkennen zu können. Die Programmentwickler gaben unlängst zu, dass es nicht so einfach sei, mit künstlicher Intelligenz anderen Menschen in den Unterleib zu blicken. Auch die Nähe zur pseudowissenschaftlichen Physiognomie gebietet – schon aus historischen Gründen – größte Vorsicht gegenüber gesichtsanalytischen Deutungsversuchen.  

Über den Autor

Walter Simon ist gebürtiger Hamburger und gelernter Drogist. Nach der Lehre fuhr er zunächst zur See. Anschließend studierte er Wirtschafts- und Sozialwissenschaften mit den Abschlüssen Dipl.-Volkswirt und Dipl.-Soziologe. Dem schloss sich 1979 eine Promotion zum Dr. rer. pol. an. Nach mehrjähriger Tätigkeit in der Industrie wurde Walter Simon 1995 auf den Lehrstuhl für Unternehmensführung an der Hochschule Rhein-Main berufen, den er bis 2001 innehatte.

Seine Arbeitsbilanz: 200 Fachartikel, 20 Bücher zu gesellschafts- und personalpolitischen Themen, ca. 1.100 Seminare mit etwa 15.000 Teilnehmern, 45 Unternehmensprojekte.