Symptom und Signal, Ausdruck und Steuerung in der vorsprachlichen Sozialregulation

Clemens Knobloch

Journal für Psychologie, 29(2), 58–80

https://doi.org/10.30820/0942-2285-2021-2-58 CC BY-NC-ND 4.0 www.journal-fuer-psychologie.de

Zusammenfassung

Der Text rekonstruiert Kontinuitäten und Brüche in der von Karl Bühler in seiner Krise der Psychologie (1927) und seiner Ausdruckstheorie (1933) hinterlassenen präkybernetischen Axiomatik der Interaktion anhand der gegenwärtigen psychologischen Debatten über Emotions- und Affektausdruck. Die These lautet: Im Kern operieren moderne Psychologen wie der Tierverhaltensforscher Frans de Waal, die konstruktivistische Neuropsychologin Lisa Feldman Barrett und der kulturhistorische Psychologe Michael Tomasello beinahe 100 Jahre später noch weitgehend auf der von Bühler umrissenen Grundlage.

Schlüsselwörter: Ausdruck, Steuerung, Emotion, Gefühl, Kybernetik, Symptom, Signal, (geteilte) Aufmerksamkeit

Summary
Symptom and signal, expression and mutual adjustment
in preverbal social regulation

In this paper, I reconstruct the continuities and differences between Karl Bühler’s pre-cybernetic model of non-verbal interaction – as sketched in his Krise der Psychologie (1927) and his Ausdruckstheorie (1933) – and present-day debates on the expression of emotion and affect. I offer the thesis that today, almost 100 years later, the field of psychology is still caught up in very similar quandaries. This is shown by comparing Bühler’s work to the theories and models of a present-day ethologist (Frans de Waal), a neuroscientist and psychologist (Lisa Feldman Barrett), and a culturalist developmental psychologist (Michael Tomasello).

Keywords: Emotion, expression, feeling, signal, symptom, (joint) attention, intention, cybernetics

»Er lächelte, doch sah sie ihn erbleichen.«

Marcel Proust

Exposition

Lange Zeit standen Bühlers Ausdruckstheorie von 1933 und seine Krise der Psychologie von 1927 im Schatten der Sprachtheorie – und sie standen auch weitgehend vermittlungslos nebeneinander. Seit Kooperation und Sozialität im Grenzgebiet zwischen Human- und Tierpsychologie wieder in die Axiomatik eingerückt werden, stellt sich die Frage von Ausdruck und Steuerung, von Symptom und Signal in neuer Schärfe: An welchen Zeichen kalibrieren sich im vor- und nichtsprachlichen Feld Formen von Kooperation, Hierarchie, Sozialität? Wie greift der Ausdruck affektiv-emotionaler Befindlichkeiten in die Verhaltensregulation sozialer Verbände und Beziehungen ein? Was bereits vor Jahrzehnten als das »Kybernetische« in Bühlers Kommunikationstheorie diagnostiziert wurde (von Ungeheuer 1972 [1967]) soll neu vermessen werden am Beispiel konkurrierender (aber gleichermaßen hoch resonanter) Ansätze im Grenzgebiet von Human- und Tierpsychologie: Frans de Waals »tierenthusiastisches« Modell des Emotionsausdrucks möchte ich vergleichen mit Michael Tomasellos kulturhistorisch-symbolzentriertem Modell sowie mit der (neurologisch und konstruktivistisch ausgeflaggten) Emotionslehre von Lisa Feldman Barrett (2017). Trotz vergleichbarer Experiment- und Beobachtungsdaten kommen die Modelle zu entgegengesetzten Ergebnissen – was die Abhängigkeit unserer fachlichen Beobachtungen von den eingesetzten »terministic screens« (Burke 1969 [1945]), den begrifflichen Filtersystemen unterstreicht. De Waal definiert Emotionen durch ihren standardisierten, »erkennbaren« und objektiven Außenstatus, sie sind steuerungsrelevante »Gestalten« – Gefühle dagegen definiert er durch ihren subjektiven Innenstatus. Für Tomasello beginnt mit der (menschlichen) Fähigkeit, Aufmerksamkeit und Emotionen zu teilen (joint attention, shared intention) ein ganz neues (im Kern symbolisches und perspektivisches) Spiel. Barrett (2017) hingegen analysiert die Wortkonzepte, mittels derer wir das Emotionsgeschehen für uns gliedern, als kulturelle Reifizierungen, die uns als Basis für Inferenzen dienen – Reifizierungen, hinter denen sich ein neurologisches Kontinuum verbirgt, das ganz andere Regularitäten aufweist.

Es zeigt sich, dass Bühlers Ausdrucksbuch (Bühler 1933) bereits die bis heute vorherrschende Konstellation mit all ihren Widersprüchen umreißt, den Widersprüchen zwischen einer erlebnispsychologischen Modellvorstellung, bei der es ein inneres Gefühl ist, das zum Ausdruck kommt bzw. drängt, einer behavioristischen oder handlungstheoretischen Modellvorstellung, bei der das Ausdrucksgeschehen aus partiell willkürlichen »Handlungsinitien« besteht, und einer »kybernetischen« Modellvorstellung (vgl. zu dieser Konstellation Friedrich 2011). Als »kybernetisch« versteht Ungeheuer (1972 [1967]) den in Bühler (1927) explizierten Modellgedanken, wonach die gegenseitige Steuerung des sinnvollen Benehmens den dynamischen und selbstregulativen Zusammenhang bildet, in den Ausdruck und Darstellung einmünden. Die hier verglichenen ausdruckspsychologischen Denkmodelle bewegen sich nach wie vor in den Zwängen und Widersprüchen, die wir bereits in Bühlers Werk finden.

1 Ein Fehdehandschuh – dem Kognitivismus hingeworfen

»We show our emotions, but we talk about our feelings«, dieser Satz (de Waal 2019, 4) setzt die Szene für ein Buch, das in der Tradition von Darwin, Bühler und Ekman induktiv erkundet, wie der Emotionsausdruck bei diversen Tierarten in die Sozial- und Verhaltensregulation steuernd eingreift. Der zitierte Satz de Waals beruht auf einer terminologischen Unterscheidung zwischen »emotions« (sie stehen für das, was sich den anderen Teilnehmern einer Szene »zeigt« und insofern objektiver sozialer Rohstoff für die Fremdwahrnehmung ist) und »feelings« (sie stehen für das, was lediglich über sprachliche Thematisierung »gemeint« werden kann, aber ansonsten streng »subjektiv«, nur der inneren Erfahrung gegeben ist).¹ Als selbstbewusster Tierpsychologe (oder besser: Tierverhaltensforscher) fügt de Waal an:

»We know our own inner states imperfectly and often mislead both ourselves and those around us. We’re masters of fake happiness, suppressed fear, and misguided love. This is why I’m pleased to work with nonlinguistic creatures. I’m forced to guess their feelings, but at least they never lead me astray by what they tell me about themselves« (de Waal 2019, 5).

Gestützt wird dieser Passus durch den alltagspsychologischen Topos, wonach unser menschlicher Emotionsausdruck (sagen wir) »authentischer« und wahrhaftiger ist als die sprachlichen (und durch alle möglichen Rücksichten gefilterten) Kommentare, die wir dazu geben. Der spontane gestische, mimische, unwillkürlich-körperliche Ausdruck (so der common sense) verrät unsere »wirklichen« Gefühle wahrhaftiger als das Sprechen, das der Lüge, der Verstellung, der Verheimlichung ebenso bereitwillig dient wie der Wahrheit. Die Ausgangslage dieses sprachkritischen Misstrauens ist freilich anfällig für Paradoxien. Allen Ausdruckspsychologen ist gemeinsam, dass sie, trotz ihres Misstrauens gegenüber der Sprache, ihre Beobachtungen zu mimischen, gestischen und anderweitig körperlichen Ausdrucksphänomenen nur im täuschungsanfälligen Medium sprachlicher Unterscheidungen konzeptualisieren und kommunizieren können. Und ist nicht auch der (menschliche?) Emotionsausdruck selbst ein Kommunikationsmedium, das in weiten Grenzen willkürlich beherrscht (und ergo auch sprachähnlich strategisch eingesetzt) werden kann? Und das gewiss nicht nur von professionellen Schauspielern.

Sprichwörtlich ist die epistemische Indifferenz sprachlicher Darstellung gegenüber der Innen-außen-Differenz. Wir reden über unsere Gefühle, Emotionen und Gedanken ganz ebenso wie über extern fassliche Größen wie Häuser, Bäume und Kinder – obwohl sie außer in unserer Innenerfahrung (?) – und auch da auf ziemlich prekäre Weise – keinem anderen gegeben sind.² Und wir wundern uns darum gewiss nicht, wenn wir im Forschungsfeld des Affektausdrucks auch Positionen finden, die aus dem »Versprachlichungszwang« gegenüber den Emotionen radikal konstruktivistische Konsequenzen ziehen und dafür argumentieren, dass unsere Emotionsnamen wie Scham, Schuld, Angst, Ekel, Aggression, Trauer etc. konzeptuell arbiträr (und kulturspezifisch) zusammenfassen, was nicht zusammengehört (wie etwa Barrett 2017). Auf den ersten Blick ist das Misstrauen gegenüber der sprachlichen Konzeptualisierung von Gefühlen und Emotionen bei biologischen Verhaltensforschern wie de Waal und bei konstruktivistischen Neurologinnen wie Barrett gleichermaßen groß. Wir halten aber einstweilen fest, dass es sich bei Barrett (2017) gegen sprachlich-kulturelle konzeptuelle »Reifizierungen« von Emotionen richtet, während de Waal (2019) vor sprachlich-kommunikativer Verstellung, Täuschung und Lüge warnt – angesichts der offensichtlichen Tatsache, dass soziale, strategische oder sonstige Rücksichten uns dazu veranlassen können, unsere »wahren« Gefühle (und Emotionen) nicht preiszugeben.

Für die konstruktivistische Position ist bereits die Vorstellung, dass es sechs universale, von und in allen Kulturen identifizierbare »basic emotions« geben soll, wie in Paul Ekmans berühmter Liste (anger, fear, surprise, disgust, sadness, happyness) eine Zumutung. Erst recht natürlich Erweiterungen, wie sie de Waal bei »seinen« Primaten (und anderen Tieren) vornimmt, wenn er ihnen den Ausdruck von Schuld, Scham und anderen Emotionen zurechnet. Für Barrett (2017), die auf weite Strecken gegen de Waal argumentiert (auch wo sie ihn nicht explizit nennt), sind Emotionen³ »inner states«, die im Alltag (und auch von den Psychologen) aus dem wahrgenommenen dynamischen Gesamtgeschehen inferiert werden (und ergo nicht einfach bestimmten festen Ausdrucksfiguren zugerechnet werden können). Dass wir als Teilnehmer den Eindruck haben, die Emotionen unseres Gegenübers seien feste Größen, die wir an Gesicht, Stimme, Motorik etc. erkennen und konzeptuell zuordnen können, sei eine rationalisierende Alltagstheorie, schreibt Barrett (2017, 51f.), und kommt zu dem Schluss: »Despite tremendous time and investment, research has not revealed a consistent bodily fingerprint for even a single emotion« (ebd., 15). Für die Autorin ist das, was wir als Emotionen bezeichnen, ein Ergebnis der kulturellen Reifizierung von Interaktionen zwischen (angenehmen oder unangenehmen) Erregungsniveaus und neurologischer Regulierung des »body budget«. Das ist durchaus kybernetisch gedacht, setzt körperliche Selbstregulierung und kulturell konventionalisierte Konzepte in Beziehung zu einander.

Die vor 50 Jahren durch Margret Mead (z. B. 1974; s. u.) eingenommene strikt kulturalistische Position zum menschlichen Affektausdruck wird heute von Michael Tomasello (2020) besetzt, und das womöglich noch kompromissloser als ehedem von Mead. Für Tomasello (ebd., 83ff.) markiert die bereits im frühen (menschlichen) Säuglingsalter auftretende Fähigkeit, Gefühle situativ zu teilen (durch soziales Lächeln, Lachen, Affektresonanz), einen deutlichen und scharfen Bruch auch gegenüber dem Affektausdruck bei Primaten.⁴ Ab dem Alter von circa neun Monaten kommt dann die triadische Konstellation der geteilten Aufmerksamkeit (joint attention) für einen äußeren Gegenstand hinzu. In dieser durch und durch humanspezifischen Konstellation werden nicht allein sprachlich-kognitive Konzeptualisierungen vergesellschaftet, sondern auch kulturelle Einstellungen und Bewertungen gegenüber den geteilten Bezügen der Aufmerksamkeit vermittelt. Die Dynamik dieser sozialisatorischen Prozesse garantiert weitgehend kulturspezifische Normierungen des Affekt-, Emotions- und Einstellungsausdrucks.

Es versteht sich, dass auch diese axiomatische Linie ihren Preis hat, jedenfalls für einen Autor wie Tomasello, der sowohl als Primatenforscher wie auch als Entwicklungspsychologe einen Ruf zu verlieren hat. Ständig gerät er in die peinliche Lage, zwischen »echter« Schuld, Reue, Scham etc. und sprachlich-strategisch geäußerten accounts (Rechtfertigungen) unterscheiden zu müssen, und das oft anhand von Indikatoren, die kaum objektiviert werden können. Gegen die These vom »Machiavellismus« der Schimpansenhorden macht er geltend, dass nur Menschen sich »machiavellistisch« verhalten könnten, weil nur sie die supponierten Perspektiven und Bewertungen anderer aktiv zur Manipulation des Eindrucks verwenden können, den sie auf andere machen (ebd., 400ff.). Der Autor steht dann ständig vor der Aufgabe, »echtes Schuldgefühl« (menschlich) von »bloßem Mitgefühl« zu unterscheiden, was im Ergebnis kaum befriedigen kann, schon wegen der Subtilität der sprachlichen Konzepte. Die Fähigkeit, sich von außen, mit den Augen der anderen, zu sehen, hält er für rein menschlich. Phänomene wie kollektiver Stolz (»Wir sind Papst, Weltmeister etc.«) oder kollektive Schuld (»Das haben WIR getan«, auch wenn das Individuum nicht beteiligt war) hält Tomasello (ebd., 405), ganz zweifellos berechtigt, für spezifisch menschlich – aber die verfügbare Evidenz dafür ist rein sprachlich und darüber hinaus ausdruckspsychologisch nicht zu materialisieren. Einmal mehr verhindert die fließende Grenze zwischen vorsymbolischen und symbolischen Instanzen die schlüssige Behandlung der Ausdrucks- und Eindrucksphänomene.

2 Die konzeptuelle Aufteilung des Feldes

Das Konzept »Ausdruck« ist, salopp gesagt, so gestrickt, dass es etwas nur in der inneren Erfahrung Gegebenes symptomatisch nach außen setzt, das Konzept »Eindruck« ist umgekehrt so perspektiviert, dass es eine in der äußeren Erfahrung (also »sozial«, für alle) gegebene Signal- und Steuergröße an das Verhalten und Erleben von Rezipienten koppelt. Bereits Bühler (1927) macht aus diesen beiden ungleichen Hälften ein dynamisches, quasi-kybernetisches Geschehen, bei dem die (wie auch immer transformierten) Befindlichkeiten der Teilnehmer zu Steuer- und Rückkopplungsgrößen für andere Teilnehmer werden, die den Ausdruck der anderen in ihre eigene Handlungssteuerung einbauen. Artübergreifende und transkulturelle Einheitlichkeit in den Ausdrucksfiguren und -gestalten des Emotionsgeschehens lässt sich (von Darwin bis Ekman, Eibl-Eibesfeld und de Waal) allein daran festmachen, dass menschliche Beobachter intersubjektiv Figuren als gleich oder ähnlich klassifizieren – auf der Grundlage ihrer optischen Gestalt in einem Standfoto oder nach ihrer dynamisch-gestalthaften Steuerwirkung im interaktiven Geschehen oder nach ihrer kulturellen Deutung durch Teilnehmer und/oder Beobachter.⁵ In dieser universalistischen Perspektive gilt der Affektausdruck als »unwillkürlich« (oder gar: kausal determiniert), der Eindruck als abhängig vom Eigengeschehen des Rezipienten.

Die experimentellen Verfahren, mittels derer die Einheitlichkeit und kulturübergreifende Allgemeinverständlichkeit des menschlichen (und auch partiell des tierischen) Emotionsausdrucks ermittelt worden ist, sind hinreichend oft dargestellt und kritisiert worden (vgl. u. a. das kritische Referat von Barrett 2017, 42–55). Für die hartnäckige Persistenz all dessen, was mit der Versprachlichung einschlägiger Erfahrung zu tun hat, spricht die Tatsache, dass auch Darwin in seinem Referat über die berühmten Versuche Duchennes notiert: Er habe die Zuordnungen von Ausdrucksfigur und Emotion dort völlig plausibel gefunden, wenn er zuvor den zugehörigen Text gelesen habe und wusste, »was darzustellen beabsichtigt worden war« (Darwin 2009, 1175). Ohne diese verbalen Erläuterungen jedoch wäre er oft in Verwirrung geraten, schreibt er. So etwas ist natürlich Wasser auf die Mühlen von Barrett (2017, 103), für die gilt: »the emotional information is not in the signal itself«, vielmehr wird das ausdrucksmäßig gegebene Rohmaterial erst relevant im Lichte der (kulturspezifischen) sprachlichen Konzeptualisierungen, über die der Rezipient verfügt, und die er in das Geschehen hineinträgt.⁶ Bühler hätte in solchen Zusammenhängen vermutlich daran erinnert, dass die Steuerwirkungen, die von den anderen ausgehen, immer auf das laufende Eigengeschehen im Empfänger wirken und von diesem her gedeutet werden. Barrett (ebd., 45ff.) notiert, dass die Universalität und Einheitlichkeit des Emotionsausdrucks wunderbar funktioniert, wenn man den Vpn (Versuchspersonen) sprachliche labels vorgibt, die sie den präsentierten Ausdrucksfiguren (Standfotos) zuordnen sollen, dass die Übereinstimmung aber bereits zusammenbricht, wenn die Vpn »frei« verbalisieren sollen, welche Emotion sie in den Ausdrucksgestalten identifizieren. Das »forced choice«-Format einschlägiger experimenteller Formate forciert eben auch die implizit in den verbalen Vorgaben repräsentierten Thesen der Experimentatoren.

Unbestritten ist die kommunikative Relevanz aller Ausdrucksphänomene. Aber die experimentellen Verfahren der Identifizierung »zugrunde liegender« Affekte und Emotionen sind durchweg extrakommunikativ in ihrer Anlage. Dynamisch-prozessuale Steuerungseffekte des Ausdrucksgeschehens sind schwer fassbar: Der Ausdruck läuft mit, dient Teilnehmern und Beobachtern als Symptom und Inferenzbasis, hat zweifellos Wirkungen, bleibt aber unthematisch – und wenn er sprachlich thematisiert wird, ist es um seine dynamisch-praktische Wirksamkeit geschehen, wirksam wird dann nämlich zuerst seine kulturelle Versprachlichung, nicht mehr seine dynamische Gestalt! Insofern ist die explizite Identifizierung und Konzeptualisierung eines Affekts, einer Emotion (ganz ähnlich wie in den gängigen Experimenten) immer damit verbunden, dass das dynamische Geschehen selbst symbolisiert, rationalisiert, auf eine andere Ebene gehoben wird.

In der verbalen Interaktion ist unsere bewusste Aufmerksamkeit auf den offiziell thematischen verbalen Strang konzentriert. Mit Bezug auf das laufende Ausdrucksgeschehen beim anderen sind wir (mehr oder weniger empfindliche) Beobachter, sofern wir Schlüsse ziehen, inferieren, vielleicht sogar thematisieren. Wir unterliegen aber auch einer »subsymbolischen« Steuerung durch das Ausdrucksgeschehen im anderen, der uns durch sein Auftreten (überlegen, förmlich, demütig …) eine situierte Identität zuweist. Was auf diese Weise »mitläuft«, kann (nach lokalen soziokulturellen Regeln, versteht sich) gegebenenfalls auch thematisiert werden, aber stets um den Preis einer Unterbrechung des Hauptthemas. In ganz speziellen Gesprächstypen (etwa: Psychotherapie) kann das Ausdrucksgeschehen selbst zum Hauptthema gemacht werden. In jedem Falle rühren die Schwierigkeiten, die das Ausdrucksgeschehen seiner theoretischen Modellierung entgegensetzt, aus dessen prekärer Zwischenlage: subsymbolisch verankert im »Sender« und berufen, den »Empfänger« zu beeinflussen und zu steuern, auf den Ebenen, die es fallweise erreicht. Das Ausdrucksgeschehen ist ein dynamisches Grenzobjekt.

Es ist verschiedentlich notiert worden, dass wir als Beobachter empfänglicher für das mitlaufende Ausdrucksgeschehen sind, wenn wir als Nicht-Teilnehmer Gespräche zwischen anderen beobachten. Offenbar haben wir dann mehr freie Kapazität für die »Stimmung« zwischen den Beteiligten, wenn wir nicht laufend an eigene Beiträge denken müssen. De Waal (2019, 30) spricht in diesem Zusammenhang von »triadic awareness« und reklamiert entsprechende Kompetenzen bereits für gesellig lebende Primaten, wenn es etwa Anzeichen dafür gibt, dass ein Individuum die Beziehungen zwischen zwei anderen »kennt« und in seinem eigenen Verhalten berücksichtigt.

Vor dem skizzierten Hintergrund scheint die entscheidende Frage zu sein, wie weit der Affektausdruck (sei es der von Primaten oder der von Menschen) an seinen eigenen interpersonalen Wirkungen ausgebaut, modifiziert und entwickelt werden kann, wie weit er »kommunikativ« ist (im Sinne von Arnold Gehlen) und nicht phylogenetisch fest verdrahtet, sondern formbar an den Antworten, die er bei anderen auslöst.⁷ Wie auch bereits der sensomotorische Dingumgang in der menschlichen Erwerbsmotorik von den »Antworten« der einbezogenen Gegenstandwelt her eingesetzt und gesteuert werden kann. In dem Maße, wie der Affektausdruck selbst plastisch und willentlich-strategisch verfügbar wird, kann er eben auch von seinen interpersonalen Erfolgen und Wirkungen her eingesetzt werden. Das ist sowohl die Voraussetzung dafür, dass der Affektausdruck kulturell normiert und modelliert werden kann, und dafür, dass er auch für Täuschung und Betrug eingesetzt werden kann.

Prima facie gibt es keinen Grund anzunehmen, dass es nicht auch bei sozial lebenden Tieren, Primaten etc. (sagen wir) kulturanaloge Modellierbarkeit des Affektausdrucks nach seinen Eindruckserfolgen geben soll. De Waal (ebd.) ist voll von einschlägigen Beispielen (immer vorausgesetzt natürlich, dass de Waals Deutung des berichteten Geschehens zutrifft).

Einigermaßen seltsam ist für den Wissenschaftshistoriker, dass sich die Fronten in der psychologischen, ethologischen (und ethnologischen) Ausdrucksforschung in den vergangenen 50 Jahren kaum verschoben haben. Manche Thesen in de Waal (ebd.) versetzen einen noch deutlich weiter zurück in die Vergangenheit: Die Ansicht etwa, dass Sprache an den primären Emotionsausdruck lediglich Etiketten anheftet (ebd., 126), erinnert mächtig an die Ausdruckspsychologie Wilhelm Wundts. Ein Blick in die Rezension eines von Ekman (1973) herausgegebenen Bandes, die von Margret Mead (1974) im Journal of Communication veröffentlicht worden ist, vermittelt den Eindruck, die Konfliktlinien verliefen bis heute unverändert. Mead (ebd.) moniert an Ekman (1973), dass er nichts zur Kenntnis nehme, was über seine These von der ererbten universellen Erkennbarkeit und Simulierbarkeit der basalen Emotionen am Gesichtsausdruck hinausführen könnte. Weder handele er vom kybernetischen Prinzip der wechselseitigen Steuerung noch von »incomplete intention movements« (was ungefähr Bühlers »Handlungsinitien«⁸ entspricht) noch auch von den damals bereits zirkulierenden multimodalen Kommunikationsanalysen des Typs »A Natural History of an Interview«, in denen neue Verfahren der Analyse des nonverbalen Geschehens erprobt wurden (vgl. zum Stand dieser Dinge bis in die 1970er Jahre Schmitz 1975). Tatsächlich habe Ekman lediglich bewiesen, dass Mitglieder verschiedener Kulturen davon überzeugt werden können, dass bestimmte simulierte Gesichtsausdrücke für elementare Emotionen wie Trauer, Glück, Angst, Ekel stehen und kulturübergreifend mit diesen identifiziert werden können. Meads eigene Position ist (von Franz Boas herkommend) naturgemäß kulturalistisch, sie stützt sich auf Ray Birdwhistells Mikroanalysen des Ausdrucksverhaltens in diversen Kulturen, bei denen keine Übereinstimmungen gefunden wurden.⁹ Und sie erzählt selbst die Geschichte einer balinesischen Kultur, in der die kulturell für verschiedene Anlässe vorgeschriebenen Emotionen ihr völlig unverständlich seien, während die nämlichen Akteure sich vollkommen verständlicher Ausdrucksfiguren bedienen, wenn sie Emotionen im Theater darstellen sollen. Für Mead gleichen Ekmans universelle Ausdrucksfiguren dem, was bei Konrad Lorenz »supernormal objects« (bzw. supernormale Stimuli) sind: durch Überstilisierung und Überprägnanz eindeutig und kommunikationssicher gestaltete, ritualisierte Signale, die eben durch diese Eigenschaften von den stets gemischten und oft ambivalenten Ausdruckssignalen des kulturellen Alltags abstechen. So kommt sie zu dem Schluss, dass ein phylogenetisch fester Fundus von Ausdrucksfiguren durchaus universal sein könne, wenn man anerkennt, dass er bloß als Material in den kulturell ausgeformten Fundus der »blended emotions« einschießt, die auch für Ekman (und Darwin!) kulturellen »display rules« unterworfen sind. Bemerkenswert ist in diesem Zusammenhang, dass auch der späte Bühler (1960, 82f.) in enger Anlehnung an Konrad Lorenz davon ausgeht, dass konservativ-instinktive Verhaltens- und Ausdrucksfiguren später im gelernten und ontogenetisch erworbenen Verhalten der Individuen noch »durchscheinen« können. Das Lächeln des Säuglings, bekanntlich die früheste ontogenetische Kontakt- und Sozialreaktion, ist im kulturellen Leben der Erwachsenen vermutlich diejenige Ausdrucksfigur, die am wenigsten an eine bestimmte Emotion oder Affekt- oder Beziehungslage gebunden ist, aber in so gut wie alle eingebunden werden kann (bzw. sogar muss, nach kulturellen Vorschriften).

3 Dampfmaschine oder doppelte Kontingenz? Inszenierte Emotionen

Wer jemals beobachtet hat, mit welcher Hingabe bereits zweijährige Kinder Affektausbrüche inszenieren (namentlich gegenüber ihren Eltern, wenn sie etwas erreichen wollen), mit Heulen, Wutschreien, Umsichschlagen, Sichaufdenbodenwerfen, aber auch mit Trauer, Rückzug, Enttäuschung etc., der muss sich natürlich fragen (lassen), woran wir eigentlich erkennen (oder zu erkennen glauben), dass ein derartiger Gefühlsausbruch gespielt ist. Auch das entnehmen wir nämlich den Ausdrucksdaten, zum Beispiel dem erwartungsvollen Blick des Kindes, das die Wirkung seines Ausbruchs auf die Eltern prüft, oder einem nur halb präsenten, angedeuteten Lächeln hinter der Wutfassade. Oder der sehr raschen, bruchlosen Bereitschaft einzulenken, wenn die Wirkung nicht wie erwartet ausfällt. So jedenfalls legen wir uns die Dinge zurecht. Nicht minder berechtigt ist im Übrigen die bereits von Darwin notierte Erkenntnis, dass bei Kindern der Ausdruck seelischer Erregung viel kraftvoller, reiner und einfacher ist als bei hoch sozialisierten und disziplinierten Erwachsenen (Darwin 2009, 1175). In jedem Falle müssen wir mit einer Konstellation rechnen, in der Affektausdruck (in gewissen Grenzen) sozialisiert, in Willkürhandlungen eingebaut, durch kulturelle Erwartungen und Erwartungserwartungen transformiert wird – selbst dann, wenn seine elementaren Ausdrucksfiguren (nach der These Darwins, Ekmans, de Waals) tatsächlich phylogenetisches Erbe sind.

Das stärkste Argument derjenigen, die den phylogenetischen Ausdruckspol des Gesamtgeschehens in den Vordergrund schieben, besteht darin, dass bekanntermaßen Schreck, Ärger, Wut, Überraschung, Entsetzen etc. auch dann im körperlichen Gesamtausdruck manifestiert werden, wenn keine anderen Teilnehmer präsent sind, die durch das Ausdrucksgeschehen gesteuert oder beeindruckt werden könnten. Komplementäre Evidenz für Angeborenheit und Universalität des Affektausdrucks stammt aus der psychologisch-ethologischen Untersuchung taub und blind geborener Kinder (vor allem bei Ekman 1973 und Eibl-Eibesfeld 1973, 20ff.), deren Ausdrucksrepertoire (Weinen, Lächeln, Zorn, Kontaktverweigerung etc.) sich nicht erheblich von dem anderer Kinder unterscheidet, aber offenbar nicht simuliert werden kann.

In jedem Falle führt uns die Perspektive vom (angeborenen) Affektausdruck her bis an den Punkt, von dem aus deutlich wird, dass wir als Beobachter den Ausdruck lediglich als Eindruck »haben«: Er ist entweder Reaktions- oder Inferenzbasis für andere Teilnehmer oder Beobachter, mit einer (ausgedrückten) Emotion attributiv identifiziert wird er zunächst nicht durch das »Subjekt« des Ausdrucks, sondern durch andere.¹⁰

Wenig findet man (in der älteren wie in der neueren Literatur) zu der Frage, ob es nicht nur für den Emotionsausdruck, sondern auch für den Eindruck, den er auf andere macht, so etwas wie eine naturnahe, phylogenetische Grundlage gibt. Im Prinzip kann man (in der Tierwelt wie in der Menschenwelt) auf einen aggressiven Ausdruckskomplex mit Furcht, Rückzug, Gegenangriff etc. reagieren. Fest montiertes Verhalten wäre bei sozialen Arten dysfunktional. Arnold Gehlen notiert zu diesem Komplex: »Wie ebenfalls Lorenz nachgewiesen hat, sind die Grundgestalten des mimischen Gesichtsausdrucks echte Auslöser für – allerdings auf den Gefühlsstoß reduzierte – instinktive Antworten« (Gehlen 1975, 45).

Auf der Seite des Rezipienten, so interpretiere ich die ethologische These, löst der Gesichtsausdruck des Gegenübers keine fest vorhersagbare Verhaltensreaktion aus, sondern eben einen »Gefühlsstoß«, der in der eigenen Handlungs- und Verhaltensreaktion verrechnet wird. Was »im Prinzip« bedeutet, dass er auch überspielt, zurückgedrängt, reguliert werden kann. Bei Gehlen sind es dann die Institutionen und die gestalteten Produkte der Kultur (Geräte, Symbole, Sozialformen), die das Verhalten stabilisieren und erwartbar machen und das Individuum von der fallweisen Improvisation von Motiven und Entschlüssen entlasten.

Nun gibt es in der Tradition Freuds, in der US-Ethnografie nach Boas und in der Zivilisationssoziologie von Norbert Elias die axiomatische Vorstellung, dass jedwede kulturelle Ordnung auf der Normierung und Modellierung der »natürlichen« Affekte, Triebe und Emotionen ihrer Mitglieder beruht. Auf die Unterschiede zwischen diesen Ansätzen kommt es hier einstweilen nicht an – wohl aber auf den axiomatischen Zusammenhang zwischen kultureller Modellierung und situativer Adressierung des Affektausdrucks. Wenn es für verschiedene soziale Situationen und soziale Beziehungen unterschiedliche »Vorschriften« gibt, dann entsteht mit deren Befolgung zugleich auch die Möglichkeit der aktiven Simulation des vorgeschriebenen Ausdrucks. Anders gesagt: Wer in vielen verschiedenen Lebenslagen stets anderen Anforderungen folgen kann (bei Beerdigungen Trauer bekunden, am Pokertisch keine Miene verziehen), der kann auch per Kalkül affektive Konstellationen inszenieren. Es gibt eine klare Korrelation zwischen »kultureller« Normierung des Ausdrucks und der Möglichkeit, Ausdruck strategisch auf erwünschten Eindruck hin zu entwerfen. Ausdruck ist dann immer »auch anders möglich«. Kulturelle Normierungen sind auf den »generalisierten anderen« in der Eigenkultur ausgerichtet, machen aber auch den confidence man möglich, der kulturelle Figuren des Ausdrucks und der Adressierung auf bestimmte andere manipulativ zuschneidet. Wer kulturell genötigt ist, in vielen situierten Identitäten aufzutreten, der kann Ausdrucksfiguren auch transponieren.

Wir sind hier wohlgemerkt auf einer Ebene der Modellbildung, in der man durchaus noch ohne die menschliche Symbolfähigkeit auskommt. Nichts spricht dagegen, dass Erfahrungen mit der »doppelten Kontingenz« der Ausdruck/Eindruck-Kreisläufe auch von sozial lebenden Tieren verwertet werden können (einmal mehr ist de Waal 2019 voll von einschlägigen Episoden aus der Primatenwelt). Auch in zwischenmenschlichen Interaktionslagen entsteht Thematisierungsbedarf nur dann, wenn eingespielte Routinen knirschen und problematisch werden. Das ist erst dann der Fall, wenn »Erklärungen« (accounts) explizit eingefordert werden, was eben immer auch bedeutet, dass das laufende Geschehen sich für die Teilnehmer nicht mehr »von selbst versteht«. Kybernetische Ausdruck-Steuerung-Kreisläufe des »Spiegel-und Masken«-Typus (Strauss 1959) sind zwar eine Domäne des Symbolischen Interaktionismus, sie sind aber erst dann auf signifikante Symbole angewiesen, wenn sie selbst thematisiert und problematisiert werden. Sekundäre kulturelle Ritualisierungen ersparen Konflikte und explizite Thematisierungen – solange sie routiniert und problemlos laufen. Da Anhänger des Symbolischen Interaktionismus gewöhnlich fest auf die sprachlich-symbolische Basis der »doppelten Kontingenz« setzen, werden sie wohl hier heftig widersprechen. Allerdings hat sich seither (vor allem durch Arbeiten von Jerome Bruner 1974, Daniel Stern 1985, Colwyn Trevarthen 1979) in diesem Punkt viel getan, und man weiß heute mehr über vorsprachliches »emotional attunement« (vgl. z. B. den Sammelband von Braten 2006). De Waals (2019) Argumentation setzt darauf, dass es diesbezüglich keinen scharfen Schnitt zwischen Tier und Mensch gibt, weil es soziale Kontrolle durch »Wahrgenommenwerden« eben auch in der Schimpansenhorde gibt: Das rangniedrige Männchen behält das Alphatier im Blick, schaut aber weg, wenn es auf dessen Blick trifft, »damit« sein Blick nicht als Drohstarren gedeutet werden kann, und es achtet darauf, versteckt und unsichtbar zu sein, wenn es sich mit Weibchen paart, auf die das Alphamännchen »Anspruch« hat etc. Solche Motiv-accounts durch menschliche Beobachter mögen anthropomorphisierend sein und im Detail auch »falsch«, dennoch gilt für de Waal: »Our desire for sharp divisions is at odds with evolution’s habit of making extremely smooth transitions« (ebd., 45).

Und: »In both humans and other animals, giving in to one’s emotions without regard for the consequences is about the stupidest course of action to follow« (ebd., 36).

Der wohlfeile (gegen »Affenenthusiasten« wie de Waal immer verfügbare) Anwurf, man anthropomorphisiere das Verhalten in der Affenhorde, ist schon insofern wenig hilfreich, als ja auch die Ersatzausdrücke derjenigen, die Primaten eben keine »Freundschaft«, »Trauer«, »Scham« zubilligen, weil das menschliche Affekte seien, nicht weniger anthropomorphisierend einherkommen. Alle sprachlichen Symbole anthropomorphisieren. Auch wenn wir Tierverhalten kausal-reflexhaft-maschinenanalog interpretieren, benutzen wir ein menschliches Modell: eben unsere Vorstellung von kausaler Mechanik.

Axiomatisch ist das Ausdrucksgeschehen aller sozialen Arten, sofern es wahrgenommen wird, eingespannt in die Steuerungskreisläufe, die Bühler (1927) in der Krise beschrieben hat: Wir »erfahren« sie an den Wirkungen unseres Ausdrucksgeschehens, die wir an anderen wahrnehmen, und an den Wirkungen von deren Ausdruck, wie wir sie an uns selbst wahrnehmen. So gesehen sind alle derartigen Steuerwirkungen vollkommen unabhängig davon, ob sie überhaupt sprachlich-symbolisch thematisiert (und erst recht davon, ob sie von den Teilnehmern »wahr« oder »richtig« wahrgenommen und gedeutet) werden.¹¹ Ekmans Repertoire der universell identifizierbaren Ausdrucksfiguren ist, so gesehen, nicht interaktionsrelevant, sondern extrakommunikativ. Dynamisch wirksam sind Ausdrucksfiguren auch dann, wenn die ihnen zugrunde liegende Emotion nicht richtig (oder gar nicht) identifiziert ist. De Waal (2019, 53) notiert, dass Bonobos ihr Repertoire an Gesichtsausdrucksfiguren auch »sinnfrei«, das heißt ohne anwesende Artgenossen, üben – und schließt daraus, dass sie ihre beweglichen Gesichter auch einsetzen können, um andere zu manipulieren. Nachweislich wirksame Spielsignale (wie sie von Bateson bereits vor 70 Jahren analysiert wurden; Bateson 1981, 141–161) wären da sicher ein überzeugenderes Argument für die Fähigkeit, Abläufe willkürlich zu manipulieren. Die Fähigkeit, zum Beispiel Aggression zugleich in einer Ausdrucksfigur anzudeuten und (spielerisch) zurückzunehmen, ist eine Voraussetzung für den manipulativen Einsatz von Signalen in Steuerungskreisläufen.¹² Sie ist, wie die Ethologen der ersten Generation gezeigt haben, in ritualisierten Komment-Kämpfen und anderen, um »Handlungsinitien« herumgebauten Ritualen der Tierwelt hoch wahrscheinlich.

Bezeichnend für solche Übergänge im Ausdrucksgeschehen ist eben, dass sich die feste Verbindung zwischen Emotion und Ausdruck lockern muss, um sie zu ermöglichen (wenn sie denn jemals fest war). Über das »Grinsen« bei Schimpansen schreibt de Waal: »The grin is an intensly social signal that mixes fear with a desire for acceptance« (de Waal 2019, 62).

Das »Grinsen« steht für »emotional blends«, für gemischte Emotionen. De Waal kommt dann auf das menschliche Lächeln zu sprechen und notiert dessen jederzeitige Verfügbarkeit und Künstlichkeit (»artificial, for public consumption« und »we often wear plastic smiles with no deep meaning whatsoever«; ebd., 66), um dann fortzufahren, das »echte« Lächeln sei »much harder to feign« (ebd., 67), was unlogisch ist, denn wenn es als »echter« Ausdruck von »innerer« Freude, Glück etc. konzeptualisiert wird, dann ist es unmöglich, es vorzutäuschen. Oder ist nur das frühe Säuglingslächeln »echt« in seinem Emotionsausdruck?

Gleich, ob eine Ausdrucksfigur willkürlich verfügbar oder unwillkürlich »von innen ausgelöst« ist: Die Folie, auf der sie wirksam wird, ist das dynamische Geschehen der »human interaction engine« (Levinson 2006). Sie ist nicht die Außenseite einer monologischen Emotion.

Dass wir auch am Telefon lächeln, das Gesicht verziehen etc., macht zwar kommunikativ keinen Sinn, deutet aber an, dass auch kulturell konventionalisierte Ausdrucksfiguren weitgehend automatisch abgerufen werden, unabhängig davon, ob das Gegenüber sie wahrnehmen und in Steuerkreisläufe einbauen kann. De Waal freilich macht aus den kommunikativ sinnlosen Ausdrucksautomatismen ein Argument für evolutionäre Kontinuität und fährt fort:

»Unless, of course, we evolved to communicate inner states involuntarily. In that case, expression and communication are the same thing. We don’t fully control our faces, because we don’t fully control our emotions. That this allows others to read our feelings is a bonus. Indeed, the link between what goes on inside and what we reveal on the outside may well be the whole reason why facial expression evolved« (de Waal 2019, 68).

Das ist ein Satz, so flapsig, dass er beinahe auch von Bühler stammen (und gegen Wundt gerichtet sein) könnte. Was uns aber nicht daran hindern sollte, die Folgerungen genauer unter die Lupe zu nehmen. Wenn wir nämlich evolutionär darauf programmiert sein sollten, unsere Emotionen (womöglich: unverfälscht) zum Ausdruck zu bringen, dann sind alle Kulturen, insofern sie nämlich den spontanen Ausdruck von Affekten, Trieben, Emotionen regulieren und normieren (und das tun sie buchstäblich alle! – mit mehr oder weniger Erfolg) im Dauerkonflikt mit dem stammesgeschichtlich-evolutionären Erbe der Menschheit. Sie sind dann (salopp gesprochen) anti-evolutionäre Veranstaltungen. Das ist bekanntlich (s. o.) die Überzeugung orthodoxer Psychoanalytiker, Boasianischer Ethnologen und Affektmodellierungssoziologen (wie Norbert Elias). Die kulturelle Affektmodellierung verdrängt den natürlichen Emotionsausdruck. Aber kann das auch die Überzeugung eines (ansonsten stets auf evolutionäre Kontinuität bedachten!) Tierverhaltensforschers wie de Waal sein? Und sind dann Kulturen nicht allein anti-evolutionäre, sondern auch noch höchst erfolgreiche anti-evolutionäre Veranstaltungen, weil es ihnen gelingt, aus der phylogenetischen Verfügungsmasse des ererbten Affektausdrucks ein raffiniertes Instrumentarium zur Verbergung und Vertuschung der »wahren« Affekte und Emotionen zu machen?

Vor einem solchen axiomatischen Hintergrund schrumpft der spontan-unkontrollierte Affektausdruck zu einem archaischen, potenziell pathologischen Residuum, dessen Äußerungen vielleicht kleinen Kindern noch nachgesehen werden. Oder aber sie gelten, in einer benevolent kulturkritischen Interpretation, als ein Korrektiv gegenüber extremen kulturellen Zumutungen, als eine Art »Durchbrechen« der emotionalen Natur.

Wer jedenfalls (soziologisch, sozialpsychologisch, zeitdiagnostisch) auf eine »Normalität« hin sozialisiert ist, zu der strategische Selbstdarstellung, Erfolgs- und Wirkungsbezug, perfektionierte Affektmodellierung, Verstellung, Machiavellistische Praktiken (im weitesten Sinne) gehören, kurz: in einer Welt des Eindrucksmanagements,¹³ der wird de Waals Kontinuitätsthesen bestenfalls für einigermaßen naiv halten. In dieser Welt gibt es allein »modellierte« Affekte, und jede unabsichtlich kundgetane Stimmung schwächt günstigenfalls die Eigenposition und führt schlimmstenfalls zu sozialer Marginalisierung als »unkontrolliert«. Vor dem Hintergrund kulturell normierter (und vor allem: durchgesetzter) Affektmodellierung wirken Ekmans universell identifizierbare »basic emotions« wie eine Dampfmaschine im digitalen Zeitalter. Und das Pokerface ist ebenso leicht verfügbar wie das kommerzielle Konventionslächeln.

Im spezifisch menschlichen Bezugssystem der »human interaction engine« (Levinson 2006) reagieren wir bewusst und explizit auf attribuierte Intentionen, die wir aus dem multimodalen Geschehen herausdestillieren müssen, möglicherweise aber implizit und »vorbewusst« auch auf durchscheinende und subthematische Ausdruckssignale. Nicht jeder fällt auf jeden confidence man herein, aber jeder kennt physiognomische Fassaden von Menschen, von denen man »keinen Gebrauchtwagen kaufen« würde. Die online-Dynamik des interaktiven Geschehens verlangt von den Teilnehmern, dass sie aus dem multimodalen sequenziellen Ablauf herausziehen, was für den nächsten Zug relevant ist, und dokumentiert, wie sie den vorangegangenen interpretiert haben. Ausdrucks- und eindruckspsychologisch zählt, dass wir immer nur einen Punkt symbolisch-konzeptuell bündeln und linear abarbeiten können, während wir wahrscheinlich auf mehrere implizit reagieren – und indem wir die wahrgenommene Gesamtsequenz auf (sagen wir) gestalthafte Konsistenz abklopfen. Wenn wir ein Gesichtsfoto betrachten, das einen »fruchtbaren Moment« (Bühler 1933, 81) in den »Sukzessionsgestalten« des Ausdrucksgeschehens fixiert, dann scheint eine eindeutige Interpretation möglich – aber in der Interaktion haben wir die Ausdrucksdynamik als flüchtige Facette des Gesamtgeschehens. Die eindeutige sprachliche Bezeichnung passt gut zum fixierten »fruchtbaren Moment« – und weit weniger gut zur »unordentlichen« interaktiven Realität. Denn da muss er mit einer Fülle anderer Indizes und Symptome verzahnt und verrechnet werden.

De Waals Auseinandersetzung mit Lisa Feldman Barrett (2017) beginnt just an diesem Punkt:

»That faces are best judged in context has been taken to its extreme by Lisa Feldman Barrett, an American psychologist, who claims that emotions are mentally constructed. Instead of us being born with a set of well defined emotions marked by clear body signature, she argues, what we feel boils down to how we evaluate the situation we find ourselves in. Her position clashes with scientists who believe in Ekman’s six basic emotions as the foundation of everything« (de Waal 2019, 125).

Für Barrett (2017) sind Emotionen und Affekte körpernahe Bewertungsinstanzen, abgemischt aus dem aktuellen Aktivierungs- und Erregungszustand des Akteurs und der laufenden Situationsbewertung als angenehm oder unangenehm. Zur konventionellen »Grammar of Motives« (Burke 1969 [1945]) gehört es bei Psychologen, dass sie Emotionen und Affekte auf das Individuum zurechnen, das sie »zeigt«, nicht auf dessen aktuelle Bewertung der laufenden Situation und der Beziehung zu anderen Teilnehmern. Umso mehr, als die erlebnispsychologische Denktradition uns ja nahelegt, dass ihre Innenseite allein dem ausdrückenden Individuum gegeben und nur »subjektiv« erfahrbar sei. Je mehr man freilich zu einer soziologischen Perspektivierung des Geschehens wechselt, desto eher erscheinen Affekte und Emotionen als evaluative »Reflexe« des Handlungsgeschehens am und im Akteur, die ihm die »Richtung« seines Handelns vorgeben. Dass die eigene Befindlichkeit in diesen Komplex mit eingeht, versteht sich. Aber wie sie das tut, ist nicht klar. Barrett (2017) stellt ihre eher neurologisch basierten Innenbefunde schroff den sprachlich-kulturell konstruierten Außenbefunden gegenüber. Das hat den Effekt, die erlebnispsychologischen Probleme des »Innen« zu neutralisieren – ein Effekt übrigens, den de Waal mit seiner schroffen terminologischen Gegenüberstellung von »feeling« (innen, unzugänglich) und »emotion« (außen, analysierbar, vergleichbar) ganz ebenso erreicht.

4 Kultur und Ausdruck/Eindruck

Auf den ersten Blick könnte es de Waal gefallen, was Kenneth Burke über die schlagende Wirkung der Stummfilme Charly Chaplins (und deren Fundierung im körperlichen Ausdruck) schreibt:

»The people’s extreme delight in the acting of Charly Chaplin was probably due to the way in which his accurate mimetic style could surmount the social confusion. His expressions possessed an almost universal significance, since they were based upon the permanent certainties of the body, the eternal correlations between mental attitude and bodily posture« (Burke 1984 [1935], 52).

Auf den zweiten Blick sollte es freilich zu denken geben, dass man für die überzeugende Darstellung der »ewigen Wahrheiten« des körperlichen Ausdrucks einen so perfekten Stummfilm-Schauspieler wie Charly Chaplin benötigt. Das spricht nicht gerade dafür, dass wir die »ewigen Wahrheiten« des Emotionsausdrucks im Alltag überhaupt zu Gesicht bekommen. Chaplins Ausdruck ist so hoch ritualisiert und überprägnant, dass er in allen Einzelheiten Konrad Lorenz (und Niko Tinbergens) ethologische Definition des supernormalen Stimulus erfüllt. Und wer Burkes Stichwort der »social confusion« ernst nimmt, der wird als Kulturalist den durchschlagenden Erfolg Charly Chaplins auch darauf zurückführen, dass in der multikulturellen und hoch fragmentierten Einwanderergesellschaft der USA die Verständigung mittels kongruenter kultureller Erwartungserwartungen (doppelte Kontingenz) eben höchst problematisch geworden war. Vor diesem Hintergrund kompensiert Chaplins »übernormaler« Ausdruck der naturnahen emotionalen Bewertungen das Fehlen eines kulturellen »Vorverständigtseins«, wie es in kulturell homogenen Zusammenhängen erwartet werden könnte.

Und wenn Chaplins Meisterschaft darin bestand, die situierten Bewertungen des laufenden sozialen Geschehens durch den Akteur ausdruckstechnisch so in Szene zu setzen, dass sie kulturunabhängig erkannt und genossen werden können, dann ist die manipulative Komplementär- und Gegenfigur dazu der confidence man, am besten eingedeutscht vielleicht als Hochstapler, Trickbetrüger, jemand, der vorgibt, etwas zu sein, was er nicht ist, aber doch vollkommen verkörpert. Literarisch gestaltet ist der confidence man in Herman Melvilles letztem, gleichnamigem Roman (Melville 1990 [1857]), und soziologisch verkörpert ist er in der Mikrosoziologie Erving Goffmans.

Der confidence man ist das Paradigma der kulturell fragmentierten Massengesellschaft in den USA (und Melville ist ihr Prophet). Als Sozialfigur lebt er davon, dass er ausdruckstechnisch und situativ stets die sozialen Identitäten verkörpern und adressieren kann, von denen er sich Vorteile verspricht. Er ist ein gewitzter Schauspieler und geübt in der Kunst, sich so in Szene zu setzen, dass er das Vertrauen seiner Adressaten erwirbt (und allfällige Anfälle von Misstrauen überspielt). Und wenn er es erworben hat, setzt er es ein für den eigenen Vorteil. Ausdrucks- und Eindruckspsychologisch ist der confidence man darum interessant, weil er von strategischer Authentitätssuggestion lebt und weil jedes erkennbare Durchschlagen seiner wirklichen »inner states« das Spiel umgehend zerstören würde. Gegen generalisiertes Misstrauen hat er weder eine Chance, wenn er andere anpumpt, sie um milde Gaben für Bedürftige bittet, noch wenn er ihnen lukrative Einnahmen in Aussicht stellt (Melville 1990 [1857] gestaltet den ganzen Komplex sehr feinsinnig).

Kurz: Auch der confidence man muss, ganz wie der authentische Darsteller der naturnahen »ewigen Wahrheiten« des Ausdrucksgeschehens, ein vorzüglicher Schauspieler sein, dem vor allem eines nicht passieren darf: dass man seine »wahren« Motive, Absichten, Affekte zu irgend einem Zeitpunkt an der Ausdrucksoberfläche erkennen kann. Wir normalsterblichen Alltagsakteure, so die Schlussfolgerung, bewegen uns irgendwo zwischen den beiden Extremen. Wir sind in der Lage, unsere strategischen Interessen und Selbstdarstellungen zu managen und dabei halbwegs »echt« auszusehen, wie es die kulturellen Normen verlangen. Wir treten in den situierten Identitäten auf, die von uns verlangt werden, inszenieren aber nur in Maßen Ausdrucksschablonen, um andere hereinzulegen. Wir lachen manchmal aus sozialer Höflichkeit und manchmal »wirklich« etc., und wir können uns mehr oder weniger gut »verstellen«.

Vor diesem Hintergrund könnte es heuristisch sinnvoll sein, in der Sphäre der menschlichen online-Interaktion, auf der Ebene der »human interaction engine« (Levinson 2006), nur das wirklich dem Ausdruck zuzurechnen, was als unkontrollierter »Überschuss« den Erwartungshorizont der doppelten Kontingenz überschreitet, was den Teilnehmern als nicht-willkürlich, als unabsichtlich etc. erscheint – selbstverständlich eine instabile und wechselnde Größe, die bestenfalls vor Ort und lokal bestimmt werden kann. Und vor allem: eine Dimension, die wir vor allem dann zu Gesicht bekommen, wenn sie zur Grundlage von expliziten oder impliziten Teilnehmer- und/oder Beobachterinferenzen wird. Das dürfte aber für den konzeptuellen Kern dessen stehen, was bei Bühler »Symptom« ist. Steuerwirkungen, die subsymbolisch und unterhalb der Inferenzebene bleiben, sind notorisch schwer zu validieren.

Am Ende können wir in nachträglichen, filmbasierten Sequenzanalysen nur dingfest machen, was auch tatsächlich bei anderen Teilnehmern Reaktionen auslöst (oder aber aus der Beobachterposition heraus solchermaßen gedeutet wird), was irgendwie im Fortgang der Dinge aufgenommen und ratifiziert worden ist. Es gibt eine fließende Grenze zwischen dem, was wir (bzw. was die Teilnehmer) dem Verhältnis zwischen adressierender und adressierter lokaler Identität zurechnen, und dem, was der handelnden Person zugerechnet wird. Ähnlich konzipiert ist Erving Goffmans Unterscheidung zwischen »information given« und »information given off«, die wiederum auf Ichheiser (1949) zurückverweist. Da wir aber im Alltag nie genau wissen können, was uns absichtlich mitgeteilt, was uns durch die Blume zu verstehen gegeben (als Inferenz nahegelegt) und was uns unabsichtlich kundgegeben ist, bleibt diese Grenzziehung problematisch.

Fragwürdig und problematisch wird diese Grenz- und Übergangszone dann erst recht zum Beispiel im Verhältnis zwischen Psychiatern und Personen, die als »psychisch krank« diagnostiziert sind. Bei ihnen gilt plötzlich alles, was sie äußern, als »Symptom« ihrer Erkrankung, mit dem unweigerlichen Ergebnis, dass sie krampfhaft versuchen, das eigene Ausdrucksgeschehen unter Kontrolle zu bringen, was seinerseits Resultate zeitigt, die ebenfalls als pathologische Symptome gedeutet werden können. Was Personen, die als »psychisch krank« etikettiert sind, uns absichtlich mitteilen, wird sogleich in die Symptomebene verschoben, mit dem Resultat, dass sich leicht so etwas wie ein »Rüstungswettlauf« etabliert zwischen den sozial-konventionellen Signaldeutungen und den psychiatrischen Symptomdeutungen des Ausdrucksgeschehens. Ein Rüstungswettlauf übrigens, den die Psychiater bei Weitem nicht immer gewinnen. Besser gesagt: Sie gewinnen ihn, nicht weil sie über bessere Deutungen, sondern nur, weil sie über mehr institutionelle Macht verfügen.

Tomasellos (2020) erneuertes Argument für eine absolute menschliche Sonderstellung ruht auf dem axiomatischen Konzept der geteilten Intentionalität. Menschliche Emotionen, so der Leitgedanke, sind nicht so sehr die Außenseite innerer Zustände der Individuen, sondern vielmehr Angebote, Affekte und Bewertungen in der (affektiv-dyadischen oder triadischen) Konstellation geteilter Aufmerksamkeit für ein gemeinsames »Thema« ebenfalls zu teilen.

Damit sind sie als menschliche von Anfang an sozial und der individualpsychologischen Zuständigkeit entzogen. Wir können von dieser Warte aber auch mit dem Gedanken leben, dass soziale Primatenarten ihr Ausdrucksverhalten im Blick auf die vorweggenommenen Gruppenreaktionen entwickeln. Was Folgen hat für den evolutionären Erfolg einer Gruppe, das ist auch selektionsrelevant für die Individuen (es sei denn für dogmatische Feinde jedweder Gruppenselektion). Es wäre aber gleichermaßen naiv, die Existenz antagonistischer, eben nicht auf das Teilen angelegter Emotionen in der Menschenwelt abzustreiten wie umgekehrt die Existenz kooperativer und geteilter emotionaler Zustände in Primatenhorden. Der theorietechnische Vorteil Tomasellos liegt darin, dass seine sprachanalogen triadischen Konstellationen (in denen mehrere Teilnehmer gegenüber gemeinsam gegebenen Erfahrungsgegenständen gemeinsame emotionale Einstellungen aufbauen) eine Matrix für die kulturelle Konditionierung des Emotionsausdrucks bereitstellen. Sein Modell steht in der Tradition, wonach die menschliche Symbolfähigkeit alles ändert, auch den Emotionsausdruck, seine Wirkung und seine Deutung, und es steht somit im Gegensatz zu de Waals »affenenthusiastischer« Kontinuitätsthese. Wenn die Vermutung (mehr ist es keinesfalls) stimmen sollte, dass es die ständige (in der Ontogenese zunehmende) Verfügbarkeit des sprachlich-symbolischen Modus ist, die den naturwüchsigen Ausdruck/Eindruck-Komplex hybridisiert und überlagert, dann wären Untersuchungen sinnvoll und heuristisch fruchtbar, die das Verhältnis von Ausdruckskontrolle und Sprachbeherrschung in der kindlichen Entwicklung in den Blick nehmen. Schließlich beginnen die emotionalen »Protokonversationen« der frühkindlichen Entwicklung zwischen einem »naturhaft« lächelnden oder schreienden Säugling und einer (hoffentlich ebenfalls lächelnden, aber) symbolisch-inferierenden Bezugsperson, deren emotionale Ressourcen kulturell geformt und wenigstens partiell von durchgesetzten Deutungsmustern her eingesetzt werden. Pathologien nehmen da ihren Ausgangspunkt, wo die »naturhafte« und die symbolisch-inferenzielle und »kulturhafte« Seite des Geschehens inkompatibel werden.

Unter unmittelbarem situativem Handlungs- und Entscheidungsdruck intensivieren sich Affekte und Emotionen – während entlastetes, routiniertes und gekonntes Handeln dazu tendiert, affektiv und ausdrucksmäßig unergiebig zu werden. Und das gilt durchaus auch für entlastetes und routiniertes sozial-interaktives Handeln. Der psycho-biologische Bewertungsapparat, zu dem Affekte und Emotionen gehören, tritt dann in den Hintergrund und übernimmt Signal- und Monitoring-Funktionen im laufenden Geschehen. Beispielhafte Analysen der Engführung von Signal- und Monitoring-Funktionen im Blickverhalten von Fußgängern auf belebten Wegen, die einander ausweichen (und das miteinander organisieren) müssen, findet man bei Goffman (1974, 23–53). In solche Ausdruck-Steuerung-Kreisprozesse eingebunden ist bekanntlich auch das Blickverhalten in Gesprächen (vgl. exemplarisch Erb-Sommer und Schmitz 1989). Offenbar können die »Reste« ehedem durchaus »starken« Emotionsausdrucks (wie z. B. auch das allgegenwärtige Lächeln) leicht in Signal- und Steuerungsfunktionen eingefädelt werden. Sie reduzieren ihren Ausdruckswert zugunsten ihrer Signal- und Steuerungsfunktion. All das sind Weisen dynamischer hic-et-nunc-Steuerungen, die ganz und gar ohne explizite Sinnbildungs- und Verstehensprozesse auskommen, wie sie in der Sprachkommunikation dominieren (vgl. hierzu die Diskussion über Bühlers Lebenspsychologie bei Friedrich 2018, 149ff.).

Dass jedenfalls auch Bühler entlang solcher Linien gedacht hat, belegt der (freilich ziemlich kryptische) Satz im leicht chaotischen Schlussteil der Ausdruckstheorie: »Wer weiß, was auszudrücken übrig bliebe, wenn man den Menschen der Fiktion, der Maske und des Rollenspiels in jeder Form entwöhnen könnte« (Bühler 1933, 203).

5 »Ich sehe was, was du nicht fühlst«

Mit dieser hübschen Überschrift versieht die FAZ einen Artikel, der von den jüngsten Anwendungsversuchen ausdruckspsychologischer Modelle in der KI-Forschung handelt (vgl. Scheer 2021). Nach der automatischen Gesichtserkennung ist derzeit die automatische Identifizierung im Gesicht ausgedrückter Emotionen ein KI-Hype. Es gibt bereits Websites, auf denen man sein Gesicht in die Kamera halten kann, während die Software den mimischen Ausdruck den sechs Grundemotionen Ekmans zuordnet. Was den Einsatz solcher Emotionserkennungssysteme angeht, so sind der Fantasie keine Grenzen gesetzt. Wer künftig das falsche Gesicht schneidet, wird bei der Jobsuche ausgesiebt, nicht in den Flieger oder ins Konzert gelassen, als potenzieller Störer markiert etc. Die dystopischen Potenziale der Digitalisierung sind erst in groben Umrissen erkennbar. Scheer (2021) berichtet, in chinesischen Gefängnissen sei eine affektive Rundumüberwachung der Gefangenen bereits verbaut. Der Hersteller wirbt damit, dass so Suizide verhindert werden könnten! Man könnte auch sagen: Die Überwachung reicht so weit, dass man sich ihr nicht einmal durch Freitod entziehen kann. Wir werden künftig lernen müssen, den Überwachungskameras ein möglichst unauffälliges Pokerface zu zeigen. Und was uns von den Primaten unterscheidet, ist eben: dass wir das (in gewissen Grenzen) lernen können.

Was hier interessiert, ist jedoch nur die Programmierung solcher Geräte, und da begegnen wir in der Tat unseren Helden: Die von den Kameras erfassten Ausdrucks- und Bewegungsmuster werden algorithmisch mit Bildern abgeglichen, die zuvor von Vpn den vermeintlich kulturübergreifenden Ekman’schen Grundemotionen zugeordnet worden sind. Wie sollte man auch anders verfahren? Im interaktionalen Vollzug sind auch Menschen nur selten sicher, die Emotion ihres Gegenübers »korrekt« identifiziert zu haben. Sie geben eine Rückmeldung, die ihre Deutung implizit enthält. Einmal mehr haben wir es bei den Algorithmen zur Emotionserkennung zu tun mit der (auf Duchenne zurückweisenden und bereits von Darwin kritisierten) zirkulären Konstellation aus verfügbaren sprachlichen Etiketten und »supernormalen« Stimuli. Gegen diese Praktiken, so erfahren wir von Scheer (2021), macht unter anderen Lisa Feldman Barrett mobil:

»Eine Metastudie, an der Lisa Feldman Barrett mitgewirkt hat, kommt auf Emotionserkennung bezogen zu einem noch vernichtenderen Urteil: Es gebe schlicht keine hinreichenden wissenschaftlichen Belege dafür, dass die Gefühlslage einer Person aus ihrem Gesicht abzulesen sei. Das AI Now Institute der New York University zieht daraus einen radikalen Schluss: Emotionserkennungssysteme sollten verboten werden, wo immer es um ›wichtige Entscheidungen‹ für Menschen gehe« (ebd., 9).

Dem ist nichts hinzuzufügen – außer vielleicht, dass man diesen jüngsten KI-Hype auch als eine Art Gleichnis für den »Fortschritt« in der Psychologie lesen kann. Hoch wirksame Sozial- und Überwachungstechnologien funktionieren auch, wenn man sie mit falscher und schlechter Psychologie füttert.

Anmerkungen

[1]: Im folgenden Text verwende ich die Ausdrücke »Affekt«, »Emotion«, »Gefühl«, wo es auf den von de Waal markierten Unterschied nicht ankommt, weitgehend austauschbar. In der gegenwärtigen Affektpsychologie neigt man zu anderen terminologischen Konventionen und versteht unter »Emotion« oft gerade das sprachlich Konzeptualisierte.
[2]: Und haben sich nicht die frühen Denkpsychologen, nicht zuletzt der Külpe-Schüler Bühler selbst, mächtig schwergetan mit der sprachlichen Explikation dessen, was man salopp als »Gedanken« bezeichnet?
[3]: Hier ist zu beachten, dass Barrett (2017) de Waals terminologische Ausgangslage (Gefühle = innen, Emotionen = außen) nicht teilt.
[4]: In Anlehnung an die Säuglingsforschung von Colwyn Trevarthen und Daniel Stern spricht er von emotionaler »Protokonversation« und von bindungsförderndem »emotional attunement«. Man beachte, dass Emotionen hier gar nicht primär dem Individuum zugerechnet werden, sondern von vornherein den jeweiligen sozialen Beziehungen!
[5]: Bühler (1933) konzeptualisiert die in der Literatur zur Illustration von Emotionen üblichen Standfotos als »fruchtbare Momente« im dynamischen Ausdrucksgeschehen; ich komme darauf zurück.
[6]: Nicht diskutieren kann ich hier das medienwissenschaftlich natürlich sehr relevante Problem, ob die üblichen »stills«, Standfotos, die uns in der Ausdrucksliteratur als repräsentativ für bestimmte Emotionen präsentiert werden, angemessene Vertreter des dynamischen Gesamtgeschehens sein können, mit dem es die Teilnehmer von Interaktionen zu tun haben. Bühler hat das Problem jedenfalls gesehen und spricht (in Bühler 1933, passim) von den »fruchtbaren Momenten«.
[7]: Es versteht sich, dass der Ausdruck im gleichen Maße aufhört, »unwillkürlich« zu sein, wie er von äußeren Tatbeständen her eingesetzt werden kann.
[8]: Und darüber hinaus auch der Auffassung von Konrad Lorenz, wonach die unwillkürlichen Ausdrucksfiguren Rudimente von Zwecktätigkeiten seien.
[9]: Ekman (1973) schreibt über Birdwhistell, dieser sei in seinen Kinetik-Analysen ein »captive of his own linguistic model« geworden. So zitiert Mead (1974, 211) ihn, eine Diagnose, der man mit dem zeitlichen Abstand von beinahe 50 Jahre durchaus zustimmen kann, denn in der Tat haben sich die linguistischen Verfahren des Segmentierens und Klassifizierens im Bereich des Ausdrucks- und Bewegungsverhaltens nicht bewährt (vgl. hierzu auch Schmitz 1975, 174–178 und Farnell 2002).
[10]: Diese Erkenntnis finden wir bereits bei Gustav Ichheiser (1932).
[11]: »[V]erbal labeling is not part of emotional communication«, schreibt de Waal (2019, 124) bündig.
[12]: De Waal (2019, 71f.) kommt auch auf die Bedeutung von Spiel-Signalen zu sprechen, aber in etwas anderen Zusammenhängen.
[13]: Wie sie dominiert in den soziologisch-sozialpsychologischen Analysen von Gustav Ichheiser und Erving Goffman.

Literatur

Barrett, Lisa Feldman. 2017. How Emotions are Made. The Secret Life of the Brain. New York: Houghton, Mifflin, Harcourt.

Bateson, Gregory. 1981. Ökologie des Geistes. Frankfurt a. M.: Suhrkamp.

Braten, Stein, Hrsg. 2006. On Being Moved. From Mirror Neurons to Empathy. Amsterdam & Philadelphia: Benjamins.

Bühler, Karl. 1927. Die Krise der Psychologie. Jena: Fischer.

Bühler, Karl. 1933. Ausdruckstheorie. Das System, an der Geschichte aufgezeigt. Jena: Fischer.

Bühler, Karl. 1960. Das Gestaltprinzip im Leben der Menschen und der Tiere. Bern: Huber.

Bruner, Jerome S. 1974. »From communication to language – a psychological perspective«. Cognition 3 (3): 255–87.

Burke, Kenneth. 1969 [1945]. A Grammar of Motives. Berkeley, L. A.: University of California Press.

Burke, Kenneth. 1984 [1935]. Permanence and Change. Berkeley, L. A.: University of California Press.

Darwin, Charles. 2009. Gesammelte Werke. Frankfurt a. M.: Zweitausendeins [nach den Übersetzungen von Carus].

De Waal, Frans. 2019. Mama’s Last Hug. Animal Emotions and What They Tell Us about Ourselves. New York & London: Norton.

Eibl-Eibesfeld, Irenäus. 1973. Der vorprogrammierte Mensch. Wien, München & Zürich: Fritz Molden.

Ekman, Paul, Hrsg. 1973. Darwin and Facial Expression. A Century of Research in Review. New York: Academic Press.

Ekman, Paul. 1998. »Afterword: Universality of emotional expression? A personal history of the dispute«. In Darwin, hrsg. v. Paul Ekman, 363–93. New York & Oxford: Oxford UP.

Erb-Sommer, Matthias und Walter H. Schmitz. 1989. »Wegblicken in verbaler Interaktion. Zur Funktion und Determination nonverbalen Verhaltens«. In Kognition und Kommunikation. Beiträge zur Psychologie der Zeichenverwendung, hrsg. v. Clemens Knobloch, 101–36. Münster: Nodus.

Farnell, Brenda. 2002. »Birdwhistell, Hall, Lomax, and the ›Origins‹ of Visual Anthropology: A Commentary«. Visual Anthropology 16 (1): 43–56.

Fleck, Christian. 2015. Etablierung in der Fremde. Vertriebene Wissenschaftler in den USA nach 1933. Frankfurt & New York: Campus.

Friedrich, Janette. 2011. »Das Erleben von Ausdruck – Einfühlung oder Zeichen? Zu Bühlers Ausdruckstheorie«. In Gefühl, Geste, Gesicht. Zur Phänomenologie des Ausdrucks, hrsg. v. Michael Großheim und Stefan Volke, 88–113. Freiburg: Karl Alber.

Friedrich, Janette. 2018. »Bühlers neues Programm der Lebenspsychologie«. In Karl Bühlers Krise der Psychologie, hrsg. v. Janette Friedrich, 137–64. Cham: Springer.

Gehlen, Arnold. 1975. Urmensch und Spätkultur. 3. Aufl. Frankfurt a. M.: Athenaion.

Goffman, Erving. 1959. The Presentation of Self in Everyday Life. New York: Doubleday.

Goffman, Erving. 1974 [1971]. Das Individuum im öffentlichen Austausch. Frankfurt a. M.: Suhrkamp [zuerst 1971 als: Relations in Public. Microstudies of the Public Order. New York: Basic Books].

Ichheiser, Gustav. 1932. »Ausdruck und Eindruck« [Expression and impression]. Kölner Vierteljahresheft für Soziologie 11: 59–64.

Ichheiser, Gustav. 1949. Misunderstandings in Human Relations: A study of false social perception. Chicago: University of Chicago Press. [Erhältlich als Beigabe zum American Journal of Sociology 55 (2), Teil 2. Wiederabgedruckt 1970 in Appearances and realities: Misunderstandings in human relations, hrsg. v. W. E. Henry und N. Sanford, 7–120. San Francisco: Jossey-Bass.]

Ichheiser, Gustav. 1970. Appearances and realities: Misunderstandings in human relations, hrsg. v. W. E. Henry und N. Sanford. San Francisco: Jossey-Bass.

Joerchel, Amrai C. und Gerhard Benetka, Hrsg. 2018. Memories of Gustav Ichheiser. Life and Work of an Exiled Social Scientist. Cham: Springer.

Levinson, Stephen C. 2006. »On the Human ›Interaction Engine‹«. In Roots of Human Sociality. Culture, cognition and human interaction, hrsg. v. Stephen C. Levinson und Nicholas J. Enfield, 39–69. Oxford: Berg Publishers.

Mead, Margaret. 1974. »Review of Ekman (1973)«. Journal of Communication 25 (1): 209–13.

Melville, Herman. 1990 [1857]. The Confidence-Man. His Masquerades. London, N. Y.: Penguins.

Scheer, Ursula. 2021. »Ich sehe was, was du nicht fühlst«. Frankfurter Allgemeine Zeitung, 14. April 2021: 9.

Schmitz, Heinrich Walter. 1975. Ethnographie der Kommunikation. Hamburg: Buske.

Stern, Daniel N. 1985. The Interpersonal World of the Infant: A View from Psychoanalysis and Developmental Psychology. New York: basic.

Strauss, Anselm. 1959. Mirrors and Masks. The Search for Identity. Glencoe: The Free Press. [Dt. Übersetzung 1968 Frankfurt a. M.: Suhrkamp.]

Tomasello, Michael. 2020. Mensch werden. Eine Theorie der Ontogenese. Berlin: Suhrkamp.

Trevarthen, Colwyn. 1979. »Communication and cooperation in early infancy: A description of primary intersubjectivity«. In Before Speech: The Beginning of Interpersonal Communication, hrsg. v. Margaret Bullowa, 321–47. Cambridge: UP.

Ungeheuer, Gerold. 1972 [1967]. »Die kybernetische Grundlage der Sprachtheorie von Karl Bühler«. In ders. Sprache und Kommunikation, 171–90. Hamburg: Buske [zuerst 1967 in To Honor Roman Jakobson. Essays on the Occasion of his Seventieth Birthday, Vol. 3, 2067–86. The Hague: De Gruyter Mouton.]

Der Autor

Clemens Knobloch, Prof. Dr. em., ist Sprach- und Kommunikationswissenschaftler. Seine Arbeitsschwerpunkte sind: Geschichte der Sprachwissenschaft, Sprachpsychologie, Politische Kommunikation, Grammatik.

Kontakt: Prof. Dr. em. Clemens Knobloch,
Gartenstraße 16, 53913 Swisttal,
E-Mail: knobloch@germanistik.uni-siegen.de