Autoren-Beiträge Wenn KI über Unternehmen spricht Warum Reputation neu gedacht werden muss

Reputation entsteht zunehmend durch das, was KI-Systeme über Unternehmen „wissen“ und erzählen. KI-basierte Suchsysteme wie ChatGPT, Perplexity oder Google AI sammeln nicht einfach Informationen, sondern verdichten Meinungen, gewichten Inhalte und beeinflussen so aktiv den öffentlichen Diskurs. Für Kommunikationsverantwortliche heißt das: Die Sichtbarkeit in KI-Modellen zu messen reicht nicht. Entscheidend ist, wie ein Unternehmen in KI-Antworten erscheint – in welchem Ton, mit welcher Glaubwürdigkeit und welchen Assoziationen.

"Sprachmodelle ersetzen keine Marktforschung, messen Reputation aber indirekt, indem sie Aufmerksamkeit und Tonalität der Berichterstattung analysieren", sagt Lydia Prexl. (Foto: privat)

Immer mehr Menschen informieren sich nicht mehr primär über klassische Suchmaschinen, sondern verlassen sich auf die Antworten von KI-Sprachmodellen (LLMs). Diese funktionieren jedoch grundlegend anders als Google & Co.: Sie verlinken nicht auf einzelne Websites, sondern fassen Informationen aus zahlreichen Quellen zusammen, ordnen sie neu ein und liefern eine interpretierte Antwort. Damit ist eine KI-Antwort nicht nur Information, sondern immer auch Deutung – und genau diese prägt zunehmend die Wahrnehmung von Unternehmen, Marken und Themen.

Kommunikationsverantwortliche sehen sich daher mit fünf zentralen Fragen konfrontiert:

  1. Sichtbarkeit: Wie sichtbar ist unsere Marke in KI-generierten Antworten im Vergleich zu relevanten Wettbewerbern („Share of LLM Voice“)?
  2. Korrektheit: Wie sachlich korrekt stellt KI unser Unternehmen dar (z. B. Funktionen, Leistungen, zentrale Fakten)?
  3. Wettbewerbsposition: Wie ist mein Unternehmen im Vergleich zu Wettbewerbern in KI-Antworten positioniert und welche Alternativen werden genannt?
  4. Tonalität: In welcher Tonalität wird mein Unternehmen von KI-Systemen dargestellt (positiv, neutral, kritisch)?
  5. Narrativ & Rolle: In welchem übergeordneten Narrativ erscheint mein Unternehmen in KI-Antworten und wie konsistent ist dieses Rollenbild?

Was LLM-Visibility-Tools leisten – und was nicht

Um diese Fragen systematisch zu messen, stehen inzwischen zahlreiche spezialisierte LLM-Monitoring-Tools zur Verfügung. In meiner Analyse habe ich Peek AI, Otterly AI, Profound, Nightwatch und Semrush untersucht. Trotz unterschiedlicher Funktionsweisen und Schwerpunkte versprechen diese Lösungen im Kern dasselbe: Sie wollen sichtbar machen, wie relevant ein Unternehmen in KI-gestützten Such- und Antwortsystemen ist, und Wege aufzeigen, diese Sichtbarkeit zu verbessern.

In den vergangenen Tagen habe ich verschiedene LLM-Tracking-Tools intensiv analysiert und getestet. Mein Fazit fällt differenziert aus – insbesondere mit Blick auf die fünf zentralen Fragestellungen von Kommunikationsverantwortlichen.

Bei der Sichtbarkeit (1) leisten die Tools einen klaren Mehrwert: Sie schaffen Transparenz darüber, ob, wie häufig und in welchen Kontexten Unternehmen in KI-generierten Antworten erscheinen – und zwar modellübergreifend von ChatGPT bis Gemini oder Perplexity. Damit ermöglichen sie eine belastbare Annäherung an den „Share of LLM Voice“.

Auch die Wettbewerbsposition (3) lässt sich gut analysieren. Die Tools zeigen, welche Wettbewerber in KI-Antworten gemeinsam genannt werden, welche Alternativen KI-Systeme vorschlagen und wie sich die eigene Marke im Vergleich positioniert. Für Markt- und Wettbewerbsanalysen im KI-Umfeld sind diese Erkenntnisse äußerst wertvoll.

Ergänzend liefern einige Tools Hinweise zur Tonalität (4), indem sie Erwähnungen als positiv, neutral oder kritisch einordnen. Diese Bewertungen sind hilfreich für eine erste Einschätzung, bleiben jedoch oft relativ grob und sollten nicht mit einer umfassenden Reputationsanalyse verwechselt werden.

Kaum einen Nutzen haben die Tools bei der Frage nach der Korrektheit (2). Zwar können die Tools zeigen, wie eine Marke in AI-Systemen erscheint, aber nicht, ob sie korrekt dargestellt wird. Die fundierte Bewertung der inhaltlichen Richtigkeit und kommunikativen Angemessenheit erfordert weiterhin menschliche Expertise.

An ihre Grenzen stoßen die Tools schließlich auch bei Narrativ und Rolle (5). Sie liefern Kennzahlen zu Sichtbarkeit und Tonalität, erlauben aber kaum belastbare Rückschlüsse darauf, in welchem übergeordneten Narrativ ein Unternehmen erscheint oder welches Rollenbild KI-Systeme langfristig reproduzieren.

Unterm Strich sind LLM-Tracking-Tools eine wichtige Grundlage, um Sichtbarkeit und Wettbewerbsposition im KI-Ökosystem einzuordnen. Für tiefere Fragen der Reputation, des Narrativs und der strategischen Markenrolle ersetzen sie jedoch keine kommunikationsstrategische Interpretation, sondern machen sie erst notwendig.

Was ist Reputation und wie lässt sie sich messen?

Womit wir bei einer weiteren Frage sind, die mich in den letzten Tagen viel beschäftigt hat: Lassen sich die Sprachmodelle nicht selbst unmittelbar als Frühwarnsystem für Reputationsrisiken nutzen?

Bevor wir diese Frage beantworten können, lohnt sich ein kurzer Blick auf den Begriff Reputation selbst. Reputation beschreibt die Gesamtwahrnehmung eines Unternehmens oder einer Marke – also wie sie von anderen gesehen, beurteilt und eingeordnet wird. Entscheidend ist dabei die Präzisierung „von anderen“: Reputation ist keine objektiv messbare Eigenschaft, sondern eine Zuschreibung von außen. Sie ist kein Besitz, sondern das Ergebnis kollektiver Wahrnehmung.

Dieser immaterielle Wert speist sich aus mehreren Faktoren: aus kommunizierten Aussagen und Intentionen, aus tatsächlichem Handeln, aus direkten Erfahrungen von Kundinnen und Kunden sowie aus Einschätzungen von Medien, Peers und der Öffentlichkeit. Erst das Zusammenspiel dieser Dimensionen entscheidet langfristig über Vertrauen, Glaubwürdigkeit und Akzeptanz.

Genau deshalb war es bislang sehr aufwendig und kostenintensiv, Reputation zu messen. Etablierte Modelle der Reputationsmessung wie das RepTrak-Modell oder der Reputation Quotient (RQ) basieren in der Regel auf umfangreichen Befragungen. Reputation wird dabei entlang mehrerer Kerndimensionen strukturiert, über konkrete Aussagen und Fragen in standardisierten Umfragen operationalisiert und zu einer Gesamtwahrnehmung verdichtet. Am Ende dieser Modelle steht jeweils ein Reputationsscore zwischen 0 und 100, der quantifiziert, wie positiv ein Unternehmen von der Öffentlichkeit wahrgenommen wird.

LLMs als potenzielles Frühwarnsystem für Reputation

Kehren wir an dieser Stelle zu den Sprachmodellen zurück. Mir ist bewusst: Sprachmodelle ersetzen keine klassischen Umfragen und keine ausgeklügelte Marktforschung. Gleichzeitig messen auch heute schon medienbasierte Ansätze Reputation indirekt, indem sie Aufmerksamkeit und Tonalität der Berichterstattung analysieren. Die Medienberichte fungieren als Proxy: Ein Anstieg positiver Tonalität wird als Verbesserung, ein Überwiegen negativer Berichte als Verschlechterung der Reputation interpretiert. Auch wenn diese Verfahren keine direkte Wahrnehmungsmessung ersetzen, liefern sie wertvolle Hinweise auf Reputationsentwicklungen.

Vor diesem Hintergrund lassen sich Sprachmodelle meiner Meinung nach als eine weitere Verdichtungsstufe verstehen. Sie sind auf enorme Textmengen trainiert und besonders gut darin, dominante Narrative zu erkennen und zusammenzufassen. Und sie haben in Echtzeit Zugriff auf Meinungsäußerungen und Bewertungen aus Medien, sozialen Netzwerken, Foren oder Review-Plattformen. Werden sie systematisch befragt, können sie damit widerspiegeln, wie öffentliche Diskurse und Mainstream-Wahrnehmungen zu einem Unternehmen verlaufen.

Reputationsmonitoring mit Sprachmodellen: ein pragmatischer Ansatz

Wie kann man nun konkret vorgehen, wenn man Sprachmodelle für ein Reputationsmonitoring nutzen möchte? Aus meiner Sicht braucht es dafür kein komplexes Framework, sondern vor allem methodische Disziplin.

Eine zentrale Voraussetzung für belastbare Vergleiche ist die konsequente Nutzung identischer Prompts. Mir ist bewusst, dass sich Sprachmodelle kontinuierlich weiterentwickeln und neue Versionen andere Ergebnisse liefern können. Dieses Spannungsfeld zwischen Modellfortschritt und Vergleichbarkeit lässt sich nicht vollständig auflösen. Ohne über die Zeit hinweg gleiche Prompts ist jedoch keine systematische Beobachtung von Veränderungen möglich.

Am Anfang steht die Frage, was überhaupt gemessen werden soll. Kommunikationsverantwortliche müssen dazu wenige, aber relevante Reputationsdimensionen definieren – etwa Qualität, Innovationskraft oder Vertrauenswürdigkeit.

Im nächsten Schritt geht es um die Entwicklung standardisierter Prompts. Sie müssen klar formuliert sein und über die Zeit hinweg unverändert bleiben. Nur so lassen sich Antworten vergleichen und Trends erkennen. Hier gilt: lieber weniger, dafür konsistent.

Um Zufallseffekte einzelner Antworten zu reduzieren, stelle ich dieselben Fragen mehrfach – zu unterschiedlichen Zeitpunkten und idealerweise in mehreren Sprachmodellen. Aus den Ergebnissen lassen sich Mittelwerte bilden, Abweichungen analysieren und Entwicklungen sichtbar machen. Daraus entsteht kein „offizieller“ Reputationsscore, wohl aber ein belastbarer interner Index.

Besonders aufschlussreich wird das Vorgehen im Wettbewerbsvergleich. Alle relevanten Unternehmen werden mit identischen Prompts abgefragt, sodass sich relative Positionierungen, dominante Narrative und wiederkehrende Argumentationsmuster vergleichen lassen. Reputation wird dabei bewusst als relative Größe verstanden, nicht als absoluter Wert.

Das Ergebnis ist kein Ersatz für klassische Reputationsstudien. Aber es ist ein pragmatisches Instrument, das intern vergleichbar, über Zeit beobachtbar und strategisch nutzbar ist – gerade in einer Kommunikationswelt, in der KI-Antworten zunehmend die Wahrnehmung prägen.

Über die Autorin: Dr. Lydia Prexl ist Strategin für Kommunikation mit über fünfzehn Jahren Erfahrung. Seit 2021 verantwortet die promovierte Anglistin die interne und externe Kommunikation beim europäischen Zahlungsdienstleister Unzer. Zuvor baute sie die Kommunikationsfunktion des Fintech-Versicherers Getsafe auf. Außerdem ist sie Autorin und Herausgeberin mehrerer Bücher und Leitfäden zu Kommunikation und Schreiben, darunter Wie kommunizieren Startups?

1 Damit unterscheidet sich Reputation von dem Begriff der Brand, also dem bewusst gestalteten Selbstbild des Unternehmens. Während die Brand ein kommunikatives Versprechen ist, das aktiv vermittelt wird, entsteht Reputation nicht durch Botschaften, sondern durch Verhalten. Sie wird nicht erzählt, sondern verdient. Gute Reputation ergibt sich aus gelebten Werten, konsistenten Entscheidungen, Integrität und der tatsächlichen Erfahrung, die Menschen mit einem Unternehmen machen – intern wie extern.

Seitennavigation