Es ist erstaunlich, wie die Diskussion über das Vertrauen in KI verläuft. Diese Diskussion ist wichtig und hat viele Dimensionen.
Immer wieder lese ich Beiträge, bei denen der Wertbeitrag von KI im Zusammenhang mit Automatisierung kritisch diskutiert wird. Viele Nutzer schwärmen von den Resultaten, die ChatGPT liefert. Die Mehrheit beschreibt das Erlebnis mit Worten wie: „ChatGPT liefert einen ersten guten Vorschlag, auf dessen Basis ich wunderbar weiterarbeiten kann“. Fast alle nutzen die KI für Vorschläge, aber selten für finale Texte und fast nie ohne menschliche Freigabe. Dies liegt auch daran, dass ChatGPT-Texte oft Fehler und Schwächen haben, wie bereits viele Beiträge gezeigt haben.
Der Einsatz von ChatGPT oder anderen großen Sprachmodellen (LLM) in vollständig automatisierten Prozessen ist selten. Wenn Anwendungen dies tun, sind die Texte oft „vorsichtig“ und schablonenhaft, eher an Templates als an kreative Texte erinnernd. Die Skepsis gegenüber der Fähigkeit der KI, fehlerfreie Texte zu erstellen, bleibt groß.
In der Interaktion mit Computern ist unser Anspruch hoch. Wenn eine KI etwas erstellt, was wir per Prompt angewiesen haben, sind wir oft enttäuscht über Fehler. Während wir eigene Schreibfehler leicht entschuldigen, erwarten wir von einem „statistischen Modell“, das auf Millionen Datensätzen basiert, fehlerfreie Resultate.
Ein Beispiel für einen solchen Fehler ist die Verwendung des „ß“ in der deutschen Sprache. Ein Deutschschweizer muss der KI explizit sagen, dass sie statt „ß“ bitte „ss“ verwenden soll, wenn der Text für die Schweiz gedacht ist. Was für manche richtig ist, ist für andere falsch.
In der Kaltansprache von Leads verwendet man traditionell Templates, um die Kommunikation mit Nutzern, Kunden und Kandidaten zu automatisieren. Die Qualitätssicherung erfolgt durch das Template selbst, aber das Resultat ist unpersönlich und nimmt keinen Bezug auf den Empfänger. Solche Texte sind selten gut und die Adressaten meist eher genervt als erfreut.
Nutzer, die KI in automatisierten Prozessen einsetzen, wollen verständlicherweise die Qualität der KI-Ergebnisse überprüfen. Dies führt oft dazu, dass jede KI-generierte Nachricht kontrolliert und gegebenenfalls umgeschrieben wird. Diese intensive Qualitätssicherung frisst jedoch die Zeitersparnis durch Automatisierung wieder auf. Wie kann man also die Qualität sichern, ohne die Vorteile der Automatisierung zu verlieren?
Im echten Leben gibt es Dinge, die immer funktionieren müssen, wie das ABS-System und die Airbags in einem Fahrzeug, die rigoros getestet werden. Ein von KI erstellter Text ist jedoch selten lebensentscheidend. Bei vielen Texten fallen Fehler eher in die Kategorie „unprofessionell“. Besonders Perfektionisten haben oft Schwierigkeiten, sich auf KI zu verlassen.
Ist es nicht sinnvoller, Arbeitszeit mit echter Mensch-zu-Mensch-Interaktion zu verbringen, wo sie wirklich wichtig ist, statt manuell standardisierte Nachrichten zu versenden? Wie viel Zeit ist man bereit, in die Überprüfung von KI-generierten Texten zu investieren? Soll jede einzelne Nachricht kontrolliert oder nur stichprobenartig geprüft werden?
Analog zur Qualitätskontrolle in der Produktion kann man stichprobenhaft Ergebnisse kontrollieren und die Produktionsparameter nachbessern. Für KI-generierte Texte bedeutet das: Man kontrolliert einige Texte, schärft die Prompts bei Bedarf nach und wiederholt den Vorgang später. Bei Psychological AI machen unsere Kunden gute Erfahrungen mit dieser Vorgehensweise. Durch stetiges Feedback und Anpassungen wird die KI immer besser.
Den generischen Schwächen der ChatGPT-Texte begegnen wir bei Psychological AI, indem wir jeden vom LLM generierten Text in einem iterativen Verfahren weiter optimieren. Für jeden Empfänger erstellen wir eine optimale Version und analysieren die Wirkung dieser Texte. Statistische Analysen zeigen, dass diese optimierten Texte einen Unterschied machen.
Wir stehen am Anfang einer aufregenden Reise. Durch kontinuierliche Verbesserungen und eine kluge Herangehensweise können wir das Vertrauen in KI stärken und Prozesse wie „Active Sourcing“ und „Lead Generation“ maßgeblich beeinflussen. Jeden Empfänger in seiner Sprachwelt anzusprechen, ist ein aufregendes Ziel.