Projekt

The impact of adversarial collaboration with a large language model on belief updating

In diesem Projekt wird untersucht, wie sich die Zusammenarbeit mit einem widersprechenden Large Language Model (LLM) auf die Veränderung individueller Überzeugungen auswirkt. Hintergrund ist die Frage, wie digitale Räume, entgegen ihrer Tendenz zu Polarisierung und Echokammern, zu Orten konstruktiver Auseinandersetzung werden können. Aufbauend auf der Forschung zu Intergruppenprozessen wird geprüft, ob sogenannte adversarial collaboration, die gemeinsame Texterstellung mit einem widersprechenden LLM, zu einer Änderung von Einstellungen und Überzeugungen führt. Diese Forschungsfrage wird in zwei experimentellen Studien untersucht. Im ersten Experiment wird ein LLM so trainiert, dass es entweder eine gegensätzliche Position vertritt oder gemeinsam mit den Teilnehmern einen Kompromisstext erstellt. Im zweiten Experiment wird untersucht, inwiefern congenial collaboration, also das Bestätigen der Überzeugungen des Gegenübers, sich auf dessen Einstellungen auswirkt. In allen Experimenten werden die Änderungen von Überzeugungen, digitale Mitverantwortung („digital ownership“) und Akzeptanz gegensätzlicher Argumente erhoben. Zusätzlich wird exploriert, wie intensiv Teilnehmende freiwillig mit dem LLM interagieren und wie viele Argumente sie einbringen. Ist adversarial collaboration mit LLMs erfolgreich in der Änderung von Überzeugungen, bietet diese Methode diverse Vorteile. Anders als Diskussionsrunden und Bürgerdialoge, ist sie individuell, konfliktarm und skalierbar. Damit eröffnet sie neue Perspektiven für die Gestaltung konstruktiver Diskurse im digitalen Raum, insbesondere im Praxisfeld Internetnutzung, aber auch für Schule, Hochschule und andere Bildungsbereiche. Das Projekt leistet somit einen Beitrag zur Frage, wie KI-Technologien zur Förderung demokratischer Diskurse eingesetzt werden können.

Teil der Arbeitsgruppe

Laufzeit

06/2025 - 05/2026