Wird ChatGPT wegen Bücherlesens angeklagt?
2023-05-03
Künstliche Intelligenzen sind trotz ihrer Milliarden von Schaltkreisen nicht intelligent auf die Welt gekommen. Wie Menschen müssen sie erst lernen, wie gute Musikstücke, Bilder oder Texte aussehen. Und was sie dabei so lernen, hat natürlich Auswirkungen auf ihr späteres künstliches, künstlerisches Wirken.
Dementsprechend trauen sich die Anbieter bislang gar nicht, der Öffentlichkeit Zugriff auf musikalische KIs zu geben, die Bilder erzeugenden KIs sind inzwischen alle bereits juristisch attackiert worden, und nun ist auch die Text-KI ChatGPT unter Beschuss geraten:
Die Wissenschaftler Kent Chang, Mackenzie Cramer, Sandeep Soni und David Bamman der Universität von Kalifornien in Berkeley haben sich mit den unbekannten Tiefen von OpenAIs ChatGPT und dem neuen, großen Sprachmodell GPT-4 beschäftigt und herausgefunden, dass es mit Text aus urheberrechtlich geschützten Büchern trainiert wurde. Sie haben dies in einer Arbeit mit dem Titel "Speak, Memory: An Archaeology of Books Known to ChatGPT/GPT-4" veröffentlicht. Dabei stellte sich heraus, dass OpenAI diese Bücher zwar nicht gezielt zum Trainieren von ChatGPT herangezogen hat, doch daraus zitierte Passagen im Internet stehen.
Deshalb sind bei Onlinern besonders beliebte und häufig zitierte Bücher prompt ins Wissensgedächtnis von ChatGPT übergegangen, hier eine Liste mit über 500 identifizierten Büchern. Darunter solche wie Lady Chatterleys Liebhaber und 50 Shades of Grey, die ChatGPT angesichts seiner puritanischen US-amerikanischen Einstellungen sicher nicht für eigene Werke verwenden wird, doch auch Klassiker wie Alice im Wunderland, Frankenstein, Dracula, Oliver Twist, deren Urheberrechte inzwischen abgelaufen sind. Aber auch neuere Werke, ob Da Vinci Code, Game of Thrones, The Hunger Games, die Harry Potter-Bücher – und auch viele Science-Fiction-Klassiker wie Dune, Träumen Androiden von elektrischen Schafen?, Schöne neue Welt, Fahrenheit 451, 1984 und Per Anhalter durch die Galaxis.
Aktuell ist das Ganze keine Urheberrechtsverletzung. Es könnte aber eine werden, wenn so Texte entstehen, die den ursprünglichen Büchern sehr nahe kommen. Und es erklärt, warum ChatGPT so gut darin ist, Science Fiction-Kurzgeschichten zu schreiben, die in ihrer absurden Kreativität schwer an den genialen Autor Douglas Adams erinnern. Sein Geist lebt nun im Computer fort.
DL2MCD