Ist es wahr, dass generativer KI-ChatGPT das Internet mit unendlichen Inhalten überschwemmen wird, fragt KI-Ethik und KI-Recht

Kennen Sie vielleicht das inspirierende Kinderbuch Ein Fisch auf dem Trockenen?

Das bezaubernde Buch wurde von Helen Palmer (bürgerlicher Name Helen Palmer Geisel) geschrieben und basiert auf einer Kurzgeschichte von Dr. Seuss (bürgerlicher Name Theodor Geisel). Das Ehepaar hat einen inzwischen legendären Beitrag zur Kinderliteratur geleistet, der die Jugend überall begeistert.

Falls Sie mit der Handlung nicht vertraut sind oder eine Auffrischung benötigen, lassen Sie mich kurz zusammenfassen. Ein Junge kauft einen Goldfisch in seiner Zoohandlung. Er wird streng angewiesen, das winzige Meerestier niemals zu überfüttern. Sie wissen nie, was passieren könnte, wenn Sie dies tun.

Der Junge überfüttert seinen Goldfisch versehentlich nur einmal, aber dies löst ein erstaunliches ungezügeltes Wachstum aus.

Die Dinge beginnen ziemlich schief zu gehen.

Der einst winzige Fisch wächst schnell aus seinem Goldfischglas heraus und wird so groß, dass der Junge das geliebte Haustier in eine Badewanne im Haus setzt. Der Fisch wächst und wächst. Das scheint nicht mehr aufzuhalten.

Bald darauf kommen Polizei und Feuerwehr dem Jungen zu Hilfe und transportieren den mittlerweile elefantengroßen Goldfisch zum örtlichen Freibad. Schließlich kommt der Zoohandlungsbesitzer und schafft es, den Goldfisch wieder auf seine normale Größe zu schrumpfen. Wir wissen nicht, wie diese magische Leistung erreicht wurde. Der Junge wird erneut ermahnt, eine Überfütterung zu vermeiden.

Lektion gelernt, auf die harte Tour.

Wir müssen möglicherweise dieselbe erschütternde Lektion beherzigen, wenn es um die Zukunft des Internets geht.

Wie das?

Die heutige Realität sieht so aus, dass wir möglicherweise eine Form der künstlichen Intelligenz (KI) entwickelt haben, die sich ausdehnen und das Internet mit einer riesigen und endlosen Flut von Daten füllen wird. Da gibt es viel Händeringen Generative KI, die heißeste KI in den Nachrichten dieser Tage, wird genau das tun.

Die generative KI ist in der Lage, Ausgaben wie Text zu generieren oder zu produzieren, und zwar nicht nur mit einer einfachen Eingabeaufforderung, die von einem menschlichen Benutzer eingegeben wird. Mit wenigen, gut gewählten Wörtern lässt sich ein vollständiger und umfangreicher Aufsatz generieren. Möglicherweise kennen Sie die generative KI aufgrund einer weit verbreiteten KI-App namens ChatGPT, die im November von OpenAI veröffentlicht wurde. Ich werde gleich mehr darüber sagen.

Einige haben inbrünstig davor gewarnt, dass generative KI verwendet werden kann, um eine scheinbar unendliche Menge an Inhalten zu erstellen.

Eine Person kann die generative KI problemlos nutzen, um viele tausend Aufsätze in nur einer einzigen Online-Sitzung zu erstellen, und zwar mit minimalem Arbeitsaufwand ihrerseits. Die Person könnte sich dann dafür entscheiden, die generierten Aufsätze im Internet zu veröffentlichen. Stellen Sie sich vor, dies würde in großem Maßstab geschehen. Machen Sie im Wesentlichen weiter und multiplizieren Sie dies mit den Millionen und Abermillionen von Internetnutzern. Ein wahrer Tsunami von generierten Inhalten kann leicht produziert und gepostet werden.

Spülen, wiederholen, und zwar ununterbrochen, Tag für Tag, Minute für Minute.

Ist dies eine nervöse Behauptung, dass der Himmel fällt, oder hat sie einen berechtigten Wert?

In der heutigen Kolumne werde ich auf diese geäußerten Sorgen eingehen, dass wir einer Zukunft eines Internets gegenüberstehen, das vollständig von generativen KI-Inhalten verstopft und überschwemmt wird. Wir werden uns die Gründe für diese Bedenken ansehen und einige potenzielle Vorteile betrachten, die normalerweise nicht erwähnt werden. Ich werde mich während dieser Diskussion gelegentlich auf ChatGPT beziehen, da es sich um den 600-Pfund-Gorilla der generativen KI handelt. Denken Sie jedoch daran, dass es viele andere generative KI-Apps gibt und sie im Allgemeinen auf denselben Grundprinzipien basieren.

In der Zwischenzeit fragen Sie sich vielleicht, was generative KI eigentlich ist.

Lassen Sie uns zuerst die Grundlagen der generativen KI behandeln und dann können wir uns die dringende Angelegenheit genau ansehen.

In all dies kommt eine ganze Reihe von Überlegungen zur KI-Ethik und zum KI-Recht.

Bitte beachten Sie, dass es laufende Bemühungen gibt, ethische KI-Prinzipien in die Entwicklung und den Einsatz von KI-Apps einfließen zu lassen. Eine wachsende Gruppe von besorgten und ehemaligen KI-Ethikern versucht sicherzustellen, dass Bemühungen um die Entwicklung und Einführung von KI eine Sichtweise des Tuns berücksichtigen KI für immer und abwenden KI für schlecht. Ebenso werden neue KI-Gesetze vorgeschlagen, die als mögliche Lösungen herumgereicht werden, um zu verhindern, dass KI-Bemühungen in Bezug auf Menschenrechte und dergleichen Amok laufen. Für meine laufende und umfassende Berichterstattung über KI-Ethik und KI-Recht siehe den Link hier und den Link hier, nur um ein paar zu nennen.

Die Entwicklung und Verbreitung ethischer KI-Vorschriften wird verfolgt, um hoffentlich zu verhindern, dass die Gesellschaft in eine Vielzahl von KI-verursachenden Fallen tappt. Für meine Berichterstattung über die UN-KI-Ethikprinzipien, wie sie von fast 200 Ländern durch die Bemühungen der UNESCO entwickelt und unterstützt werden, siehe den Link hier. In ähnlicher Weise werden neue KI-Gesetze untersucht, um zu versuchen, die KI auf Augenhöhe zu halten. Einer der neuesten Takes besteht aus einer Reihe von Vorschlägen AI-Bill of Rights die das US-Weiße Haus kürzlich veröffentlicht hat, um die Menschenrechte im Zeitalter der KI zu identifizieren, siehe den Link hier. Es braucht ein ganzes Dorf, um KI und KI-Entwickler auf einem rechtmäßigen Weg zu halten und die absichtlichen oder versehentlichen hinterhältigen Bemühungen abzuschrecken, die die Gesellschaft untergraben könnten.

Ich werde Überlegungen zu KI-Ethik und KI-Recht in diese Diskussion einfließen lassen.

Grundlagen der generativen KI

Die bekannteste Instanz der generativen KI wird durch eine KI-App namens ChatGPT repräsentiert. ChatGPT trat bereits im November in das öffentliche Bewusstsein, als es von der KI-Forschungsfirma OpenAI veröffentlicht wurde. Seitdem hat ChatGPT übergroße Schlagzeilen gemacht und die zugeteilten fünfzehn Minuten Ruhm erstaunlich überschritten.

Ich vermute, Sie haben wahrscheinlich schon von ChatGPT gehört oder kennen vielleicht sogar jemanden, der es verwendet hat.

ChatGPT wird als generative KI-Anwendung angesehen, da es Text von einem Benutzer als Eingabe nimmt und dann erzeugt oder produziert eine Ausgabe, die aus einem Aufsatz besteht. Die KI ist ein Text-zu-Text-Generator, obwohl ich die KI als einen Text-zu-Essay-Generator beschreibe, da dies besser verdeutlicht, wofür sie üblicherweise verwendet wird. Sie können generative KI verwenden, um lange Kompositionen zu komponieren, oder Sie können sie dazu bringen, eher kurze, prägnante Kommentare abzugeben. Es ist alles auf Ihr Gebot.

Alles, was Sie tun müssen, ist eine Eingabeaufforderung einzugeben, und die KI-App generiert für Sie einen Aufsatz, der versucht, auf Ihre Eingabeaufforderung zu antworten. Der verfasste Text wird so aussehen, als ob der Aufsatz von menschlicher Hand und Verstand geschrieben wurde. Wenn Sie eine Eingabeaufforderung mit der Aufschrift „Erzählen Sie mir von Abraham Lincoln“ eingeben, liefert Ihnen die generative KI einen Aufsatz über Lincoln. Es gibt andere Modi der generativen KI, wie Text-to-Art und Text-to-Video. Ich werde mich hier auf die Text-zu-Text-Variation konzentrieren.

Ihr erster Gedanke könnte sein, dass diese generative Fähigkeit keine so große Sache zu sein scheint, wenn es um die Erstellung von Aufsätzen geht. Sie können ganz einfach eine Online-Suche im Internet durchführen und Tonnen und Tonnen von Essays über Präsident Lincoln finden. Der Clou im Fall der generativen KI ist, dass der generierte Aufsatz relativ einzigartig ist und eher eine Originalkomposition als eine Nachahmung darstellt. Wenn Sie versuchen würden, den von der KI erstellten Aufsatz irgendwo online zu finden, würden Sie ihn wahrscheinlich nicht entdecken.

Die generative KI ist vortrainiert und nutzt eine komplexe mathematische und rechnerische Formulierung, die durch die Untersuchung von Mustern in geschriebenen Wörtern und Geschichten im Internet erstellt wurde. Als Ergebnis der Untersuchung von Tausenden und Millionen geschriebener Passagen kann die KI neue Aufsätze und Geschichten ausspucken, die ein Mischmasch aus dem sind, was gefunden wurde. Durch das Hinzufügen verschiedener probabilistischer Funktionen ist der resultierende Text im Vergleich zu dem, was im Trainingssatz verwendet wurde, ziemlich einzigartig.

Es gibt zahlreiche Bedenken hinsichtlich der generativen KI.

Ein entscheidender Nachteil ist, dass die von einer generativen KI-App erstellten Aufsätze verschiedene Unwahrheiten enthalten können, darunter offensichtlich unwahre Fakten, irreführend dargestellte Fakten und scheinbare Fakten, die vollständig erfunden sind. Diese fabrizierten Aspekte werden oft als eine Form von bezeichnet KI-Halluzinationen, ein Schlagwort, das ich nicht mag, aber bedauerlicherweise trotzdem populär zu werden scheint (für meine detaillierte Erklärung, warum dies eine lausige und ungeeignete Terminologie ist, siehe meine Berichterstattung unter den Link hier).

Ein weiteres Problem ist, dass Menschen einen von generativer KI erstellten Aufsatz leicht anerkennen können, obwohl sie den Aufsatz nicht selbst verfasst haben. Sie haben vielleicht gehört, dass Lehrer und Schulen ziemlich besorgt über das Aufkommen generativer KI-Apps sind. Schüler können möglicherweise generative KI verwenden, um ihre zugewiesenen Aufsätze zu schreiben. Wenn ein Schüler behauptet, dass ein Aufsatz von seiner eigenen Hand geschrieben wurde, besteht für den Lehrer kaum eine Chance zu erkennen, ob er stattdessen von generativer KI gefälscht wurde. Für meine Analyse dieser verwirrenden Facette von Schülern und Lehrern siehe meine Berichterstattung unter den Link hier und den Link hier.

Es gab einige verrückte übergroße Behauptungen in den sozialen Medien darüber Generative KI behaupten, dass diese neueste Version der KI tatsächlich ist empfindungsfähige KI (Nein, sie sind falsch!). Diejenigen in den Bereichen KI-Ethik und KI-Recht sind besonders besorgt über diesen aufkeimenden Trend zu überzogenen Ansprüchen. Sie könnten höflich sagen, dass einige Leute übertreiben, was die heutige KI tatsächlich leisten kann. Sie gehen davon aus, dass KI Fähigkeiten hat, die wir noch nicht erreichen konnten. Das ist bedauerlich. Schlimmer noch, sie können zulassen, dass sie selbst und andere in schlimme Situationen geraten, weil sie davon ausgehen, dass die KI empfindungsfähig oder menschenähnlich sein wird, wenn es darum geht, Maßnahmen zu ergreifen.

KI nicht vermenschlichen.

Wenn Sie dies tun, geraten Sie in eine klebrige und mürrische Vertrauensfalle, in der Sie erwarten, dass die KI Dinge tut, die sie nicht ausführen kann. Abgesehen davon ist die neueste generative KI relativ beeindruckend für das, was sie kann. Beachten Sie jedoch, dass es erhebliche Einschränkungen gibt, die Sie bei der Verwendung einer generativen KI-App immer im Hinterkopf behalten sollten.

Eine letzte Vorwarnung vorerst.

Was auch immer Sie in einer generativen KI-Antwort sehen oder lesen scheint rein sachlich vermittelt werden sollen (Daten, Orte, Personen usw.), bleiben Sie skeptisch und bereit, das, was Sie sehen, noch einmal zu überprüfen.

Ja, Daten können zusammengebraut werden, Orte können nachgeholt werden, und Elemente, von denen wir normalerweise erwarten, dass sie über jeden Zweifel erhaben sind, sind es alle Verdacht ausgesetzt. Glauben Sie nicht, was Sie lesen, und behalten Sie ein skeptisches Auge, wenn Sie Aufsätze oder Ergebnisse generativer KI untersuchen. Wenn Ihnen eine generative KI-App sagt, dass Abraham Lincoln in seinem Privatjet durch das Land geflogen ist, würden Sie zweifellos wissen, dass dies Malarky ist. Unglücklicherweise erkennen einige Leute vielleicht nicht, dass es zu seiner Zeit keine Jets gab, oder sie wissen es vielleicht, bemerken aber nicht, dass der Essay diese dreiste und unverschämt falsche Behauptung aufstellt.

Eine starke Dosis gesunder Skepsis und eine beständige Denkweise des Unglaubens werden Ihr größtes Kapital sein, wenn Sie generative KI verwenden.

Wir sind bereit, in die nächste Phase dieser Erläuterung einzutreten.

Betrachten, was generative KI mit dem Internet machen könnte

Jetzt, da Sie einen Anschein davon haben, was generative KI ist, können wir der ärgerlichen Frage nachgehen, ob diese Art von KI durch ein Aufblähen des Internets Chaos und Chaos verursachen wird.

Hier sind meine acht wichtigsten Themen zu diesem Thema:

  • 1) Größe des Internets
  • 2) Indizierung des Internets
  • 3) Abschätzen, was von generativer KI produzierter Inhalt ist
  • 4) Was ist überhaupt falsch an generativen KI-Inhalten?
  • 5) Werden Menschen generative KI-Inhalte im Internet veröffentlichen?
  • 6) Vielleicht werden Paywall-Ansätze verehrt
  • 7) Die multimodale generative KI von Morass erwartet Sie
  • 8) Teufels- oder Tugendkreisläufe der generativen KI

Ich werde jedes dieser wichtigen Themen behandeln und wichtige Überlegungen anstellen, über die wir alle sorgfältig nachdenken sollten. Jedes dieser Themen ist ein integraler Bestandteil eines größeren Puzzles. Sie können nicht nur ein Stück betrachten. Sie können auch kein Stück isoliert von den anderen Stücken betrachten.

Dies ist ein kompliziertes Mosaik, und das gesamte Puzzle muss einer angemessenen harmonischen Betrachtung unterzogen werden.

Größe des Internets

Einer der ersten zu berücksichtigenden Aspekte betrifft die Größe des Internets.

Dies ist besonders wichtig. Über die generative KI wird behauptet, dass sie das Internet offenbar enorm aufblähen wird. Wir werden alle Arten von zusätzlichen Inhalten haben, da sich generative KI einfach einsetzen lässt, um riesige Mengen an digitalen Materialien zu produzieren. Wenn dem so ist, stellt sich die logisch sinnvolle Frage, wie groß das Internet heute ist und wie viel generative KI zusätzliche Inhalte hervorbringen könnte, die es sonst nicht im Internet gegeben hätte.

Der Versuch, die Größe des Internets in den Griff zu bekommen, ist leider recht schwierig und immens ungenau.

Eine Schätzung, die auf gepostet wurde Finanzen online schlägt vor, dass das Internet derzeit mindestens 74 Zettabyte (ZB) groß ist und bis zum Jahr 463 möglicherweise 2025 ZB erreichen wird (beachten Sie, dass das prognostizierte Wachstum die generative KI als Faktor per se nicht explizit zu berücksichtigen scheint und lediglich alle annimmt sonst ist beim Ableiten dieser Projektion gleich).

Es gibt viele andere Schätzungen der bestehenden Größe des Internets. Ebenso gibt es viele andere Schätzungen des erwarteten Größenwachstums. Ich möchte mich nicht in Diskussionen über solche Zahlen verzetteln und möchte nur betonen, dass das Internet zweifellos eine gigantische Größe hat. Darüber hinaus ist es erwähnenswert, dass alle vernünftigen Erwartungen darin bestehen, dass das Internet im normalen Lauf der Dinge seinen rasanten Wachstumspfad unverfroren fortsetzen wird.

Es könnte Sie auch interessieren, dass Statista verschiedene Statistiken veröffentlicht hat, die darauf hindeuten, dass es derzeit rund 5.16 Milliarden Internetnutzer gibt. Dies entspricht kalkulierten 64.4 % der Weltbevölkerung. Bist du überrascht? Einerseits könnten wir natürlich davon ausgehen, dass die meisten Menschen tatsächlich im Internet sind. Aus der Sicht eines Insiders ist dies jedoch etwas verzerrt, da viele Menschen keinen direkten Zugang zum Internet haben oder sich anderweitig keinen Zugang verschaffen können. Auf jeden Fall ist zu erwarten, dass der Internetzugang letztlich günstiger und noch weiter verbreitet wird, die Zahl der Internetnutzer also zweifelsohne steigen wird.

Ich schleppe Sie durch diese Statistiken, um uns zu einer sehr entscheidenden Frage zu bringen.

Wie viel wird die generative KI zum bestehenden und anhaltenden Wachstum des Internets beitragen?

Das wollen wir wissen. Sie sehen, die Behauptung über die Auswirkungen der generativen KI scheint für bare Münze zu nehmen, dass die generative KI natürlich das Internet überschwemmen wird. All das ist ein bisschen Handwinken, wenn Sie es bequem oder aus Gedankenverloren vermeiden, tatsächliche Zahlen und wahre Zählungen von Dingen zu diskutieren.

Nehmen Sie zum Beispiel die allgemeine Annahme, dass das Internet etwa 100 ZB groß ist und wächst. Wenn Sie glauben, dass die generative KI vielleicht 1 ZB pro Jahr hinzufügen wird, ist dies ein Tropfen auf den heißen Stein der Gesamtgröße des Internets.

Generative KI wäre vergleichbar damit, einen Kieselstein in einen riesigen Ozean zu spritzen.

Das scheint nicht in das vorherrschende Narrativ zu diesem gewichtigen Thema zu passen. Einige haben leidenschaftlich spekuliert, dass am Ende 10 % des Internets auf einer „normalen“ benutzergenerierten Basis sein könnten und die restlichen 90 % auf generative KI-produzierte Inhalte zurückzuführen sein werden.

Für diese Behauptung scheint es keine solide Grundlage zu geben, sie ist scheinbar aus dem Nichts erfunden. Gehe trotzdem davon aus, dass dies passiert ist. Wenn wir die vorhandenen 100 ZB als Basis nehmen und davon ausgehen, dass es sich im Wesentlichen um benutzergenerierte Inhalte handelt (nun, das ist umstritten), bedeutet dies, dass wir uns mit einem Internet in der Größe von 1,000 ZB befassen müssten. Das sind 900 ZB generative KI-produzierte Inhalte und 100 ZB nutzergenerierte Inhalte.

Wir hätten das heutige Meer vermeintlich von Hand erstellter Inhalte im Vergleich zur Gesamtheit der generativen KI-produzierten Internet-Meere etwas in den Schatten gestellt.

Spekulation über Vermutung.

Also, was soll es sein?

Wird die generative KI einen Kieselstein produzieren oder wird sie die Größe des Internets um ein Vielfaches vergrößern?

Niemand kann so oder so mit Sicherheit sagen. Wir sollten diese Schlüsselzahlen ernsthaft untersuchen, damit Diskussionen zu diesem Thema auf etwas Greifbarem verwurzelt sind. Wenn Sie dies nicht tun, wird das Geschwätz etwas leer und fast wie der Junge, der Wolf schrie.

Betrachten wir den nächsten Faktor und denken Sie daran, dass alle diese Faktoren miteinander zusammenhängen und als Kollektiv und nicht nur auf individueller Basis betrachtet werden müssen.

Indizierung des Internets

Sie stellen wahrscheinlich fest, dass Sie bei einer Internetsuche die Suchmaschine einer anderen Person verwenden, die routinemäßig versucht, die Inhalte des Internets zu indizieren. Ich wette, dass Sie vielleicht den Eindruck haben, dass Sie Zugang zum Übergewicht des Internets erhalten, wenn Sie eine beliebte Suchmaschine verwenden.

Das ist höchst unwahrscheinlich.

Einige Schätzungen gehen davon aus, dass nur ein Bruchteil des Internets indiziert wurde, vielleicht weniger als 1 % oder so (manche sagen, es sind bis zu 5 % oder vielleicht etwas mehr; es ist nicht auf dem Niveau, das die meisten Leute allgemein annehmen, wie zum Beispiel 50 % oder 90 %). Auch diese Zahlen variieren, sind aber dennoch relativ klein. Das Wesentliche ist, dass Sie sich fast immer eines großen Teils des Internets nicht bewusst sind.

Warum ist das in diesem Zusammenhang von Bedeutung?

Denn die zusätzlichen Inhalte, die die generative KI voraussichtlich produzieren wird, werden möglicherweise einer ähnlichen Indizierungsüberlegung unterzogen. Es könnte sein, dass fast keine der hinzugefügten Inhalte indiziert werden. In diesem Fall werden Sie es wahrscheinlich nie sehen.

Die andere Seite der Medaille geht davon aus, dass solche „künstlichen“ Inhalte indiziert werden, was dem bedauerlichen Mangel an Aufmerksamkeit für „konventionelle“ Inhalte entspricht. Ein Argument lautet, dass sich die Indizes mit dem Inhalt der generativen KI beschäftigen und den konventionellen Inhalt vernachlässigen werden. Selbst wenn also die generativen KI-Inhalte das Internet nicht überwältigen, scheint es, als ob dies an der unverhältnismäßigen Indexierung solcher Inhalte liegt.

Am Ende könnte es sein, dass die Suche nach konventionellen Inhalten der Suche nach der Nadel im Heuhaufen gleicht. Das enorme Durcheinander der generativen KI-produzierten Inhalte wird überwältigenden, übergroßen und ausgestreckten Heuballen ähneln. Irgendwo darin werden diese kostbaren kleinen Edelsteine ​​​​konventionellen Inhalts sein, wenn Sie sie finden können.

Sie könnten sofort denken, dass die Indexmacher herausfinden sollten, wie sie mit diesem Dilemma umgehen können. Wenn sie die Indexierung „richtig“ durchführen können, spielt es praktisch keine Rolle, wie viele generative KI-Inhalte produziert werden. Es wird in den Seitenstraßen und Gassen des Internets sitzen und sowieso nicht besonders das Licht der Welt erblicken.

Lassen Sie uns unsere Untersuchung fortsetzen, um zu sehen, wie dieses Indizierungsproblem weiter entsteht.

Abschätzen, was von generativer KI produzierter Inhalt ist

Okay, wenn die generative KI wild wird und Tonnen und Tonnen von Internetinhalten produziert, können wir logischerweise damit fertig werden, solange wir solche Inhalte von „konventionellen“ Inhalten unterscheiden können.

Scheint easy-peasy als Lösung.

Jede Suchmaschine, die indexiert, würde lediglich erkennen, ob der Inhalt von generativer KI oder von herkömmlich produzierten Inhalten stammt. Der Index könnte sich dann entweder dafür entscheiden, die generativen KI-Materialien nicht aufzunehmen, oder im Index markieren, dass der Inhalt von generativer KI stammt. Nutzer einer solchen Suchmaschine könnten dann bei einer Suche angeben, ob sie die Inhalte der generativen KI umfassen oder überspringen möchten.

Fall abgeschlossen.

Es tut mir leid zu sagen, dass dies nicht besonders praktikabel ist.

Hier ist der Grund.

Der Versuch, generative KI-Ausgaben von konventionellen Inhalten zu unterscheiden, ist nicht einfach und wird fast letztendlich unpraktisch sein. Ich habe in meiner Kolumne darüber berichtet, dass diese angeblichen Erkennungs-Apps ein falsches Versprechen und im Wesentlichen eine irreführende Scharade sind, sehen Sie den Link hier.

Kurz gesagt, die KI-Hersteller von generativer KI verbessern ihre KI ständig, um Inhalte zu produzieren, die von Natur aus nicht von herkömmlichen, von Menschen generierten Inhalten zu unterscheiden sind. Das ist ein absichtliches Ziel. Die Erkennungs-Apps sehen sich einem ständigen Katz-und-Maus-Spiel ausgesetzt. Darüber hinaus basieren diese Erkennungs-Apps auf allen möglichen Annahmen darüber, was generative KI-Ausgaben auszeichnet, obwohl diese Annahmen oft falsch sind oder nur auf Wahrscheinlichkeiten basieren. Das Endergebnis ist, dass jede Erkennungs-App nur die Wahrscheinlichkeit schätzt und nicht in der Lage ist, eine sichere Aussage zu treffen.

Unterm Strich ist es unwahrscheinlich, dass wir feststellen können, was generative KI-Inhalte sind, es sei denn, es gibt einen eindeutigen Hinweis des Anbieters generativer KI, obwohl auch das nicht fehlerfrei ist. Siehe auch hier meine Berichterstattung zu diesem komplexen Thema, diskutiert unter den Link hier. Die verfolgte Idee ist, dass ein Wasserzeichen heimlich in den generierten Inhalt eingebunden wird. Sie könnten theoretisch das Wasserzeichen verwenden, um herauszufinden, ob der Inhalt über generative KI stammt. Der Nachteil ist, dass es bei verschiedenen Änderungen an der Ausgabe relativ einfach ist, das Wasserzeichen durcheinander zu bringen. Der Inhalt wird sich dann nicht an das Wasserzeichen halten und der Wegweiser, der uns einen Tipp geben sollte, ist jetzt besiegt.

Einige glauben, dass wir neue KI-Gesetze brauchen, um damit umzugehen. Erlassen Sie Gesetze, die verlangen, dass generative KI-Apps Wasserzeichen enthalten. Machen Sie es außerdem ungesetzlich, zu versuchen, diese Wasserzeichen zu umgehen. Dies könnte das einzige Mittel sein, um diese Katz-und-Maus-Spiele für Technikfreaks einzuschränken. Ich habe diese Vorschläge in meiner Kolumne untersucht und darauf hingewiesen, dass, obwohl die Grundsätze vernünftig klingen, der Teufel in den Details der Umsetzung dieser Systeme und der Durchsetzung dieser Richtlinien steckt.

Alles in allem, zurück zu den Bedenken über das Aufblähen des Internets durch generative KI-Inhalte, werden wir leider nicht in der Lage sein, das Problem zu beseitigen, indem wir einfach feststellen, was generative KI-Inhalte sind und was nicht. Das Problem ist schwieriger als das.

Was ist überhaupt falsch an generativen KI-Inhalten?

All diese Besorgnis über den Tsunami generativer KI-produzierter Inhalte basiert normalerweise auf einer ziemlich wesentlichen Annahme, nämlich dass die Inhalte fehlerhaft sein werden.

Wenn der Inhalt gut ist, sollten wir uns vermutlich über die hinzugefügten Postings im Internet freuen. Sicher, das Volumen mag hoch sein, aber wenn sich die geposteten Informationen lohnen, dann ist es einfach eine Frage, mehr gute Sachen zum Durchsuchen zu haben. Je mehr desto besser, wie sie sagen.

Die Hauptüberlegung besteht darin, ob die von der generativen KI erzeugten Inhalte informativ oder vielleicht voller Fehler, Unwahrheiten, Fehlinformationen, Desinformationen und dergleichen sind oder nicht. Dabei kommen mehrere Facetten zum Vorschein.

Erstens könnte es sein, dass die generative KI so weiterentwickelt wird, dass die Wahrscheinlichkeit, dass es sich um fehlerhafte Aufsätze handelt, äußerst gering ist. Wir würden scheinbar nachlässig sein, wenn wir irgendwie alle generative KI von der Veröffentlichung im Internet verbieten wollten, vorausgesetzt, dass die von generativer KI ausgegebenen Essays im Großen und Ganzen die meisten oder die überwiegende Zeit einigermaßen korrekt sind. Alle ausgegebenen Aufsätze ablehnen zu wollen, käme dem klassischen Ausschütten des Babys mit dem Bade gleich (ein altes Sprichwort, wohl kurz vor der Rente).

Zweitens, wie ich in meiner Kolumne unter besprochen habe den Link hier, gibt es ein steigendes Interesse an KI-Add-on-Apps, die generative KI-ausgegebene Aufsätze doppelt überprüfen können. Die KI-Doppelprüfer könnten verwendet werden, bevor Menschen generative KI-Inhalte ins Internet stellen. Selbst wenn Personen die Inhalte, die sie veröffentlichen möchten, nicht vorab prüfen, können dieselben Tools für bereits veröffentlichte Inhalte verwendet werden. Kurz gesagt, eine doppelte Überprüfung kann unabhängig von der Inhaltsquelle durchgeführt werden, sodass wir natürlich auch gegenüber von Menschen generierten Inhalten misstrauisch bleiben sollten.

Drittens scheint, wie in meinem zuvor erwähnten Punkt angedeutet, oft der Glaube zu sein, dass von Menschen generierte Inhalte immer gut sind, während generative KI-Inhalte immer schlecht sind. Eine verrückte falsche Annahme. Es gibt viele von Menschen generierte Inhalte, die alle möglichen Fehler, Unwahrheiten und erfundenen Müll enthalten. Wir sind nicht sicher, nur weil ein Mensch zufällig Inhalte von Hand erstellt hat.

Alle Inhalte, ob von Menschen oder generativer KI entwickelt, müssen einer genauen Prüfung unterzogen werden.

Werden die generativen KI-Inhalte im Internet veröffentlicht?

Ein weiterer zu berücksichtigender Faktor ist, ob Menschen tatsächlich generative KI-Inhalte ins Internet stellen werden, und wenn ja, in welchem ​​Umfang.

Hier ist was ich meine.

Menschen verwenden generative KI wie ChatGPT für eine Vielzahl von Zwecken. Sie könnten generative KI verwenden, um Ideen zu einem Problem anzuregen, mit dem sie konfrontiert sind. Sie könnten es verwenden, um zu recherchieren. Sie können es verwenden, um einen Entwurf von Material bereitzustellen, das sie bearbeiten möchten, und es dann per E-Mail an jemanden senden. Usw.

Der springende Punkt ist, dass ein Großteil der Nutzung von generativer KI möglicherweise überhaupt nichts damit zu tun hat, dass jemand darauf abzielt, die resultierenden ausgegebenen Essays ins Internet zu stellen. Wir scheinen oft in die Falle zu tappen, dass jemand, nur weil er generative KI verwendet, das Internet mit den produzierten Ergebnissen überfluten möchte.

Wir wissen noch nicht, wie viel Zeit Menschen generative KI für ihre eigenen Zwecke nutzen und sich daher dafür entscheiden werden nicht die Ausgaben ins Internet stellen.

Zur Klarstellung: Ich schlage nicht vor, dass die Leute keine generativen KI-Ausgaben ins Internet stellen. Das werden sie mit Sicherheit. Leute, die Online-Blogs betreiben, werden zweifellos die generative KI nutzen. Viele Anwendungen der generativen KI zur Erstellung von Inhalten für das Internet werden sicherlich stattfinden. Usw.

Eine Überlegung ist daher, dass möglicherweise nicht so viele generative KI-Inhalte im Internet veröffentlicht werden, wie ansonsten angenommen werden könnte. Für diejenigen Experten, die davon ausgehen, dass wir es mit einer ununterbrochenen, ungezügelten All-Hand-Posting-Daten-Apokalypse zu tun haben, wissen wir nicht, ob das passieren wird. Selbst wenn sich nur wenige Leute für solche Beiträge entscheiden, könnte dies natürlich immer noch eine enorme Menge an zusätzlichem Inhalt sein, der auf das Internet gehäuft wird.

Eine Wendung ist, ob die generativen KI-Ausgaben möglicherweise automatisch ins Internet gestellt werden.

Das ist ein einfacher Trick. Sie können es einfach so gestalten, dass jede Ausgabe Ihrer generativen KI-App sofort im Internet veröffentlicht wird. Sie können dies sogar in eine Schleife stecken. Haben Sie eine Reihe von Eingabeaufforderungen, die vorkonfiguriert sind. Geben Sie diese in eine generative KI-App ein. Die generative KI-App ist so programmiert, dass sie die ausgegebenen Aufsätze sofort ins Internet stellt.

Voila, Sie haben ein Perpetuum Mobile zur Generierung von Dateninhalten für das Internet.

Wohin aber werden die Postings gehen?

Alle Websites oder andere Online-Locations, die das Posten dieser Art von Maschinengewehr spuckenden Inhalten erlauben, werden möglicherweise für das, was sie zulassen, zur Rechenschaft gezogen. Vermutlich werden die Leute diese Seiten meiden. Oder diese Seiten werden von Suchmaschinen und Indizierungsalgorithmen vorgemerkt. Der Aspekt, dass generative KI-Inhalte gepostet werden, ist ein Aspekt, während ein ebenso entscheidender Aspekt darin besteht, wo die Postings landen.

Vielleicht werden Paywall-Ansätze verehrt

Eine häufig geäußerte Behauptung ist, dass wir des Wilden Westens des Internets irgendwann überdrüssig werden. Die Menschen werden sich zu vertrauenswürdigen Online-Quellen hingezogen fühlen. Sie vermeiden absichtlich andere unsichere oder unbekannte Bereiche des Internets.

In diese Richtung geht die Überlegung, dass Menschen bereit sein werden, für den Zugriff auf vertrauenswürdige Quellen zu zahlen. Während heute noch heftig über die Rentabilität von Paywall-Inhalten diskutiert wird, gilt die Flut generativer KI-Inhalte als Segen für die Paywall-Philosophie. Je schlechter es wird, vertrauenswürdige Inhalte im Internet zu finden, desto wertvoller werden die Paywall-Inhalte (vorausgesetzt natürlich, dass die Paywall-Inhalte sorgfältiger geprüft werden).

Die Ironie besteht teilweise darin, dass die Inhalte hinter der Paywall stark aus generativen KI-produzierten Inhalten bestehen könnten. Unter der Annahme, dass der Mehrwert darin besteht, dass der Paywall-Anbieter den Inhalt überprüft, führt er im Wesentlichen die zuvor erwähnte Doppelprüfung durch. Sie müssen den Inhalt nicht unbedingt generieren. Sie müssen nur sicherstellen, dass der Inhalt vertrauenswürdig ist.

Über diese prognostizierte Zukunft gibt es Meinungsverschiedenheiten. Vielleicht müssen Sie anstelle von Paywalls auf Anzeigen oder Sponsorenbenachrichtigungen stoßen, um zu den vertrauenswürdigen Inhalten zu gelangen. Es gibt viele andere Möglichkeiten.

Der multimodale Morast der generativen KI erwartet Sie

Ich habe mich hier auf textbezogene generative KI konzentriert. Das ist die Text-zu-Text- oder Text-zu-Essay-Variante der generativen KI wie ChatGPT.

Eine meiner Vorhersagen war, dass wir uns bald in multimodaler generativer KI wiederfinden werden, siehe meine Erklärung unter den Link hier. Wir erleben bereits Text-zu-Bilder, Text-zu-Audio, Text-zu-Video und andere Varianten der Arten oder Modi der ausgegebenen Ergebnisse von generativer KI. Der nächste Schritt ist, dass Sie multimodale Ausgaben erhalten können.

Sie geben beispielsweise eine Eingabeaufforderung in die generative KI ein und fragen nach Abraham Lincoln. Die generative KI erstellt für Sie einen Aufsatz. Außerdem werden mehrere Bilder von Lincoln generiert, die ihn in Posen zeigen, die bisher nicht gepostet oder veröffentlicht wurden. Es wird ein Audiotranskript erstellt, das eine Lincoln-ähnliche Stimme zu haben scheint. Es wird ein Video generiert, das den Aufsatz zeigt, einschließlich einer Montage von Bildern und Bildern, die mit dem ausgegebenen Text einhergehen.

Willkommen in der Welt der multimodalen generativen KI.

Spannend, sicher.

Aber vielleicht nicht ganz so spannend, wenn man glaubt, dass dies weiteres Futter als Content ist, der ins Internet gestellt werden kann.

Im Wesentlichen werden wir uns nicht nur über den möglicherweise fehlerhaften Text ärgern, sondern müssen dasselbe für alle anderen Ausgabemodi tun. Audiodateien sollten im Verdacht stehen, Unwahrheiten zu enthalten, Bilder könnten Dinge falsch darstellen, und Videos werden ebenfalls besorgniserregend sein.

Wenn Sie den multimodalen Flächenbrand nicht bereits in Ihre Berechnungen über das Aufblähen des Internets einbezogen haben, sollten Sie vielleicht Ihre Zahlen und Ihr Händeringen in die Höhe treiben.

Teufels- oder Tugendkreisläufe der generativen KI

Ich habe einen Faktor für Sie, der Sie ein wenig um den Verstand bringen könnte. Abwarten.

In dieser Saga des überfluteten Internets gehen wir davon aus, dass die generative KI der Bösewicht ist. Generative KI ist die Art und Weise, wie all diese fehleranfälligen und erfundenen Inhalte produziert werden. Generative KI ist durch und durch schlecht.

Nehmen wir jedoch an, dass wir dies in einem anderen Licht betrachten.

Es könnte sein, dass die generative KI in der Lage ist, die schrillsten und stärksten validen Inhalte zu produzieren. Inzwischen werden die von Menschenhand generierten Inhalte als viel weniger vertrauenswürdig ausgelegt. Die generative KI als Bösewicht wird zur generativen KI als Held.

Denk darüber nach.

Ich habe noch eine lustige Wendung für dich.

Nehmen wir an, dass die generative KI über Inhalte aus dem Internet datentrainiert wird. Wenn wir auch davon ausgehen, dass generative KI-Inhalte entweder direkt vom Menschen oder über einen automatischen Mechanismus ins Internet gestellt werden, werden wir uns in einen faszinierenden Kreislauf verstricken.

Die von der generativen KI produzierten Inhalte werden zum Ausgangsmaterial für das weitere Datentraining in der generativen KI. Es entsteht eine Spirale. Immer mehr von generativer KI produzierte Inhalte werden ins Internet gestellt, was auf dem Datentraining von Inhalten basiert, die bereits von generativer KI produziert wurden.

Was macht diese Echokammer der „generativen KI, die in die generative KI einfließt“ letztendlich mit dem Internet und der Menschheit insgesamt?

Ein Standpunkt ist, dass dies ein schrecklicher Wettlauf nach unten ist. Fehler in generativen KI-Ausgaben werden vergrößert. Jede neue Iteration der generativen KI wird die vorherigen Fehler verbrauchen und sie immer wieder wiederholen. Irgendwann werden die Chancen, herauszufinden, wo die Fehler liegen, entmutigend sein. Düster. Entmutigend.

Ein anderer Standpunkt ist, dass, wenn generative KI entwickelt werden kann, um gültige Ausgaben zu erzeugen, Sie möglicherweise einen Internet-Reinigungsmechanismus haben, der hilft, das Internet aufzupolieren. Wenn die generative KI auf etwas Fehlerhaftes stößt, sei es von der KI oder von Menschenhand erzeugt, wird die generative KI diese Falschheit scheinbar erkennen und überwinden. Wenn die generative KI dies immer und immer wieder tut, ist es, als würden Sie ständig den Rasen mähen und die Art und Hervorhebung des Unkrauts effektiv reduzieren.

Das mag beruhigend klingen, abgesehen von der großen und sich abzeichnenden Frage, was genau Fehler oder Unwahrheiten sind. Diese Bereinigungsmaschine könnte versehentlich dazu führen, dass gültige Inhalte herabgesetzt oder fälschlicherweise als fehleranfällig beschuldigt werden. Wir müssen auf diese falsch positiven und falsch negativen Ergebnisse achten, wenn wir diese Art von Mechanismen in Betracht ziehen.

Wird die generative KI ein Teufelskreis oder ein positiver Kreislauf sein?

Die Zeit wird zeigen.

Fazit

Die zahlreichen und zuweilen panischen Mahnungen über generative KI, die das Internet überschwemmen, sollten sorgfältig geprüft werden. Viele Szenarien sind leicht vorstellbar. Untergangsstimmung ist nicht der einzige Weg. Jeder, der behauptet, vorherzusagen, was passieren wird, sollte offen über die Annahmen sein, die er macht.

Es gibt mildernde Faktoren, die bestimmen, wohin die Zukunft der generativen KI gehen wird. KI-Ethik und KI-Recht werden dabei neben der gesamtgesellschaftlichen Gesamtwahrnehmung eine entscheidende Rolle spielen.

Eine letzte Bemerkung vorerst.

Marcus Aurelius sagte bekanntlich: „Lass dich niemals von der Zukunft stören. Du wirst ihm notfalls mit denselben Waffen der Vernunft begegnen, die dich heute gegen die Gegenwart wappnen.“

Stellen wir sicher, dass unser heutiges Denken den Herausforderungen einer KI-geladenen Zukunft gewachsen ist.

Quelle: https://www.forbes.com/sites/lanceeliot/2023/02/23/is-it-true-that-generative-ai-chatgpt-will-flood-the-internet-with-infinite-content- fragt-ai-ethik-und-ai-recht/