Apples KI-Web-Crawler: Immer mehr Webseiten verweigern Datenzugang
Viele der größten Websites weltweit haben sich entschieden, ihre Inhalte nicht für Apples KI-Training zur Verfügung zu stellen. Die betroffenen Plattformen, darunter Facebook, Instagram sowie bekannte Medienhäuser wie die New York Times und The Atlantic, blockieren Apples Web-Crawler „Applebot“. Apple verwendet diesen Bot, um
Inhalte aus dem Internet zu sammeln und für verschiedene Zwecke, wie etwa Siri, Spotlight und Apple Intelligence zu nutzen. Diese Praxis gilt als umstritten, da sie oft auf urheberrechtlich geschütztes Material zugreift, um daraus neue Inhalte zu generieren.
Der ethische Ansatz von AppleApple verfolgt im Gegensatz zu vielen anderen KI-Unternehmen einen relativ transparenten und ethischen Ansatz. Webseitenbetreiber können sich über das Einfügen eines speziellen Tags in ihre „robots.txt“-Datei gegen Nutzung ihrer Daten durch Apple entscheiden. Damit wird Applebot zwar weiterhin für Indexierung von Inhalten genutzt, jedoch werden diese Daten nicht für das KI-Training verwendet.
Prominente Ablehnung„WIRED“ berichtet, dass etwa
ein Viertel der US-Newsplattformen sowie einige global aktive Unternehmen den Applebot blockieren. Dazu gehören neben Facebook und Instagram auch Websites wie Craigslist, Tumblr, The Financial Times und Vox Media. Interessant ist, dass der "Condé Nast"-Verlag, zu dem unter anderem WIRED gehört, Apples Web-Crawler blockiert. Dies könnte darauf zurückzuführen sein, dass OpenAI und Condé Nast eine Kooperation gestartet haben, um journalistische Inhalte in KI-Systeme zu integrieren. Erwähnenswert ist außerdem, dass der Google Bot laut dem Artikel sogar von rund 53 % der untersuchten Nachrichtenseiten blockiert wird.
Finanzielle Motive hinter der BlockadeManche Insider vermuten, dass Apple mit einigen Medienunternehmen Vereinbarungen getroffen hat, um deren Inhalte für das KI-Training nutzen zu dürfen. Diese Vereinbarungen beinhalten wahrscheinlich finanzielle Kompensationen, was einige Verlage dazu veranlasst haben könnte, zunächst die Nutzung ihrer Daten zu blockieren, um bessere Konditionen auszuhandeln. Da die Möglichkeit, sich gegen die Teilnahme am AI-Training zu entscheiden, erst seit relativ kurzer Zeit besteht, ist es möglich, dass die Zahl der blockierten Websites in Zukunft noch weiter ansteigen wird. Für Apple könnte dies bedeuten, dass sich das Unternehmen intensiver mit den Interessen der Content-Ersteller auseinandersetzen muss, um weiterhin auf qualitativ hochwertige Daten zugreifen zu können.