Meta AI: Abermilliarden teils persönliche Bilder und Kommentare verwertbar – und Zuckerberg macht keinen Hehl daraus
Meta Platforms Inc. möchte laut Aussage seines CEOs eine eigene KI in die Welt setzen und gemäß Zuckerberg verfüge das Unternehmen über zahlreiche Daten – mehr als jene, die zum Trainieren des bisher bekanntesten KI-Chatbots ChatGPT verwendet wurden. Diese möchte man wohl alsbald zur Fütterung des eigenen KI-Systems abrufen. Hierbei stünden Meta Facebook- und Instagram-Posts sowie sämtliche, öffentlich getätigte Kommentare zur Verfügung. Datenschützer schlagen bereits Alarm und vermuten eine gewisse Toxizität hinter den Daten, die dem Modell zugrunde gelegt werden.
Training mit „einzigartigem“ DatensatzNach dem letzten Gewinnbericht entschied sich der Meta-CEO, die Öffentlichkeit über den Plan
zu informieren. Nach seiner Auffassung sei Facebook „für viele Menschen das Internet“ und anhaltend wachsende Nutzerzahlen würden ihn darin bestätigen. Das möchte man sich natürlich zunutze machen und strebe es deshalb an, eine „leistungsstarke“ und „universell einsetzbare“ künstliche Intelligenz zu schaffen. Hunderte Milliarden öffentlich geteilter Bilder, Dutzende Milliarden öffentlich zugänglicher Videos und ebenso eine riesige Zahl an öffentlichen Textbeiträgen bieten laut Zuckerberg eine größere Basis als der „Common Crawl“-Datensatz.
Größer und besser um jeden Preis?„Common Crawl“ steht für ein Archiv aus 250 Milliarden Webseiten, welches den größten Teil des Trainings von ChatGPT ausmacht. Zuckerberg möchte mit seinem gigantischen Datens(ch)atz einen noch intelligenteren Chatbot entwickeln. Einen besonderen Vorteil sehe man in der Interaktivität, mit der die Daten untereinander verknüpft sind. Viele stammen aus Kommentar-Threads und menschliche Dialoge seien für das Training sogenannter „Conversational Agents“ von „entscheidender Bedeutung“: OpenAI stürzte sich daher insbesondere auf das Internetforum Reddit, um seinen Chatbot mit Konversationen aufzuwerten. Bei Facebook geht es jedoch oft sehr persönlich zu, was den Meta-CEO weniger zu stören scheint. Die damit einhergehenden Datenschutzprobleme, aber auch die Vielzahl an Beleidigungen und persönlichen Angriffen – mit teils rassistischem sowie sexistischem Inhalt – werfen allerdings ihre Schatten auf das geplante Projekt.