Push-Nachrichten von MacTechNews.de
Würden Sie gerne aktuelle Nachrichten aus der Apple-Welt direkt über Push-Nachrichten erhalten?

Apples Team für maschinelles Lernen präsentiert zwei neue Open Source-Sprachmodelle

Apples Team für maschinelles Lernen beteiligt sich gemeinsam mit anderen Unternehmen am Open-Source-Projekt DataComp for Language Models. Kürzlich haben sie zwei neue Open-Source-Sprachmodelle veröffentlicht, die in Benchmark-Tests beeindruckende Ergebnisse erzielt haben. Laut Apple sollen beide Modelle führenden Trainingsmodellen wie Llama 3 und Gemma ebenbürtig oder sogar überlegen sein. Ihre Effizienz könnte die Weiterentwicklung von KI-Anwendungen erleichtern und beschleunigen. Schließlich werden solche Sprachmodelle verwendet, um KI-Plattformen wie ChatGPT zu trainieren und ihnen Daten von höherer Qualität zur Verfügung zu stellen.


Technische Details
Das größere der beiden Modelle verfügt über sieben Milliarden Parameter und hat das bisherige Spitzenmodell MAP-Neo um 6,6 Prozent übertroffen. Bemerkenswert ist, dass es 40 Prozent weniger Rechenleistung benötigt, um ähnliche Ergebnisse zu erzielen. Die Modelle und ihre Trainingsdaten sind als Open-Source-Projekte veröffentlicht worden. Damit möchte das Apple Intelligence Research Team die Zusammenarbeit in der KI-Forschung fördern und anderen Teams helfen, auf den Ergebnissen von Apple aufzubauen.


Benchmark-Ergebnisse
In den Massive Multi-Task Language Understanding (MMLU) Benchmarks haben beide Modelle gut abgeschnitten und konnten sich mit kommerziellen Modellen messen. Diese Ergebnisse zeigen, dass Apples Modelle nicht nur für die Forschung, sondern auch für praktische Anwendungen relevant sein könnten. Auf der diesjährigen WWDC (Worldwide Developers Conference) hat Apple neben den neuen Modellen auch „Apple Intelligence“ und „Private Cloud Compute“ vorgestellt. Verschiedene Branchenexperten haben Apple in der Vergangenheit als Nachzügler bei der Entwicklung von KI bezeichnet, doch die neuesten Meldungen zeigen, dass Apple keineswegs hinterherhinkt. Zumal das Open Source-Engagement die Innovationskraft der Branche insgesamt stärken könnte.

Kommentare

Metty
Metty22.07.24 14:08
Kann mir irgendwer erklären warum Apple das als Open Source herausgibt? Apple ist doch sonst nicht dafür bekannt über kommende technologische Entwicklungen zu plaudern.
+1
macfreakz22.07.24 14:39
Naja - Sprachmodelle wie ChatGPT wurden auf Basis von "freiem" Internet trainiert. Daher halte ich schon sinnvoll, dass die Sprachmodelle OpenSource sind.
+4
Marcel Bresink22.07.24 15:23
Metty
Kann mir irgendwer erklären warum Apple das als Open Source herausgibt?

Weil das alle so machen und Apple beweisen will, dass sie bei diesem Spiel mitspielen können, obwohl sie sehr spät dran sind. Es sind auch nicht wirklich "kommende technologische Entwicklungen", sondern eher Zwischenergebnisse der Forschung aus der Gegenwart und Vergangenheit.

Was veröffentlicht wurde, ist auch kein Produkt, sondern ein beispielhaftes Modell mit Verfahren, die zeigen, wie man für Apple-Plattformen KI-Sprachgeneratoren trainieren und optimieren kann. Es steckt also zwar Arbeit, aber kein besonderes "Entwicklungsgeheimnis" darin. Und wie macfreakz schon sagt, ist es schon aus ethischen Gründen angemessen, das zugänglich zu machen, denn die Daten hierfür wurden aus öffentlichen Quellen zusammengeklau(b)t.
+3
Skywalker0422.07.24 16:46
Marcel Bresink
Metty
Kann mir irgendwer erklären warum Apple das als Open Source herausgibt?

[…] denn die Daten hierfür wurden aus öffentlichen Quellen zusammengeklau(b)t.

Zumindest das lässt sich scheinbar mit ein wenig Recherche (zumindest teilweise) widerlegen. Anders als lizenzfreie Verwendung von YouTube Untertiteln und Co. scheint Apple im großen Stil Times Artikel und mehr lizensiert zu haben.

Eine Vermutung meinerseits, warum es Open Source ist, ist der grundsätzliche Ansatz den Apple mit lokal ausgeführten Modellen fährt. Denke, da man mit Apple Intelligence und Private Cloud Compute auch den Datenschutzaspekt stärken will, macht hier Transparenz Sinn.
-4
Marcel Bresink22.07.24 17:34
Skywalker04
Zumindest das lässt sich scheinbar mit ein wenig Recherche (zumindest teilweise) widerlegen.

Nein, Du hast offenbar keine Recherche durchgeführt. Das veröffentlichte Modell basiert auf dem DCLM-Datensatz, der aus einer Untermenge des öffentlichen "Common Crawl"-Datenpools gebildet wurde.
Skywalker04
Eine Vermutung meinerseits, warum es Open Source ist, ist der grundsätzliche Ansatz den Apple mit lokal ausgeführten Modellen fährt.

Das ist weder etwas Besonderes, noch etwas Neues. Jeder kann zum Beispiel "Ollama für macOS" auf seinem Mac installieren und dann Dutzende von KI-Assistenten (wie Gemma, Llama Mistral, Phi, etc.) kostenlos und komplett lokal verwenden.

Wenn Apple etwas zum Thema KI veröffentlicht, heißt das noch lange nicht, dass Teile daraus in das Produkt "Apple Intelligence" einfließen müssen. Das Besondere an Apple Intelligence ist nicht die KI an sich, sondern die Integration ins Betriebssystem und der Datenschutz beim Verwenden nicht-lokaler / nicht freier KI-Modelle. Das hat mit dieser Open-Source-Veröffentlichung wenig zu tun.
+5

Kommentieren

Sie müssen sich einloggen, um die News kommentieren zu können.