Apple Silicon M4: Die versteckte Innovation der Effizienzkerne
Wenn ein neuer Prozessor auf den Markt kommt, bemühen sich Amateure wie Profis darum, objektive Messwerte aus der frisch erschienenen Hardware herauszukitzeln. Tests wie das Cinebench, Geekbench oder der quelloffene Blender-Benchmark erfüllen diesen Wunsch nach Vergleichbarkeit, indem sie einfache Zahlen liefern. Zwar geben die Werte einen Anhaltspunkt zur Leistungsfähigkeit im Vergleich zu Konkurrenz oder Vorgängern. Doch sie bleiben recht weit von den Nutzungsszenarien entfernt, denen ein Rechner beim täglichen Gebrauch ausgesetzt ist. Apples M-Prozessoren stellen zudem eine weitere Herausforderung: Durch die Differenzierung in P- und E-Kerne fällt ein generalisierter Leistungsvergleich schwer. Howard Oakley geht in einer
Reihe spezialisierter Messungen dem Kernunterschied auf den Grund.
Sämtliche bisher erschienen Apple-Silicon-Chips weisen einen ähnlichen strukturellen Aufbau auf: P- wie E-Kerne sind in Gruppen (Bin) von vier bis sechs Kernen zusammengefasst. Während höherwertige Prozessoren mehrere P-Kern-Bins integrieren, bleibt es bei allen Variationen (mit Ausnahme der Ultra-Reihe) bei einem E-Kern-Bin. Darin greifen sie auf einen gemeinsamen L2-Cache zu; jeder Bin läuft zudem auf einer einheitlichen Frequenz. Diese kann in fünf Schritten an den aktuellen Bedarf angepasst werden. E-Kerne des M4-Prozessors arbeiten mit einer Frequenz von mindestens 1020 MHz und höchstens 2592 MHz, fand Oakley heraus – eine geringere Varianz als beim Vorgänger: Der M3 konnte seine E-Kerne von 744 bis 2748 MHz betreiben.
Rechenaufgaben gezielt an E-KerneUm die Leistung von Effizienzkernen separat zu messen, wendete Oakley verschiedene Tricks an. Mit einer niedrigen QoS-Bewertung
prädestinierte er manche Berechnungen für stromsparende Berechnungen im Hintergrund; in einem anderen Szenario „überforderte“ er die Leistungskerne mit vielen gleichzeitigen Berechnungen hoher Priorität, sodass einige an die Effizienzkerne ausgelagert wurden. Im ersten Szenario (Berechnung im Hintergrund) bemerkte er, dass der E-Kern-Bin in niedrigster Frequenz lief, die Aktivität zudem zwischen einzelnen Effizienzkernen hin- und herwechselte. Im Hochleistungsmodus kam hingegen die höchstmögliche Frequenz zum Einsatz, dabei blieb die Auslastung dauerhaft im selben Kern.
Energieverbrauch im E-Kern weniger als die HälfteNeben der Berechnungszeit verglich Oakley auch den Energieverbrauch der jeweiligen Berechnungen. Er wollte wissen, wie sich der Geschwindigkeitsvorteil der Leistungskerne im Verbrauch auswirkte. Dafür verglich er die Leistungsaufnahme von P- und E-Kernen in jeweils höchster Frequenz. Sein Fazit: Bei jeweils höchster Frequenz ziehen E-Kerne lediglich acht bis neun Prozent der Energiemenge, welche P-Kerne pro Zeiteinheit schlucken. Dabei arbeiten E-Kerne langsamer und benötigen zwischen 1,35- bis 1,5-mal so lang wie ein P-Kern. Oakley schätzt, dass dieselbe Berechnung in E-Kernen lediglich 38 bis 47 Prozent der Energie erfordert, die sie in P-Kernen verbraucht hätte.
Vergleich zu M3: schneller und flexiblerFührt Oakley
dieselben Messungen auf M1- oder M3-Prozessoren durch, sticht ihm ein weiterer Vorteil ins Auge, der in Standard-Benchmarks auf der Strecke bleibt: Die Effizienzkerne des M4 arbeiteten besonders bei niedriger Priorität schneller als die des Vorgängers, speziell bei Vektor- und Matrix-Berechnungen. Insgesamt geselle sich beim M4 zum Benchmark-Boost noch ein schwer messbarer Vorteil: Beide Kerntypen können nun flexibler zwischen unterschiedlichen Leistungs- und Effizienzanforderungen wechseln, schlussfolgert er.
Die Berechnungsgeschwindigkeit der Effizienzkerne von M1 bis zum M4 bei niedriger Priorität. (Quelle: Howard Oakley,
Eclecticlight.co)