News AMD Ryzen 8000: Strix Point mit 4+8c- und Strix Halo mit 16 Zen-5-Kernen

SFFox schrieb:
Speicherbandbreite
Genau die meine ich.
80 GB/s für die APU hören sich gut an, werden von einer RX 6400 aber geschlagen.
Wenn die RDNA3 da aber trotzdem noch mehr Leistung rauskitzelt, ist es auch nicht schlecht.
Anti Aliasing dürfte ja so oder so nur bei älteren Games möglich sein.
 
andi_sco schrieb:
80 GB/s für die APU hören sich gut an, werden von einer RX 6400 aber geschlagen.
Hat aber den Nachteil, wenn mehr als die 4GB gefragt werden, wird sie am PCIe verhungern. Das Problem hat die APU nicht, die kann auf den ganzen Speicherpool ohne penalties zugreifen.
 
Casillas schrieb:
Ja allg. finde ich es schön zu sehen, dass diese Technologie überhaupt noch verfolgt wird, auch unabhängig dessen, wie oft sie wohl anwendung findet.

Halte das eher für zu vernachlässigt.

War nicht mal zur Einführung von DX12 die Rede davon, das mit dieser neuen Technologie alle GPUs (also auch was mal SLI oder CrossFire war) im System gleichzeitig zB zum Spielen verwendet werden können, mit entsprechender Mehrleistung? Und das unabhängig vom Hersteller, in beliebiger Kombination.

Habe ich schon (zu) lange nichts mehr von gehört.
 
  • Gefällt mir
Reaktionen: Qyxes
Vitec schrieb:
Für 1 normalen Kern bekommt man dann 2 abgespeckte.
Ja und Nein zur gleichen Zeit, auch wenn es einige bereits geschrieben haben. Ich gehe nach dem nächsten Zitat darauf ein.
Tharan schrieb:
Einzig der L3-Cache ist hier anders, während Intel auf eine andere Architektur bei den E-Kernen setzt.
Nein, das ist so nicht ganz richtig. Es ist die selbe Architektur, gleichzeitig gibt es aber doch teilweise starke Änderungen zu Zen 4.

1. Einzele Module werden zusammen gefasst und dadurch verkleinert.
2. Abstände zwischen Bestandteilen und Modulen werden verkleinert.
3. Schaltungen werden auf Platz optimiert.

Das führt bereits dazu, dass Zen 4c trotz gleicher Architektur einiges an Taktpotenzial einbüßt.

4. 6T statt 8T-SRAM-Zellen. Das gilt für alle Caches (mein letzter Stand).
5. Pseudo-2-Port-SRAM-Zellen. Statt wirklich ein Lese- und Schreibport zu haben, werden die Taktflanken genutzt.
6. Verkleinerter L3-Cache.
7. Bumps für VCache entfernt.

Es ist also nicht nur der L3-Cache der hier anders ist. Zen 4c ist keine andere Architektur, aber ein anderer Kern und das sollte man im Hinterkopf behalten.
Wun Wun schrieb:
Wäre es aus Spielersicht performancemäßig nicht sinnvoller, 8 „ganze“ und 4 c-Kerne zu kombinieren (d. h. 8 Kerne mit hoher Single-Core-Leistung und 4 sparsamere für weniger anspruchsvolle Dinge)?
Klassisches Jaein. In dem Fall kommt es auf das Gerät an. Zen 4 in den APUs kann auf 5,2 GHz gehen und man verliert Takt mit Zen 4C. Gleichzeitig ist die Frage - auch bei Spielen - wie dauerhaft die 5,2 GHz wirklich benötigt werden und bei einem Laptop auch anliegen.

Entscheidender ist hier der All-Core und der sollte neidriger ausfallen. Ist die Differenz hier zum Zen4c nicht zu hoch, ist es eigentlich egal.

Bei einem monolitischen Design fällt auich die Latenz "niedriger" aus in diesem Fall. Aber selbst bei den CCD ist die Latenz nicht so "gravierend" mehr. Innerhalb des CCX hat Zen4 eine top Latenz, geht es raus, ist sie mit 70 ns "schlechter". Bei AlderLake und RaptorLake ist die Latenz zwischen den Kernen "Konstant" Mittelprächtig, bis es in die e-Cores geht.

Allgemein kann man solche Latenzen aber auch entgegenwirken und diese einplanen, auch bei der Spiele entwicklung.
Herdware schrieb:
Es kommt wohl drauf an, wie viele Threads mit hoher CPU-Last typische Spiele und Anwendungen erzeugen.
In dem Fall der APU und dem Notebook ist wohl eher die Frage, wie hoch der All-Core-Turbo ausfällt und ob er da auch gehalten werden kann in so einem Fall.
Philste schrieb:
Das dachte ich mir auch schon. Es ist zwar ein Monolith, aber die Kommunikation zwischen den beiden CCX sollte trotzdem langsam sein.
Sie ist mit den bis zu 80 ns sicher nicht optimal, aber in den meisten Fällen hat es keinen Einfluss und in anderen Szenarien kann man entsprechend darauf hin auch optimieren, dass es weniger einen Einfluss hat.
Corpus Delicti schrieb:
Habe ich schon (zu) lange nichts mehr von gehört.
Was in dem Fall auch nicht verwundert. Mutli-GPU mit der heutigen Grafikpipeline ist zwar theoretisch möglich, aber viel zu aufwändig zu implemeneitere und ist dabei auch noch mit massiven Nachteilen verbunden.

Mit Hardware T&L sowie später den Shadern gab es als einfache Lösung nur noch AFR - bei Splited Frame Rendering ist eine hohe Kommunikation und Synchronistation notwendig. Das hat aber seine Nachteil. Seit Temporäre-Renderverfahren auch bei neuen Effekten Einzug gehalten haben, ist aber selbst AFR in vielen Fällen nicht mehr einfach umzusetzen.

Dazu kommt, dass irgendwann in solchen Systemen auch die Latenz zwischen GPU sehr stark die Skalierung limitiere würde.
 
  • Gefällt mir
Reaktionen: Qyxes, Deinorius, ETI1120 und 4 andere
DevPandi schrieb:
Das führt bereits dazu, dass Zen 4c trotz gleicher Architektur einiges an Taktpotenzial einbüßt.
Allerdings sollte man nicht vergessen das wenn viele Cores aktiv sind auch Fmax der Cores aufgrund der maximal möglichen elektrischen Leistung sinkt.
 
DevPandi schrieb:
as führt bereits dazu, dass Zen 4c trotz gleicher Architektur einiges an Taktpotenzial einbüßt
kann dennoch die gleichen instruktionen ausführen und darauf kommt es aus entwicklersicht letztlich an ^^

taktverhalten ist dann die leistungsimplikation aus dem allen, einfach mehr kerne ist für den angepeilten usecase definitiv nicht schlecht
 
  • Gefällt mir
Reaktionen: Zarlak
Philste schrieb:
Wenn es bei den guten 3 GHz bleibt, dann hat man außer AVX512 keinen Vorteil gegenüber Intels E Kernen. Die haben zwar weniger IPC, takten aber im Verhältnis zu den P Kernen höher.
Es geht nicht nur um Performance. Bei den C Kernen geht es neben der Kompaktheit vor allem um Effizienz. Und das ist bei Notebooks extrem wichtig.
 
ETI1120 schrieb:
Bei den C Kernen geht es neben der Kompaktheit vor allem um Effizienz. Und das ist bei Notebooks extrem wichtig.
Gibt es denn schon Berichte, ob sie auch effizient sind? Klar, Bergamo ist effizienter als Genoa, aber das ist ja kein Wunder, wenn man die Arbeit auf mehr niedriger taktende Kerne aufteilt. Mich würde mal ein Vergleich mit gleicher Anzahl ZEN4c gegen ZEN4 bei gleichem Takt interessieren.
 
Wir wissen was AMD bei Zen 4c gemacht hat. Es ist anzunehmen, dass AMD bei Zen 5c ebenso vorgeht. Es ist aber nicht sicher.

Außerdem ist noch immer unklar wie hoch die Zen 4c Kerne im Notebook takten dürfen.

DevPandi schrieb:
Das führt bereits dazu, dass Zen 4c trotz gleicher Architektur einiges an Taktpotenzial einbüßt.
Ich denke man muss es anders herum betrachten:
AMD hat Zen 4c als Cloud Native Core designed. Da stand nie eine hohe Taktfrequenz zur Diskussion. Es ging um eine hohe Packungsdichte, gute Energieeffizienz und stabile Performance.

AMD hat sich eine Zielfrequenz ausgesucht, und ein Design für diese Zielfrequenz umgesetzt und dabei Engergieverbrauch und Fläche reduziert.

Ian Cutress erklärt das Ganze am Anfang dieses Videos.

Was er später zum Hybrid Design erzählt kann ich nicht so ganz nachvollziehen, da AMD Phoenix 2 bringt und Mark Papermaster schon im Mai Hybrid CPUs angekündigt hat. Klar im Desktop ergeben für AMD Hybrid CPUs keinen Sinn. Das hat David McAfee in seinem Interview mit TechPowerUP klargestellt.

Philste schrieb:
Gibt es denn schon Berichte, ob sie auch effizient sind?
In einem kompakten Kern müssen die Daten über kürzere Distanzen transportiert werden, alleine daraus sollte ein Effizienzgewinn resultieren.

Im oben verlinkten Video sagt Ian Cutress, dass die Zen 4c Kerne bei hohen Frequenzen weniger effizient als Zen 4 Kerne werden. Daraus folgt dass die Zen 4c Kerne, in dem Frequenzbereich für den sie designed sind, effizienter als Zen 4 Kerne sind.

Beim Test von Bergamo stellt STH fest dass:
  • Die wichtigste Änderung bei Zen 4c-Kernen gegenüber Zen 4 ist die Halbierung des L3-Cache.
  • Der AMD EPYC 9754 zeigt die ~3-fache Leistung eines 128-Kern-Arm-Wettbewerbers bei 1,5-facher Leistung.
  • Ein AMD EPYC 9754 ist oft doppelt so leistungsfähig wie der AMD EPYC 7002 "Rome" mit 64 Kernen aus dem Jahr 2019.
  • Bei den meisten nicht-HPC-orientierten Workloads sollte der AMD EPYC 9754 15-20% schneller sein als der AMD EPYC 9654. Das sind nicht direkt 33%, wie wir es aufgrund der höheren Kernzahl erwarten würden, aber AMD profitiert von der höheren Kernzahl auch bei einer drastisch reduzierten L3-Cache-Größe.
  • AMD scheint einen eleganten Weg gefunden zu haben, den Turbotakt-Jitter zu reduzieren, insbesondere bei maximaler Last. Das hilft sehr bei SLA auf einem belasteten System.
  • Cloud-native Prozessoren werden ein großes Segment des Marktes ausmachen.
STH hat festgestellt dass alle 128 Kerne konstant auf 3,1 GHz laufen können. Das folgende Bild zeigt eine EPYC 9754 CPU nach einem 22,5-h-Run mit stress-ng
1691449081464.png


Phoronix kommt beim Vergleich von Bergamo mit Genoa zu folgenden Ergebnisse:
Bei all diesen Workloads, die gut skalieren können, war der EPYC 9754 2P etwa 20 % schneller als die EPYC 9654 / 9684X Prozessoren. Der 20%ige Anstieg ist großartig, denn obwohl er von 96 auf 128 Kerne (33%) ansteigt, skalieren die meisten Workloads nicht linear, besonders wenn sie sehr hohe Threadzahlen erreichen, und es gibt auch noch das Problem von Bergamo mit den dichteren Zen 4C-Kernen. Der EPYC 9754 hat auch einen niedrigeren Basistakt von 2,25 GHz im Vergleich zu 2,4 GHz beim EPYC 9654 und einen maximalen Boost-Takt von 3,1 GHz im Vergleich zu 3,7 GHz beim EPYC 9654.
...
Bei allen durchgeführten Benchmarks hatte der EPYC 9754 2P im Durchschnitt eine Leistungsaufnahme von 385 Watt... Im Vergleich dazu hatte der EPYC 9654 2P einen Durchschnitt von 447 Watt und der EPYC 9684X 2P einen Durchschnitt von 464 Watt.
Wenn ich das Mal überschlage komme ich auf eine ca. 40% bessere Effizienz für Bergamo im Vergleich u Genoa.

Beim Notebook verwendet AMD ein Hybriddesign, da das System bei Userinput schnell reagieren muss. Hier wird das hohe Taktpotential der P-Cores gebraucht. Aber mit 3,1 GHz bekommen die E-Cores auch einiges weggeschafft. IMO ist das für die Notebook-U-Klasse eine gute Frequenz. Die P-Kerne werden im Schnitt nicht viel schneller laufen.
 
  • Gefällt mir
Reaktionen: Deinorius und LamaMitHut
Zur besseren Unterscheidung sollte man die AMD C-Kerne nicht nach den intelschen E-Kerne benennen.
Denn sonst wird dadurch vermittelt, dass es das Gleiche ist.
 
In der Konfiguration der CPU verwendet AMD die Bezeichnungen E und P. Und Intels E Kerne werden so betrieben, dass sie nicht energieeffizient sind.
 
Ich habe gerade noch einmal nachgeschaut, bei Zen 4 ist die größte IGPU 12 CU RDNA 3 (Asus rog ally)

Bei Strix Point sind es schon 16 RDNA 3+, und das auf einer besseren Fertigung

Was kann man da wohl erwarten? Worst case +30% FPS?
 
@ETI1120

Wenn die Gerüchte stimmen ist das ein state of the art Premiumprodukt.

Ich glaube kaum, dass man es in dem Fall daran scheitern lässt - für alles andere hat man ja die Vorgänger mit Zen 4.
 
Flutefox schrieb:
Der 5700G hat bereits viel Spaß gemacht, die 680M hat es bis heute a nicht in den Desktop geschafft. Neue APUs, egal ob Strix Point oder Strix Halo/Sarlak wären da begrüßenswert.

Grundsätzlich richtig, in Ausnahmen wäre da zumindest der Minisforum Minisforum um773 lite als FertigPC oder Barebone zu nennen, der 8 Zen3+ Cores und die RDNA2 680M mit 12 CU und DDR5 mitbringt. Und da der Rechner eine TDP einstellbar von 28 bis 54 Watt hat, kommt man an die 65 TPD der bisherigen Desktop-APUs schon recht nah ran.

Und die Ryzen 7 7735HS-CPU als APU macht ebenfalls Spaß :-) und zeigt was nach Vega jetzt bereits gut drin ist. Ich denke da kommt noch spannendes von AMD
 
Zuletzt bearbeitet: (Typo)
  • Gefällt mir
Reaktionen: Flutefox
Mit DDR5 8000 geht bestimmt was.
Persönlich kann ich nicht einschätzen, wie groß überhaupt eine Nachfrage im Desktop sein könnte.
Wahrscheinlich wird Strix eh nie in den Desktop kommen, sondern nur für ganz bestimmte Segmente sein. Wie zB Handhelds und kleine Konsolen.
 
Archivar schrieb:
Grundsätzlich richtig, in Ausnahmen wäre da zumindest der Minisforum Minisforum um773 lite als FertigPC oder Barebone zu nennen, der 8 Zen+ Cores und die RDNA2 680M mit 12 CU und DDR5 mitbringt. Und da der Rechner eine TDP einstellbar von 28 bis 54 Watt hat, kommt man an die 65 TPD der bisherigen Desktop-APUs schon recht nah ran.

Und die Ryzen 7 7735HS-CPU als APU macht ebenfalls Spaß :-) und zeigt was nach Vega jetzt bereits gut drin ist. Ich denke da kommt noch spannendes von AMD
Hier ist die Frage, wo man da die Grenze zieht. Eine Mobile CPU in einen Barebone zu bringen, aufgelötet, hat für mich eben nichts mit Desktop oder DIY zu tun.
 
Ja, richtig, DIY ist damit überhaupt nicht möglich, daher meinte ich auch das "in Ausnahmen", weil es eben nur kleine Teil dessen hat, was man gemein hin unter PC versteht. Dennoch ein nettes Gerät mit einer "Quasi"-APU, die zeigt was bereits mit Zen3+ und RDNA2 geht...
 
Zurück
Oben