Die Anwendung generativer künstlicher Intelligenz (GenAI) wird die Nachfrage nach Rechenleistung um den Faktor 125 steigern – von 0,2 QFLOPs in diesem Jahr auf dann 25 QFLOPs im Jahr 2030. QFLOPS (Quetta-Gleitkommaoperationen) sind ein Maß für die Leistungsfähigkeit von Computerchips. 70% dieser Rechenoperationen für GenAI-Anwendungen werden aus Endkundenanwendungen kommen, 30% aus dem B2B-Bereich. Zu den B2c-Anwendungen gehören einfache Eingaben wie das KI-basierte Schreiben eine E-Mail oder komplexere Aufgaben wie die Zusammenfassung von Dokumenten. In den B2B-Bereich fallen Nutzungen wie das Erstellen von Code und Software oder KI-basierte Interaktionen mit Kund:innen. Um diese massiv steigende Nachfrage nach Rechenleistung zu bedienen, sind je nach Szenario zwischen 10 und 30 neue Fabriken für Logikchips (CPUs, GPUs und KI-Beschleuniger), Memory-Chips (HBM und DRAM) und Datenspeicherchips (NAND) weltweit erforderlich. Dies geht aus einer neuen Studie der Unternehmensberatung McKinsey & Company hervor.
GenAI erfordert spezialisierte Rechenzentren
„Die Halbleiterindustrie befindet sich vor einer weiteren massiven Wachstumsphase“, sagt Ondrej Burkacky, Senior Partner im Münchener Büro von McKinsey und Co-Autor der Studie. „Für die Branche geht es darum, jetzt die richtigen Entscheidungen über den Aufbau neuer Kapazitäten zu treffen, um den Bedarf zu decken, der durch GenAI entstehen wird.“ Neben der steigenden Nachfrage nach Rechenleistung wird sich auch die Struktur der Computing-Hardware und -Infrastruktur verändern. So wird es spezialisierte KI-Datenzentren mit höheren Chipdichten (rack density) geben, was wiederum eine intensivere Kühlung erfordert. Server für KI-Anwendungen werden mit hoch performanten Grafikkarten (GPUs) sowie spezialisierten KI-Chips ausgestattet sein. Diese zusätzliche Rechenleistung erhöht den Strombedarf massiv: Auf AI spezialisierte Server könnten 2030 mehr als 10% des globalen Stromverbrauchs ausmachen. Burkacky: „90% der Rechenlast wird auf Echtzeitausgaben – die so genannte Inferenz – entfallen, 10% auf das Training der KI.“
Basierend auf der benötigten Rechenleistung analysiert die McKinsey-Studie, welche zusätzlichen Fertigungskapazitäten für Wafer die Halbleiterindustrie benötigt. Bei den Logikchips werden 2030 rund 15 Mio. Wafer für Nicht-KI-Anwendungen benötig, 8 Mio. davon mit strukturbreiten unter 3 Nanometern. Die Nachfrage nach GenAI-Anwendungen benötigt zwischen 1,2 und 3,6 Mio. zusätzlichen Wafern, was sich basierend auf aktuellen Ausbauplanungen auf zusätzliche 3 bis 8 neue Fabs für Logikchips umrechnet. Bei den Memorychips (DDR und HBM) wird eine Nachfrage von 21 Mio. Wafer erwartet, umgerechnet 6 bis 18 neue Fabs; bei Datenspeicherchips (NAND) sind es zwischen 2 und 8 Mio. Wafern, was ein bis 5 neuen Fabs entspricht.