banner
Nachrichtenzentrum
Innovative Forschung und Entwicklung sowie eine effiziente Produktion bilden das Rückgrat unserer Organisation.

Wie KI Rechenzentren effizienter und dekarbonisieren kann

Jun 21, 2023

Man geht heute davon aus, dass Rechenzentren und andere Cloud-Computing-Betriebe bis zu 1 % des weltweiten Stromverbrauchs ausmachen. Der CO2-Ausstoß für den Betrieb dieser riesigen Serverfarmen – und insbesondere für deren Kühlung – ist alles andere als unerheblich. Man geht davon aus, dass etwa 50 % des Stromverbrauchs auf die grundlegenden Betriebskosten entfallen und bis zu 40 % auf Kühlkosten zurückzuführen sind.

Rechenzentren suchen überall nach Lösungen, von der Nutzung erneuerbarer Energien bis hin zur Versenkung von Rechenzentren im Meer, um Kühlkosten zu sparen.

Zu den sparsamsten und praktischsten Lösungen gehört der Einsatz künstlicher Intelligenz, um Ineffizienzen zu lokalisieren und zu beheben. Ein Bericht von Gartner schätzt, dass KI in den nächsten zwei Jahren in der Hälfte aller Rechenzentren einsatzbereit sein wird. Ein Bericht von IDC aus dem Jahr 2019 legt nahe, dass dies möglicherweise bereits geschehen ist. Die Arbeitsbelastung wird im Vergleich zum Vorjahr voraussichtlich um 20 % steigen, es handelt sich also um ein dringendes Problem.

Ian Clatworthy, Director of Data Platform Product Marketing bei Hitachi Vantara, und Eric Swartz, VP of Engineering bei DataBank, sprechen über die Möglichkeiten und Grenzen von KI-Lösungen in Rechenzentren.

Um nützliche KI-Instrumente zu erstellen und zu kalibrieren, müssen Rechenzentren die richtigen Daten sammeln und eingeben. Dies hat sich als Herausforderung erwiesen, da bestimmte Arten von Daten, die in der Vergangenheit im täglichen Betrieb nicht nützlich waren, einfach ignoriert wurden. Einige können gesammelt, aber unbenutzt sein. Und einige werden überhaupt nicht erfasst, was bedeutet, dass die Betreiber bei Null anfangen oder aus vorhandenen Daten extrapolieren müssen.

Zu den erforderlichen Hardwaredaten gehören: der verfügbare Speicher, die einfache Zugänglichkeit, die Anzahl der gleichzeitig laufenden Maschinen und die Maschinen, an die der Datenverkehr unter bestimmten Umständen weitergeleitet wird. Daten über den Energieverbrauch für den Antrieb von Maschinen und die Kühlung sind ebenfalls wichtig, ebenso wie entsprechende Daten über die Umgebungsbedingungen innerhalb und außerhalb des Zentrums.

„Um ein richtiges KI-System für maschinelles Lernen aufzubauen, bräuchte man all das, um die Effizienz wirklich zu steigern. All das ist wichtig“, sagt Swartz. „Jeder dieser Datenpunkte kann den anderen verzerren.“

KI kann tatsächlich hilfreich sein, um diese Informationen überhaupt erst zu sammeln. Mit den richtigen Anweisungen kann Data Mining nützliche Daten extrahieren, die in scheinbar unzusammenhängenden Statistiken verborgen sind. Wenn die richtigen Daten angeordnet sind, können sie laut Clatworthy „Informationen tatsächlich auf eine Weise darstellen, die etwas bedeutet“.

Der Stromverbrauch von Servern ist ein Hauptziel für KI-Eingriffe. Nicht verwendete Server bleiben in Betrieb und eingehender Datenverkehr wird ineffizient auf die verfügbaren Geräte verteilt. Planungssteuerungs-Engines können Deep Learning nutzen, um den Verkehr entsprechend zu leiten. Es kann so auf die verfügbaren Maschinen verteilt werden, dass deren Fähigkeiten optimal ausgenutzt werden, sie aber nicht überlastet werden.

Und dann können ungenutzte Maschinen heruntergefahren werden, bis sie benötigt werden. Besser noch, sagt Clatworthy: „Wir können die CPU herunterfahren. Indem Sie die Leistung verringern, verbrauchen Sie weniger Strom.“ Auch das Ein- und Ausschalten von Maschinen sei ineffizient, argumentiert er.

Verkehrsmuster können vorhergesehen werden, was eine sparsamere Nutzung der Geräte ermöglicht. Dadurch wird die Power Usage Effectiveness (PUE) verbessert. KI kann bei der Skalierung dieser Prozesse bei steigender Arbeitsbelastung helfen.

Weitere Effizienzsteigerungen können durch vorausschauende Wartung erzielt werden. „Durch das Verständnis historischer Daten zu Komponentenproblemen oder Wartungsplänen und deren Verknüpfung mit Budgetzuweisungen können Unternehmen mithilfe von KI Vorhersagemodelle bereitstellen“, sagt Clatworthy.

Durch die Nutzung von Daten, um festzustellen, wann Ausfälle wahrscheinlich auftreten, können geeignete Backups einfacher eingerichtet werden. Patching und Upgrades, die mühsam und arbeitsintensiv sind, können ebenfalls bis zu einem gewissen Grad automatisiert werden. Und ausgefallene Maschinen können ausgetauscht oder repariert werden, bevor sie zu Betriebsunterbrechungen führen.

Auch die Verwaltung der Stromquellen selbst kann von KI profitieren. Durch die Bestimmung, wann erneuerbare Energiequellen am besten verfügbar sind – windige Tage für Windenergie, sonnige Tage für Solarenergie – können Rechenzentren festlegen, wann sie diese Quellen nutzen und wann sie auf weniger wünschenswerte Stromquellen aus fossilen Brennstoffen zurückgreifen. Abwärme kann umgeleitet und entweder innerhalb des Zentrums selbst oder durch umliegende Einrichtungen genutzt werden.

„Man kann nicht immer auf erneuerbare Energien setzen“, behauptet Swartz. „Indem Sie mithilfe von KI herausfinden, wann der beste Zeitpunkt für den Einsatz ist, erhalten Sie das Beste aus beiden Welten.“

Auch hier gibt es Kosteneinsparungen. „Sogar 1 % [des Stromverbrauchs] kann Hunderttausende Dollar an Energie bedeuten“, fügt er hinzu. „Es wäre sehr vorteilhaft, es auf den effizientesten Betriebsparameter einzustellen.“

Kühlsysteme sind ein weiteres Ziel von KI-Effizienzprogrammen. Wie die Macht waren sie in der Vergangenheit konstant. Das heißt, sie wurden nicht entsprechend sich ändernden Parametern angepasst, sondern liefen stattdessen mit konstanten Raten, die durch vage Schätzungen des Bedarfs bestimmt wurden.

Kühlung ist sehr teuer – sowohl finanziell als auch im Hinblick auf den CO2-Ausstoß – und selbst geringfügige Änderungen an Kühlsystemen können zu erheblichen Einsparungen führen. Das Wärmemanagement muss Faktoren wie Umgebungstemperatur, Wetter, die von aktiven Maschinen zu einem bestimmten Zeitpunkt erzeugte Wärme, die Materialien, aus denen das Gebäude gebaut ist, und die aktuell vorhandenen HVAC-Systeme berücksichtigen.

KI kann Kühlaktivitäten auf die Systeme leiten, die sie benötigen – bis hin zu bestimmten Maschinenracks – und sie in Bereichen abschalten, in denen dies nicht der Fall ist. Es kann sogar Verzögerungszeiten berücksichtigen, indem vorhergesagt wird, wann bestimmte Sektoren wieder hochgefahren werden, und die Kühlung im Voraus auf sie gerichtet wird.

Die Erstellung eines digitalen Zwillings oder einer virtuellen Darstellung der physischen Umgebung eines Rechenzentrums kann dabei helfen, die Interaktion seiner verschiedenen Komponenten zu modellieren, ohne das Risiko einer Störung des Systems selbst einzugehen. Durch die Eingabe von Daten unter anderem zu Energie, Temperatur, Verkehrsbedarf und Wetter können KI-Architekten optimale Bedingungen für Rechenzentren entwickeln – zumindest theoretisch.

„Wir können verschiedene Kühlkonfigurationen simulieren“, nennt Clatworthy als Beispiel. „Ob in Singapur, in Melbourne, in Europa oder bei Regen – wir können die effizientesten Kühlanordnungen basierend auf dem Standort der Geräte ermitteln.“

Fehlende Daten – und es fehlen immer Daten – werden diese digitalen Modelle natürlich verzerren. Aber selbst eine angemessene Menge historischer Daten kann realistische Modelle dafür erstellen, wie Rechenzentren tatsächlich funktionieren und Energie verbrauchen.

Digitale Zwillinge sind jedoch nicht selbsterhaltend. Sie erfordern eine Abstimmung durch menschliche Beobachter, die Parameter erkennen können, die über das hinausgehen, was in der physischen Welt möglich wäre. Dadurch werden die Modelle im Laufe der Zeit verfeinert.

Datenknappheit stellt die größte Herausforderung für die KI-Implementierung in Rechenzentren dar. Während einige Daten für andere Zwecke gesammelt werden und somit zur Eingabe in KI-Systeme bereitstehen, treiben einige Daten, die für die Optimierung der KI-Leistung unerlässlich sind, bisher im digitalen Äther. Einige können nachträglich aus anderen Quellen geerntet werden. Andere Arten erfordern jedoch neue Methoden – was bedeutet, dass es keine historischen Aufzeichnungen gibt. Rechenzentren müssen bei Null anfangen.

Beispielsweise steht Rechenzentren der vom Hersteller angegebene Stromverbrauch einer Out-of-the-Box-Maschine zur Verfügung. Der Stromverbrauch von Maschinen, wenn sie altern und ihre Leistung nachlässt, wird jedoch möglicherweise nicht erfasst – und steht daher nicht für den Eingang in KI-Lösungen zur Verfügung. Genaue Kenntnisse über die Fähigkeiten und Schwachstellen der einzelnen verwendeten Geräte sind unerlässlich – und oft schwer zu erlangen.

Wie Swartz anmerkt, stehen Multi-Tenant-Rechenzentren bei der Datenerfassung vor einer weiteren Schwierigkeit, da sie sich an Datenschutzvereinbarungen mit ihren Kunden halten müssen. „Wir haben verschiedene Arten von Kunden mit unterschiedlichen Bedürfnissen und unterschiedlichem Risikoniveau“, erklärt er. „Wenn man versucht, all das unter einen Hut zu bringen, ist man normalerweise nicht in der Lage, diejenigen zu sein, die am Rande leben.“

KI erfordert auch neue und komplexe Systeme und Geräte, um ihre Umsetzung zu unterstützen – die sogenannte KI-Steuer. Im Vorfeld ist es nicht billig, aber spätere Kosteneinsparungen scheinen zuverlässig zu sein. Dennoch ist es keine leichte Aufgabe, das System zum Laufen zu bringen – Daten müssen gesammelt, verarbeitet, eingegeben und anschließend erneut analysiert werden.

Eine weitere Herausforderung besteht darin, sicherzustellen, dass Rechenzentren nachhaltig miteinander kommunizieren können. „Wir prüfen, wie wir mithilfe von KI-Software Daten aus Rechenzentren verschieben können, ohne dass sich dies auf den Kunden auswirkt“, sagt Clatworthy. Wenn man die erneuerbaren Energien mit einbezieht, stellt das jede Menge Hürden dar. „Hier geht die Sonne unter. Das bedeutet, dass wir für die Übertragung dieses Datensatzes keine erneuerbaren Energien nutzen werden.“

Auch wenn sie immer ausgefeilter werden und solche Entscheidungen treffen, sind KI-Systeme in manchen Situationen immer noch nicht mit menschlichem Denken mithalten können.

„KI ist noch nicht in der Lage, komplexe strategische Entscheidungen zeitnah zu treffen“, stellt Clatworthy fest. „Ich möchte, dass es mir sagt, wie hoch meine Kapazität langfristig sein wird und was verbessert werden muss. Ich werde mein Team auf unvorhergesehene Anomalien konzentrieren.“

Da KI immer stärker in den Rechenzentrumsbetrieb integriert wird, müssen die menschlichen Verantwortlichen ihre Verantwortlichkeiten entsprechend anpassen.

Was sind Scope-3-Emissionen und wie können Rechenzentren sie angehen?

Anwendung von ML/KI auf Nachhaltigkeitsstrategien

Möglichkeiten, Nachhaltigkeit durch Crowdsourcing realisierbarer zu machen

Sammeln der richtigen DatenSo nutzen Sie KI, um Effizienz zu schaffenWie digitale Partnerschaften Rechenzentrumssysteme optimieren könnenHerausforderungen für die KI-Bereitstellung in RechenzentrenWas Sie als Nächstes lesen sollten: