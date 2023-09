Moderne Enterprise-Festplatten sind für Betriebstemperaturen zwischen 5 und 60 Grad Celsius ausgelegt. Dennoch sollten sie nicht dauerhaft am oberen Ende dieses Bereichs betrieben werden. Wer das tut, riskiert höhere Ausfallraten. Es gilt also, HDD-Temperaturen kontinuierlich zu überwachen und auf eine durchschnittliche Betriebstemperatur von rund 40 Grad Celsius zu achten. Aber was bedeutet eigentlich durchschnittlich: Lassen sich höhere Temperaturen später durch niedrigere wieder ausgleichen?

Wie die meisten Komponenten in Servern und Storage-Systemen werden Festplatten im Betrieb wärmer, insbesondere bei starker Belastung. Damit Administratoren die Temperatur ihrer Laufwerke überwachen können, besitzen moderne HDDs einen internen Temperatursensor, der seine Messwerte via SMART (Self-Monitoring Analysis and Reporting Technology) bereitstellt, sodass sie sich mit Bordmitteln des Betriebssystems, Systemmanagement-Tools oder den Werkzeugen zur Verwaltung von RAID-Controllern und Host-Bus-Adaptern auslesen lassen. Darüber hinaus existieren für diese Aufgabe zahlreiche spezialisierte Tools wie das unter Open-Source-Lizenz stehende smartmontools, das sowohl für Windows als auch Linux verfügbar ist.

Werden Festplatten zu heiß, arbeiten sie nicht mehr korrekt, weil die elektronischen und mechanischen Komponenten nur in einem bestimmten Temperaturbereich korrekt funktionieren. Zudem verschleißen die mechanischen Bauteile schneller, wodurch Zuverlässigkeit und Lebensdauer sinken. Vor allem das Lager der Spindel mit den Platten ist gefährdet, da bei großer Hitze das als Schmiermittel verwendete Öl zu flüssig wird und aus dem Lager austreten kann. Die Überwachung der Festplattentemperatur ist daher unbedingt notwendig, um eine Überhitzung zu verhindern und sicherzustellen, dass die Laufwerke lange und zuverlässig funktionieren.

Welche Temperatur ist optimal?

Die Hersteller von Festplatten geben üblicherweise einen Temperaturbereich an, in dem ihre Laufwerke korrekt arbeiten. Bei Enterprise-HDDs gehen sie von einem Einsatz in klimatisierten Serverräumen oder Rechenzentren aus, weshalb solche Modelle für Betriebstemperaturen zwischen 5 und 60 Grad Celsius ausgelegt sind. NAS-HDDs sind für 5 bis 65 und Surveillance-HDDs sogar für 0 bis 70 Grad Celsius spezifiziert, weil Systeme für die Videoüberwachung nicht immer in Räumlichkeiten mit stabilen Umgebungsbedingungen stehen.

Allerdings geht es bei diesen Angaben tatsächlich nur um die Funktionsfähigkeit – die Langlebigkeit leidet durchaus, wenn Laufwerke längere Zeit im oberen Temperaturbereichs laufen. Ein kurzzeitiger Temperaturanstieg, wenn im System beispielsweise ein Lüfter ausgefallen ist und ausgetauscht werden muss, ist in der Regel zu verschmerzen, doch schon ein dauerhafter Betrieb bei 45 Grad Celsius kann die Festplatten einige Monate an Lebenszeit kosten. Schließlich beziehen sich die Angaben zur Mean Time To Failure (MTTF) in den Datenblättern der Hersteller stets auf eine durchschnittliche Betriebstemperatur von 40 Grad Celsius.

Interessant dabei: Durchschnittlich heißt tatsächlich, dass sich Betriebszeiten mit mehr als 40 Grad Celsius später durch Betriebszeiten mit entsprechend niedrigerer Temperatur wieder ausgleichen lassen. In der Praxis dürfte es aber ausgesprochen selten vorkommen, dass HDDs erst Monate oder Jahre bei hohen Temperaturen verbringen und anschließend denselben Zeitraum bei niedrigeren.

Die Temperatur steigt, die Zuverlässigkeit sinkt

Eine typische Enterprise-HDD hat eine MTTF von zweieinhalb Millionen Stunden. Bei zweieinhalb Millionen Laufwerken wäre somit ein Ausfall pro Stunde zu erwarten oder bei 1000 Laufwerken ein Ausfall alle 2500 Stunden. Da diese Angaben nicht besonders intuitiv sind, um die Ausfallwahrscheinlichkeit von Festplatten innerhalb der eigenen Infrastruktur einzuschätzen, wird meist mit der jährlichen Ausfallrate (AFR) gearbeitet, die sich aus der MTTF berechnen lässt. Die Formel dafür lautet: AFR = 1-e(-8.760/MTTF)*100, wobei 8760 die jährlichen Betriebsstunden bei einem für Enterprise-HDDs üblichen 24/7-Betrieb sind.

In dieser Formel werden die bereits ausgefallenen Laufwerke bei der Berechnung der AFR für die verbleibenden Laufwerke berücksichtigt. Das ist bei niedrigen Ausfallraten, wie Festplatten sie aufweisen, jedoch nicht notwendig, sodass sich die die Formel vereinfachen lässt: AFR = 8760/MTTF*100. Für Enterprise-HDDs mit einer MTTF von 2,5 Millionen Stunden ergibt sich also eine AFR von 0,35 Prozent. Beim Einsatz von 1000 Laufwerken wäre innerhalb eines Jahres mit drei bis vier Ausfällen zu rechnen.

Liegt die durchschnittliche Betriebstemperatur der Festplatten über 40 Grad Celsius, steigt die Ausfallrate. Als Faustformel gilt, dass pro 5 Grad Celsius über 40 Grad Celsius die Ausfallrate um 30 Prozent ansteigen kann. Bei einer dauerhaften Festplattentemperatur von 55 Grad Celsius dürfte sich die AFR ungefähr verdoppeln, sodass bei einer installierten Basis von 1000 Laufwerken ein Ausfall von sechs bis acht HDDs pro Jahr wahrscheinlich wäre.

Neben der Temperatur beeinflussen noch andere Faktoren die Langlebigkeit von Festplatten, darunter die jährliche Arbeitslast (Rated Workload), die Garantiezeit und – im Falle von Laufwerken, die nicht für den 24/7-Einsatz ausgelegt sind – die Betriebsdauer. Werden die spezifizierten Werte nicht eingehalten, oder wird die HDD nach Ablauf der Garantiezeit weiter betrieben, droht zwar keineswegs sofort ein Ausfall, doch die AFR steigt, sodass im Laufe der Zeit mehr als die erwartete HDD-Anzahl pro Jahr den Dienst versagt.

Thermisches Design und Kühlkonzept müssen stimmen

In thermisch gut designten Systemen, die in klimatisierten Räumlichkeiten untergebracht sind, sollte es normalerweise kein Problem sein, die Festplattentemperatur bei 40 Grad Celsius oder darunter zu halten. Ohne Klimatisierung kann es hingegen schwer werden, da in den Sommermonaten auch in Deutschland die Temperatur in Räumen häufig über 30 Grad Celsius liegt – im Inneren von Servern und Storage-Systemen sind dann schnell mehr als 40 Grad Celsius erreicht. Zudem lässt sich die warme Abluft der Systeme ohne geeignete Lüftung nur schwer abtransportieren, sodass die Raumtemperatur unweigerlich steigt und sich in der Folge die Systeme immer weiter aufheizen.

Besser ist es daher, Server- und Storage-Systeme immer in klimatisierter Umgebung zu betreiben – insbesondere, wenn Top-Loader mit mehreren Dutzend HDDs zum Einsatz kommen. Bei diesen werden die hinteren Platten konstruktionsbedingt wärmer als die vorderen, weil der Luftstrom zunächst die Wärme der vorderen Laufwerke aufnimmt und die hinteren deshalb nicht mehr ganz so effektiv zu kühlen vermag. Notwendig sind hier Lufteintrittstemperaturen von weniger als 20 Grad Celsius, damit die HDDs in den hinteren Reihen konstant unter 40 Grad Celsius bleiben.

Liegt die Festplattentemperatur dauerhaft mehr als 15 Grad Celsius über der Lufteintritts- oder Umgebungstemperatur, stimmt etwas mit dem thermischen Design des Systems nicht. In diesem Fall sollten Administratoren überprüfen, ob die Lüfter richtig arbeiten und ob der Luftstrom die Laufwerke ungehindert erreicht. Zudem sollte der Raum natürlich insgesamt so gestaltet sein, dass sich kalte und warme Luft nicht vermischen, weil das die Kühleffizienz reduziert. Deshalb werden Racks in der Regel so gestellt, dass sie sich gegenüberstehen. Die kühlende Luft wird in der Mitte zugeführt, wo sie auf die Front der Geräte trifft und eingesaugt wird, um die Systemkomponenten zu kühlen. Dabei nimmt sie Wärme auf und tritt schließlich an der Rückseite der Geräte wieder aus, wo sie mit Ventilatoren abtransportiert wird. Blenden an leeren Einschüben verhindern dabei, dass die warme Abluft zurück in den sogenannten Kaltgang strömt.

Fazit

Damit Festplatten korrekt funktionieren und möglichst lange halten, müssen Administratoren deren Betriebstemperaturen kontinuierlich überwachen. Auch wenn Enterprise-Laufwerke für bis zu 60 Grad Celsius ausgelegt sind, gilt es, diesen Maximalwert unbedingt zu vermeiden. Ideal ist ein Betrieb bei durchschnittlich nicht mehr als 40 Grad Celsius. Dass diese Temperatur nicht überschritten wird, hängt vornehmlich vom thermischen Design des Systems und dem Kühlkonzept des Raumes ab, in dem das System untergebracht ist.

ln/Rainer W. Kaese, Senior Manager Business Development Storage Products bei Toshiba Electronics Europe