
HP má v serverech kurvítko
Hewlett Packard Enterprise upozorňuje, že vlivem chyby začnou v říjnu odcházet některé disky v serverech. Bug ve firmwaru způsobuje, že SAS SSD disky začnou kolabovat po 40 tisících hodinách chodu. K dispozici je patch. Více to rozebírá ZDNet.
Nic v zlom voci beznej praxi, ale nikdy som nebol zastanca predrazenych enterprise diskov do serverov. Kupim 5-7x lacnejse najlepsie bezne ssdisky a menim za chodu ak nieco odide, aj tak je vsade Raid5, 50, ci 60. Pre istotu skombinujem viacere znacky, ak by mala nejaka problem s fw a mam za zlomok ceny riesenie na urovni enterprise.
Rozumím tomu pohledu na cenu, ale úplně bych to nezjednodušoval. Enterprise SSD nejsou drahé jen kvůli značce – často mají lepší řízení zápisů, vyšší TBW, konzistentnější latence a hlavně dlouhodobou podporu FW od výrobce. Tenhle konkrétní průšvih je spíš ukázka toho, že i „enterprise“ řešení potřebuje pravidelný FW management, ne že by samotný koncept byl špatně.
Model „levná SSD + RAID“ funguje, ale má svá rizika:
U RAID5/50 je rebuild na velkých discích dlouhý a další výpadek už může bolet.
Běžná SSD často nemají ochranu proti výpadku napájení (PLP), což u serverů není detail.
Smíchané značky můžou pomoct proti FW bugu, ale zase komplikují správu a chování pole.
Ideál je podle mě kompromis: vědět, co přesně v serveru běží, hlídat firmware (a u HPE/Dellu fakt patchovat včas), a zvolit úložiště podle workloadu. Na kritická data enterprise SSD dávají smysl, na méně citlivé věci klidně levnější disky – ale s vědomím jejich limitů. check https://www.justaskgenie.co.uk/