Tag Archives: Storage

pain and thoughts about in-line deduplication

Drüben beim Jörg:

Leserfragen: NetApp und SNMP

Es verirren sich immer öfter Leute hierher oder schreiben mir, die nach Informationen zu NetApp und SNMP Abfragen suchen. Um in den NetApp MIBs zu suchen, habe ich schon einmal das Tool Mibble empfohlen. Es ist Java basiert und kann damit quasi überall eingesetzt werden. Sofern Mibble läuft, braucht man nur noch die MIB, die man auf NOW oder im ROOT auf dem Storage Controller findet. (z.B. /vol/vol0/etc/mib/netapp.mib)

mibble-vol-names-index

Frage 1: Wie kann ich per SNMP eine Liste meiner LUNs abfragen?

NETWORK-APPLIANCE-MIB -> VALUES -> netapp -> netapp1 -> blocks -> lun -> lunTable -> lunEntry -> lunName

root@prudence:~# snmpwalk -On -c public -v 2c gundel 1.3.6.1.4.1.789.1.17.15.2.1.2
.1.3.6.1.4.1.789.1.17.15.2.1.2.1 = STRING: “/vol/NFSv4_SF/lunTEST”

Frage 2: Wie kann ich die Temperatur meiner Shelves auslesen?

Da gibt es mehrere Wege. Einer wäre die Temperatur per CLI abzufragen. Der Befehl dazu ist “environment”:

gundel> environment status shelf
[...]
Cooling Unit installed element list: 1, 2; with error: none
Temperature Sensor installed element list: 1, 2, 3; with error: none
Shelf temperatures by element:
[1] 21 C (69 F) (ambient)  Normal temperature range
[2] 24 C (75 F)  Normal temperature range
[3] 24 C (75 F)  Normal temperature range

Die Daten können natürlich auch per SNMP ausgelesen werden, um z.B. eine Überwachung in Nagios zu realisieren:

NETWORK-APPLIANCE-MIB -> VALUES -> netapp -> netapp1 -> storage -> enclosure -> enclTable -> enclEntry -> enclTempSensorsCurrentTemp

root@prudence:~# snmpwalk -On  -c public -v 2c gundel 1.3.6.1.4.1.789.1.21.1.2.1.25
.1.3.6.1.4.1.789.1.21.1.2.1.25.1 = STRING: “30C (86F), 24C (75F), 28C (82F)”
.1.3.6.1.4.1.789.1.21.1.2.1.25.2 = STRING: “21C (69F) ambient, 24C (75F), 24C (75F)”
.1.3.6.1.4.1.789.1.21.1.2.1.25.3 = STRING: “19C (66F) ambient, 28C (82F), 27C (80F)”
.1.3.6.1.4.1.789.1.21.1.2.1.25.4 = STRING: “20C (68F) ambient, 38C (100F), 43C (109F)”
.1.3.6.1.4.1.789.1.21.1.2.1.25.5 = STRING: “23C (73F) ambient, 39C (102F), 37C (98F)”

Frage 3: Wie kann ich per SNMP eine Liste meiner Volumes bekommen?

NETWORK-APPLIANCE-MIB -> VALUES -> netapp -> netapp1 -> filesys -> volTable -> volEntry -> volName

root@prudence:~# snmpwalk -On -c public -v 2c gundel 1.3.6.1.4.1.789.1.5.8.1.2
.1.3.6.1.4.1.789.1.5.8.1.2.1 = STRING: “vol0″
.1.3.6.1.4.1.789.1.5.8.1.2.2 = STRING: “vol1″
.1.3.6.1.4.1.789.1.5.8.1.2.3 = STRING: “sl_vol”
.1.3.6.1.4.1.789.1.5.8.1.2.4 = STRING: “NFSv4_SF”

You are doing it wrong

Beim Fefe:

Die Mail sagt, dass Microsoft Danger gekauft hat, den Hersteller von Sidekick. Die haben sich dann entschieden, deren Infrastruktur einmal physisch in eines ihrer eigenen Datencenter zu schieben, um Mietkosten zu sparen. Die eigentliche Hard- und Software haben sie dabei nicht angefasst, das ist alles noch das alte Zeug. Und am letzten Dienstag, sagt die Mail, hat sich dann deren Storage spontan desintegriert. Da waren 800 TB Daten drauf. Das war ein fettes SAN, dessen Hersteller ich hier mal verschweigen will, aber wenn die Mail stimmt, ist es einer der Marktführer in dem Segment. Natürlich hatte Danger einen dicken Support-Contract mit dem Storage-Vendor. Die waren also ab Dienstag vor Ort. Und das SAN hat beim Sterben auch gleich mal die Parity-Platten zersägt, so dass an sich von Anfang an klar war, dass die Daten futsch sind. Das hat mal eben 800 TB an Daten geshreddert.

Es gab einen Backup, auf ein Off-Site Tape, also die haben sich da schon einmal an die Regeln gehalten, was man so an Vorsichtsmaßnahmen treffen kann für sowas.

Wer 800TB an Daten zur Sicherheit  einzig und allein nur auf Band sichert und im Katastrophenfall auf schnelle Recovery-Zeiten hofft, hat IMHO nichts anderes als Spott verdient. Sorry Microsoft, you are doing it wrong.

Interessant auch, wenn man im Web nach genauen Details zu dem Vorfall sucht: Vorgehensweisen, Hersteller- und sonstige Angaben zur Datenmenge ändern sich von Seite zu Seite. Wer weiß ob die volle Wahrheit jemals publik wird.

SNWEurope

Tuesday 27th October / Wednesday 28th October
Congress Frankfurt, Ludwig-Erhard-Anlage 1, 60327 Frankfurt am Main

snw_large

Sessions

IT Standardmaßnahmen

Heute: Wenn du ein Problem nicht lösen kannst, erschlage es mit mehr Hardware:

Windows, jetzt auch in SCHNELL! (wtf?)

Webcastmania

Ich finds immer wieder witzig zu merken, wie manche Firmen ihre Kunden regelrecht darauf trainieren mit seltsamen Argumenten, deren Richtigkeit man spontan selten überprüfen kann, gegen die direkten Mitbewerber vorzugehen.

Bei mir gibt es heute keine DVD aus der Reserve, sondern den spannenden Streifen ZFS checksum recovery. Popcorn fällt wegen Aufpassen aus. Mission “Gradebiegen von seltsam vermitteltem Gefahrwissen durch Schönwettervertriebler” hat begonnen.

Fehlermeldungen zum abgewöhnen

Die Marktschreier einiger Storage Hersteller preisen ‘Thin Provisioning’ über alles in den Himmel. Überbuchen von (nicht vorhandenen) Kapazitäten… da will jeder hin. Ach wirklich? Aus der Reihe nervige Fehlermeldungen zum abgewöhnen:

Warning: Aggregate Almost Overcommitted
Committed 11.4 TB (98.02%) out of 11.7 TB available; Using 10.9 TB (93.22%) out of 11.7 TB available

Ich würde ja verstehen, wenn das Gerät mich davor warnt, wenn ich wirklich etwas überbucht hätte, aber dieses fast, bald oder annähernd überbucht, ist etwas zu viel – zumal der Alarm immer und immer wieder auftaucht bis man die Werte unter einen gewissen Schwellwert drückt. Ja ich weiß, ich mecker zu viel. Entschuldigung!

Kein Platz mehr, beim Storage Hersteller

Eine Mail an NetApp kommt zurück mit:

Wie ironisch. :)

Default? Nicht mit mir!

Bei einem Volumen mit 13 Terabyte Gesamtgröße, ist eine Überwachung des Füllstandes mit Default Panik-Alarmen von Nagios bei 80% für Warning (entspricht noch ~2,6Terabyte verfügbarer Platz) und 92% für Critical (entspricht noch ~1 Terabyte verfügbarer Platz)  etwas übertrieben -  es sei denn man erwartet extra rasantes Wachstum.

Wir machen weiter mit Alarm-SMS löschen.

Ist ja auch viel billiger

Als Storage-Admin hat man grundsätzlich ein Problem: Jeder will immer nur haben und haben, aber keiner will etwas dafür bezahlen und schnell genug gehts sowieso nie. Ein typisches “Kunden”-Gespräch sieht in etwa so aus:

Kunde/Kollege: Ich brauch’ Storage, ungefähr Drölf TB!!1
Ich: *schubladeaufmach*, *dummguck* Ja, mmh, hab ich grad nicht.
Kunde/Kollege: Dann mal dir welchen!

Malen? Die Idee ist an sich gar nicht so blöd! :) In Roadrunner-Cartoons funktioniert das schließlich auch immer. Also setzte ich mich hin, malte dem Kollegen MARKEN-Storage und lieferte frei (!) Haus. Vor Ort konfigurierte ich ihm noch einen Ethernet-Port und schon war er zufrieden! Das Gerät ist seit heute Nacht PRODUKTIV im Einsatz und wir haben sogar noch etwas Zaubersalz über.

neuer NetApp Storage erfolgreich installiert

Storage-Administration: kreative und unkomplizierte Lösungen für Jedermann!