Posts Tagged “Storage”

Von der Filesystem performance tweaking with XFS on Linux Seite:

The main function of access time logging is to make your filesystem slower. Seriously.

It is common knowledge that old school hackers all have large beards. Alan Cox, RMS and maddog are brilliant examples. The reason for this is that growing a beard is the most interesting use of one’s time when the computer is waiting for fsck to finish messing around after a system crash, and on large filesystems, you’ll have plenty of time to waste (this might also be why there are so few female hackers; they can’t grow beards).)

Was man nicht alles findet, wenn man versucht XFS zu verstehen. ;-)

Comments No Comments »

Drüben beim Jörg:

Comments No Comments »

Es verirren sich immer öfter Leute hierher oder schreiben mir, die nach Informationen zu NetApp und SNMP Abfragen suchen. Um in den NetApp MIBs zu suchen, habe ich schon einmal das Tool Mibble empfohlen. Es ist Java basiert und kann damit quasi überall eingesetzt werden. Sofern Mibble läuft, braucht man nur noch die MIB, die man auf NOW oder im ROOT auf dem Storage Controller findet. (z.B. /vol/vol0/etc/mib/netapp.mib)

mibble-vol-names-index

Frage 1: Wie kann ich per SNMP eine Liste meiner LUNs abfragen?

NETWORK-APPLIANCE-MIB -> VALUES -> netapp -> netapp1 -> blocks -> lun -> lunTable -> lunEntry -> lunName

root@prudence:~# snmpwalk -On -c public -v 2c gundel 1.3.6.1.4.1.789.1.17.15.2.1.2
.1.3.6.1.4.1.789.1.17.15.2.1.2.1 = STRING: “/vol/NFSv4_SF/lunTEST”

Frage 2: Wie kann ich die Temperatur meiner Shelves auslesen?

Da gibt es mehrere Wege. Einer wäre die Temperatur per CLI abzufragen. Der Befehl dazu ist “environment”:

gundel> environment status shelf
[...]
Cooling Unit installed element list: 1, 2; with error: none
Temperature Sensor installed element list: 1, 2, 3; with error: none
Shelf temperatures by element:
[1] 21 C (69 F) (ambient)  Normal temperature range
[2] 24 C (75 F)  Normal temperature range
[3] 24 C (75 F)  Normal temperature range

Die Daten können natürlich auch per SNMP ausgelesen werden, um z.B. eine Überwachung in Nagios zu realisieren:

NETWORK-APPLIANCE-MIB -> VALUES -> netapp -> netapp1 -> storage -> enclosure -> enclTable -> enclEntry -> enclTempSensorsCurrentTemp

root@prudence:~# snmpwalk -On  -c public -v 2c gundel 1.3.6.1.4.1.789.1.21.1.2.1.25
.1.3.6.1.4.1.789.1.21.1.2.1.25.1 = STRING: “30C (86F), 24C (75F), 28C (82F)”
.1.3.6.1.4.1.789.1.21.1.2.1.25.2 = STRING: “21C (69F) ambient, 24C (75F), 24C (75F)”
.1.3.6.1.4.1.789.1.21.1.2.1.25.3 = STRING: “19C (66F) ambient, 28C (82F), 27C (80F)”
.1.3.6.1.4.1.789.1.21.1.2.1.25.4 = STRING: “20C (68F) ambient, 38C (100F), 43C (109F)”
.1.3.6.1.4.1.789.1.21.1.2.1.25.5 = STRING: “23C (73F) ambient, 39C (102F), 37C (98F)”

Frage 3: Wie kann ich per SNMP eine Liste meiner Volumes bekommen?

NETWORK-APPLIANCE-MIB -> VALUES -> netapp -> netapp1 -> filesys -> volTable -> volEntry -> volName

root@prudence:~# snmpwalk -On -c public -v 2c gundel 1.3.6.1.4.1.789.1.5.8.1.2
.1.3.6.1.4.1.789.1.5.8.1.2.1 = STRING: “vol0″
.1.3.6.1.4.1.789.1.5.8.1.2.2 = STRING: “vol1″
.1.3.6.1.4.1.789.1.5.8.1.2.3 = STRING: “sl_vol”
.1.3.6.1.4.1.789.1.5.8.1.2.4 = STRING: “NFSv4_SF”

Comments No Comments »

Beim Fefe:

Die Mail sagt, dass Microsoft Danger gekauft hat, den Hersteller von Sidekick. Die haben sich dann entschieden, deren Infrastruktur einmal physisch in eines ihrer eigenen Datencenter zu schieben, um Mietkosten zu sparen. Die eigentliche Hard- und Software haben sie dabei nicht angefasst, das ist alles noch das alte Zeug. Und am letzten Dienstag, sagt die Mail, hat sich dann deren Storage spontan desintegriert. Da waren 800 TB Daten drauf. Das war ein fettes SAN, dessen Hersteller ich hier mal verschweigen will, aber wenn die Mail stimmt, ist es einer der Marktführer in dem Segment. Natürlich hatte Danger einen dicken Support-Contract mit dem Storage-Vendor. Die waren also ab Dienstag vor Ort. Und das SAN hat beim Sterben auch gleich mal die Parity-Platten zersägt, so dass an sich von Anfang an klar war, dass die Daten futsch sind. Das hat mal eben 800 TB an Daten geshreddert.

Es gab einen Backup, auf ein Off-Site Tape, also die haben sich da schon einmal an die Regeln gehalten, was man so an Vorsichtsmaßnahmen treffen kann für sowas.

Wer 800TB an Daten zur Sicherheit  einzig und allein nur auf Band sichert und im Katastrophenfall auf schnelle Recovery-Zeiten hofft, hat IMHO nichts anderes als Spott verdient. Sorry Microsoft, you are doing it wrong.

Interessant auch, wenn man im Web nach genauen Details zu dem Vorfall sucht: Vorgehensweisen, Hersteller- und sonstige Angaben zur Datenmenge ändern sich von Seite zu Seite. Wer weiß ob die volle Wahrheit jemals publik wird.

Comments No Comments »

Tuesday 27th October / Wednesday 28th October
Congress Frankfurt, Ludwig-Erhard-Anlage 1, 60327 Frankfurt am Main

snw_large

Sessions

Comments No Comments »

Heute: Wenn du ein Problem nicht lösen kannst, erschlage es mit mehr Hardware:

Windows, jetzt auch in SCHNELL! (wtf?)

Comments No Comments »

Ich finds immer wieder witzig zu merken, wie manche Firmen ihre Kunden regelrecht darauf trainieren mit seltsamen Argumenten, deren Richtigkeit man spontan selten überprüfen kann, gegen die direkten Mitbewerber vorzugehen.

Bei mir gibt es heute keine DVD aus der Reserve, sondern den spannenden Streifen ZFS checksum recovery. Popcorn fällt wegen Aufpassen aus. Mission “Gradebiegen von seltsam vermitteltem Gefahrwissen durch Schönwettervertriebler” hat begonnen.

Comments No Comments »

Die Marktschreier einiger Storage Hersteller preisen ‘Thin Provisioning’ über alles in den Himmel. Überbuchen von (nicht vorhandenen) Kapazitäten… da will jeder hin. Ach wirklich? Aus der Reihe nervige Fehlermeldungen zum abgewöhnen:

Warning: Aggregate Almost Overcommitted
Committed 11.4 TB (98.02%) out of 11.7 TB available; Using 10.9 TB (93.22%) out of 11.7 TB available

Ich würde ja verstehen, wenn das Gerät mich davor warnt, wenn ich wirklich etwas überbucht hätte, aber dieses fast, bald oder annähernd überbucht, ist etwas zu viel – zumal der Alarm immer und immer wieder auftaucht bis man die Werte unter einen gewissen Schwellwert drückt. Ja ich weiß, ich mecker zu viel. Entschuldigung!

Comments No Comments »

Eine Mail an NetApp kommt zurück mit:

Wie ironisch. :)

Comments No Comments »

Bei einem Volumen mit 13 Terabyte Gesamtgröße, ist eine Überwachung des Füllstandes mit Default Panik-Alarmen von Nagios bei 80% für Warning (entspricht noch ~2,6Terabyte verfügbarer Platz) und 92% für Critical (entspricht noch ~1 Terabyte verfügbarer Platz)  etwas übertrieben -  es sei denn man erwartet extra rasantes Wachstum.

Wir machen weiter mit Alarm-SMS löschen.

Comments No Comments »