Posts Tagged‘ausfall’

Backbone-GAU bei Init7

Ein Ausfall im Backbone des Zürcher Providers Init7 liess heute zwischen 12 und 17 Uhr zahlreiche Blogs, Homepages und Hoster aus dem Internet verschwinden. Betroffen waren beispielsweise die Hoster cyon (wo auch BloggingTom gehostet wird) und rubas.net, die Startups Amazee und Collanos, aber auch Blogwerk mit seinen Blogs wie neuerdings.com oder medienlese.com.

Durch den Totalausfall gestaltete sich die Suche nach den Ursachen schwierig, denn selbst die Homepage von Init7 war nicht mehr erreichbar. Und als sie wieder erreichbar war, waren ausser einem „At the moment we record no outage“ keine aktuellen Informationen zum Netzwerkstatus verfügbar. Erst rund vier Stunden nach dem Ausfall erschienen dann die ersten kurzen Infos:

Init7 Support-Ticket: Outage

Das Problem bei solchen Ausfällen ist natürlich die Information der Kunden, denn wenn die eigene Infrastruktur keine Internetverbindung hat, wirds schwierig. cyon-Chef David Burkardt hingegen machte schon bald via Twitter auf die Problemquelle aufmerksam:

Init7-Fail bei cyon.ch

Als Grund für den Ausfall nennt Init7 in einem an die Kunden des Colocation-Center Layer One gerichteten eMail übrigens „menschliches Versagen“:

Aufgrund einer Fehlkonfiguration auf einem userer Router, hat es eine unglückliche Verkettung von Umständen im Backbone gegeben. Dies führte zu erheblichen Verbindungsproblemen und verschiedene Kunden waren durch den Ausfall betroffen.

cyon nahm den heutigen Ausfall jedenfalls zum Anlass, nicht nur einen Twitter-Account für Netz-Statusmeldungen anzulegen, sondern auch um die Anbindung via Multihoming in der Prioritätenliste wieder ganz nach oben zu schieben. Gemäss David Burkardt darf denn auch spätestens ab Sommer 2009 mit einer Anbindung der cyon-Infrastruktur an zwei Provider gerechnet werden.

Klar, der heutige Ausfall war eine nervige Sache. Es liegt allerdings in der Natur der Sache, dass kein Provider einen 100-prozentigen Service garantieren kann. Insofern muss man bei jedem Provider mit Ausfällen leben. Wer nun trotzdem lamentiert, sollte sich vielleicht auch einmal fragen, ob es seinem Provider mit dem wenigen Geld, das fürs Hosting bezahlt wird, überhaupt möglich ist, Ausfallsicherheit zu garantieren. Und sonst bleibt nur: Geld in die Hand nehmen und selber hosten. Init7 hat ja die entsprechenden Produkte im Angebot, wie Fredy Künzler gegenüber inside-it.ch betonte…

Weitere Infos zum Thema:

Orange (mal wieder) offline

Seit gestern nachmittag sind die Schweizer Webseiten des Telco-Anbieters Orange nicht mehr erreichbar. Andere Server von Orange, wie beispielsweise img.orange.ch oder orangeclick.ch sind allerdings weiterhin erreichbar, so dass das Problem wohl beim Webserver selber zu suchen ist. Orange hält sich dazu allerdings bislang bedeckt. Zumindest konnte ich bisher keine Mitteilung von Orange zum Thema finden.

Ausfälle gab es bei Orange ja bereits früher, allerdings waren diese wohl jeweils geplant (auch wenn ich noch immer nicht verstehen kann, wie man einen Onlineshop für vier Tage schliessen kann).

[Update] 07:00 Uhr
Auch persoenlich.com zählt seit ca. 3.30 Uhr zur Liste der nicht erreichbaren. Heute scheint wirklich der Wurm drin zu sein…

[Update] 08:15 Uhr
persoenlich.com ist nun wieder da…

[Update] 08:36 Uhr
Nun ist auch Orange wieder online. Allerdings handelte es sich beim Problem wohl um ein Routingproblem, denn via Tele2 war die Website offenbar stets erreichbar.

[Update] 12:05 Uhr
Wie Orange-Pressesprecherin Therese Wenger gegenüber Radio Zürisee bestätigt hat, wurde die Webseite Opfer von DoS-Attacken.

(via Mail, danke blomus.)

Totalausfall beim Hoster mhs

Der Webhoster mhs@internet kämpfte seit gestern Abend bis kurz vor heute 14 Uhr mit einem Ausfall seiner gesamten Infrastruktur. Dadurch waren die Firmenwebseite sowie Hunderte von Kunden-Websites nicht mehr erreichbar. Gemäss InfoWeek soll der Komplettausfall an einer Störung in der „Hauptverbindung zwischen Cablecom und Swisscom im Raum St. Gallen“ gelegen haben.
In einer ersten Stellungnahme erklärt mhs-Geschäftsführer Matthias Hertzog den GAU wie folgt:

Der Grund liegt in einer defekten Swisscom Backbone-Leitung zwischen St. Gallen und Zürich. Die mhs @ internet AG ist über 5 getrennte, redundante Leitungen mit dem Backbone verbunden, leider war aber seitens Swisscom der komplette Backbone offline.
[…]
Alle bei der mhs@internet AG getroffenen Vorsichtsmassnahmen sind bei dieser Grossstörung seitens Cablecom/Swisscom „ausgehebelt“ worden.

Die mhs@internet AG ist stets bemüht, hochverfügbare Services anzubieten. Uns wurde heute Morgen schmerzlich vor Augen geführt, dass eine 5-fache Leitungsredundanz in der heutigen Zeit nicht mehr ausreicht. Aus diesem Grund werden wir die notwendigen Schritte einleiten, um eine noch höhere Unabhängigkeit von Swisscom zu erreichen und damit solche Fälle besser abfedern zu können.

Genau die Frage nach der Redundanz stellt sich auch mir, denn mhs preist Ihre Hosting-Angebote unter andem mit „Redundante Internet-Anbindung über mehrere Carrier“ an und erklärt das ganze beim Housing-Angebot noch genauer:

Der Anschluss ans Internet erfolgt über alle bei mhs@internet verfügbaren Carriern mittels BGP4-Routing und zielorientiertem Load-Balancing. Der Ausfall einer Leitung hat im Extremfall lediglich Geschwindigkeitseinbussen zur Folge, das System bleibt aber erreichbar.

Offenbar besteht die Redundanz bei mhs aber „nur“ darin, fünf unabhängige Verbindungen zum eigentlichen Backbone zu betreiben, nicht aber, eine unabhängige Verbindung zu einem zweiten Internet-Backbone zu haben. Redundanz habe ich aber bisher so verstanden, dass ein Backbone Carrier komplett ausfallen kann und die Connectivity trotzdem gewährleistet bleibt. Seh‘ ich das falsch? Irgendwelche Profis hier, die das beantworten können?

Eine Stellungnahme von Swisscom zur Ursache des Backbone-Unterbruchs wurde mir auf den späten Nachmittag versprochen. Sobald diese eintrifft, werde ich diese als Update in diesem Post publizieren.

Weitere Blogs zum Thema:

[Update] 17:36 Uhr
Gemäss Auskunft von Herrn Frei von Swisscom Media Relations bestand tatsächlich ein Problem mit einer 34 Mbit-Leitung im Raum St. Gallen. Die Leitung habe einen ungenügenden Durchsatz gezeigt, ist also nicht vollständig unterbrochen worden. Man legt aber Wert auf die Tatsache, dass die Leitung zwar der Swisscom gehört, jedoch von Cablecom gemietet ist. Demzufolge habe man auch nur beschränkte Eingriffsmöglichkeiten, da jegliche weitere Geräte, die für die Störung in Frage kämen, nicht zur Swisscom gehören, sondern von Cablecom gestellt werden. Ebenfalls sei man bei der Störungssuche von der Cablecom etwas zurückgebunden worden, wohl um einem Totalausfall vorzubeugen. Die Leitung funktioniere nun zwar wieder einwandfrei, eine Ursache konnte bis jetzt jedoch auf Seiten der Swisscom nicht gefunden werden. Im Rahmen eines normalen „Wartungsfensters“ werde man die Leitung dann nochmals genau ausmessen um der Störung allenfalls auf die Spur zu kommen.

Ping-O-Matic ausgefallen

Der Ping-Service Ping-O-Matic kämpft seit Tagen mit Problemen, denn weder die Homepage noch der eigentliche Ping-Server ist erreichbar. Lediglich das Blog ist erreichbar, allerdings stammt der letzte Post vom 30. April 2006.

Was also ist los? Scheinbar ist der Ausfall bisher auch klanglos an Bloggersdorf vorbeigegangen, denn bisher konnte ich nur zwei Posts („Ping-O-Matic Almost Unpingable“ und „Pingomatic offline„) zum Ausfall finden, was zumindest deshalb erstaunt, weil Ping-O-Matic standardmässig bei allen WordPress-Installationen eingetragen ist.

Für Abhilfe gesorgt habe ich mit der Funktion PingShot von Feedburner, welcher nun die wichtigsten Services anpingt. Voraussetzung dafür ist natürlich ein Account bei Feedburner. Für all diejenigen, die den Service nicht nutzen, gibt es ja diverse andere Ping-Dienste (BlogFlux Pinger oder Pingoat um nur zwei zu nennen) um für Abhilfe zu sorgen. Und für alle die bis zum Exzess pingen wollen, hat Elliott eine Liste mit 56 Ping-Diensten zusammengestellt. Allerdings halte ich es nicht für sinnvoll, all die aufgeführten Dienste anzupingen.

coComment Ausfall

coComment

Bis vor wenigen Minuten war coComment, ein Dienst zur Diskussionsverfolgung in Blogs unerreichbar. Aufgefallen ist mir das, weil der Seitenaufbau auf Websites mit eingebautem coComment-Code ziemlich verlangsamt wurde.

Der Grund für den Ausfall dürfte aber nicht bei coComment selber gelegen haben, sondern beim Registrar Joker.com, bei welchem die Domain registriert ist. Die für die Domain cocomment.com eingetragenen Nameserver, allesamt von Joker.com, lösten nämlich in den letzten Stunden keinerlei Domainnamen auf, so dass neben coComment wohl noch einige andere Domains nicht erreichbar waren.

Aber derzeit scheint die Namensauflösung, wenn auch etwas wacklig, wieder zu funktionieren.

Einmal mehr: Hoster-Probleme

Wie beim Leumund zu lesen ist, sind die Kunden-Websites des Billighoster hotspace.ch wegen einer Hardware-Panne seit rund 32 Stunden nicht erreichbar. Hoster-Ausfälle sind in den letzten Wochen in der Schweiz (leider) öfters vorgekommen, doch der Kommunikationsstil von HotSpace.ch ist im Vergleich mit den früher betroffenen Hostern ziemlich ungewohnt:

Leider können wir immer noch nicht voraussagen, wann wir endlich wieder ein funktionierendes System haben. Wir können jedoch leider nicht davon ausgehen, dass das heute noch der Fall sein wird.
Wir können Ihren grossen Ärger, Ihre Enttäuschung und Ihren Frust sehr gut nachvollziehen, doch glauben Sie uns, uns trifft solch ein Ausfall mindestens so hart, wie er Sie trifft.
Um Ihre Offlinezeit möglichst gering zu halten, bleibt uns leider nichts anderes übrig, als Ihnen einen Providerwechsel zu empfehlen.

Gerade Reseller (Wiederverkäufer) wie HotSpace haben bei Pannen ein Problem: Da die Infrastruktur nur gemietet ist, können sie auch keine Hand anlegen um das Problem zu beseitigen. Man ist via eMail oder Telefon auf den Support des effektiven Hosters angewiesen, und das kann durchaus dauern. Reseller die ihre Kapazitäten in den USA anmieten, haben dazu noch das Problem der Zeitverschiebung.

Wie das bei HotSpace genau aussieht, vermag ich nicht zu sagen. Gemäss HotSpace stehen die Server „in verschiedenen Rechenzentren in Deutschland und in der Schweiz“. Klar ist jedoch, dass ein Traceroute zu hotspace.ch in die USA zu NetSonic führt. Allerdings ist die dort gezeigt Seite nur ein Frameset, der eigentliche Inhalt [PDF] kommt von einem Cablecom-Hosting. Ein Traceroute zu Killerkitty, welcher ebenfalls vom Ausfall betroffen ist, zeigt jedoch zu Hetzner nach Deutschland. Interessant aber die Aussage von HotSpace:

Die Server stehen in verschiedenen Rechenzentren, weil auf diese Weise ein kompletter Ausfall verhindert werden kann.

ist auf den Technik-Seiten zu lesen (PDF, via WebArchive). Die Verteilung hat damit, wenn es denn den Tatsachen entspricht, offenbar nicht den gewünschten Effekt gehabt.

Fredy Künzler äusserte sich Anfang Jahr zum Billig-Hosting wie folgt:

Zudem muss man den 9-Franken-90 Hosting Kunden wieder mal in Erinnerung rufen, was Sie für CHF 9.90 eigentlich erwarten können. Zwei Biere? Ein Sandwich und eine Cola? Nicht mal einen ZVV 9-Uhr Pass mit Halbtaxabo kriegt man dafür.

Und damit hat Fredy, auch wenn das viele nicht einsehen wollen, recht: Nicht nur, aber gerade bei „9-Franken-90-Hostern“, die über keine eigene Infrastruktur verfügen, muss man mit solchen längeren Ausfällen rechnen, da diese, wie oben erwähnt, keinerlei Möglichkeiten haben, selbst auf den Ausfall zu reagieren. Und Hotspace zähle ich aufgrund der publizierten Angebote [PDF der Homepage] sicherlich zu den Billighostern, schliesslich kostete das teuerste Angebot nur gerade 8 Franken pro Monat…