Allgemeines Fragenthema

Was genau wird eigentlich gerade so schönes gewartet? :) Würde mich interessieren:whistling:
 
Moin,
wir haben gegen 15:43 Uhr heute einen Fehler an einem unserer Hardwareserver verzeichnet. Dort hat der Kernel des Betriebssystems eine der Festplatten komplett ausgelastet, wodurch es wiederum zu einem "Datenstau" auf dem entsprechenden Hardwareserver kam.

Nachdem wir den Fehler ausfindig gemacht haben, haben wir zunächst die Integrität der Datenbanken geprüft. Dort konnten wir glücklicherweise keine Fehler feststellen. Leider konnten auch trotz Bemühungen die Minecraftserver auf dem entsprechenden Server auch die Weltdaten nicht mehr korrekt speichern, weswegen es hier zu korrupten Chunks kam.

Aus diesem Grund arbeiten wir gerade daran, die betroffenen Chunks zu reparieren. Dies ist notwendig, damit wir keine Backups einspielen müssen. Dies dauert jedoch ein bisschen länger, da wir jede Reparatur, die unser Tool durchführt, manuell überprüft werden muss.

UPDATE: Wir konnten alle Probleme lösen, der Server ist wieder an.
Trotzdem kann es sein, dass der Spielfortschritt der letzten Minuten vor dem Abschalten des Servers gegen 16:00 Uhr nicht ganz passend gespeichert wurde. Das betrifft also bspw. euer Inventar, wenn ihr auf dem Server online wart, als der Server ausgeschaltet wurde.
Einige Chunks mussten wir mit Chunks vom Backup heute morgen, 4 Uhr, ersetzen. Wenn auffällt, dass bei eurer Zone Dinge fehlen, die ihr vor 15:30 Uhr verändert habt, oder sollte irgendwas mit eurem Inventar nicht passen, so meldet euch gerne bei einem Teammitglied.
 
Zuletzt bearbeitet:
Wurden das Backup zeitlich verschoben? Sonst war das doch immer 4 Uhr morgens, jetzt kommt er mir mit Backup öfters mal um 7 oder halb 8.
 
Also das ist schon die letzte Zeit öfters vorgekommen. Ich hoffe mal das die Backups sicher erstellt werden. Kann sein das ich mich irre, aber sehr häufig ist der Fehler, seit die Archivements eingeführt worden sind.
 
Also das ist schon die letzte Zeit öfters vorgekommen. Ich hoffe mal das die Backups sicher erstellt werden. Kann sein das ich mich irre, aber sehr häufig ist der Fehler, seit die Archivements eingeführt worden sind.
Solche Störungen beim Backup sind tatsächlich in letzter Zeit ein paar Mal vorgekommen und zwar genau seit wir zwei Maschinen haben statt einer. Dadurch wurde das Backupsystem deutlich komplexer, eben weil wir darauf achten, dass die Backups wirklich absolut sicher erstellt werden und auf beiden Maschinen zueinander passen müssen. Die Ursachen für die Störungen sind - soweit ich das als Nicht-Dev aus den Meldungen sehe - unterschiedlich und werden nach und nach beseitigt, bis auch mit dem neuen System alles rund läuft.
 
Solche Störungen beim Backup sind tatsächlich in letzter Zeit ein paar Mal vorgekommen und zwar genau seit wir zwei Maschinen haben statt einer. Dadurch wurde das Backupsystem deutlich komplexer, eben weil wir darauf achten, dass die Backups wirklich absolut sicher erstellt werden und auf beiden Maschinen zueinander passen müssen. Die Ursachen für die Störungen sind - soweit ich das als Nicht-Dev aus den Meldungen sehe - unterschiedlich und werden nach und nach beseitigt, bis auch mit dem neuen System alles rund läuft.

Auch wenn @Sumpfhytte das hier schon sehr gut dargestellt hat, möchte ich gerne noch ein wenig tiefer darauf eingehen:
Das "Backup" hier ist viel mehr als nur ein Backup: Es geschehen ein Haufen Sachen während der Zeit: Neben dem eigentlichen Daten- und Datenbankbackup können bspw. Updates eingespielt werden und natürlich ist der eigentliche Neustart des Minecraftservers sehr wichtig.
Der ganze Prozess ist komplett automatisiert: So werden bspw. Updates, die Abends eingetragen werden, während des Backups eingespielt, ohne, dass ein Dev wach bleiben muss. Das System ist natürlich darauf ausgelegt, dass alles reibungslos funktioniert und der Prozess quasi abgearbeitet werden kann. In seltenen Fällen kommt es jedoch vor, dass bei einem Schritt des "Backups" von einem Teil des Systems eine ungeplante Rückmeldung erfolgt oder es zu einem Fehler kommt: Je nach dem, wie wichtig der betroffene Schritt dann war, wir der ganze Prozess abgebrochen: Es handelt sich hierbei aber immer um eine Sicherheitsfunktion: Wir möchten bspw. immer garantieren, dass wir ein vollständiges Backup haben und das alle Plugins auf dem Server zueinander passen usw..
Wenn es nun zu so einem Fehler kommt, werden alle Devs sofort mit einer vollständigen Fehlermeldung benachrichtigt (In einigen Fällen hat es mich tatsächlich auch schon direkt geweckt, heute habe ich aber wohl zu tief geschlafen) . Wir kümmern uns dann so schnell wir möglich darum, dass wir den Fehler zu lösen: In den meisten Fällen reicht es, die Vollständigkeit des Prozesses zu prüfen, die Störung zu quittieren und den Server manuell wieder zu starten.

Seit dem letzten Serverumzug mit der Aufteilung auf zwei Maschinen ist das Backupsystem schlagartig deutlich komplexer geworden, da wir im Prinzip jetzt zwei Backups machen müssen. Da man so ein System nur sehr schlecht testen kann, kommt es eben ab und an dazu, dass irgendwas Neues passiert, was im System bisher noch nicht berücksichtigt wurde. Wir können diese Kinderkrankheiten aber so sehr gut beheben und unser System "schlauer" machen, dass es dann später die neuen Rückmeldungen interpretieren kann.
 
Wenn es nun zu so einem Fehler kommt, werden alle Devs sofort mit einer vollständigen Fehlermeldung benachrichtigt (In einigen Fällen hat es mich tatsächlich auch schon direkt geweckt, heute habe ich aber wohl zu tief geschlafen) .
Da hätte ich einen verblüffend einfachen Lösungsvorschlag: Schreib deine Telefonnummer hier rein und stell dasTelefon neben dein Bett. ^^ ;) :D
 

Benutzer, die dieses Thema gerade lesen

  • Endersteve_11
ONLINE 51 Spieler