Stadtwiki Diskussion:Server: Unterschied zwischen den Versionen

Aus dem Rhein-Neckar-Wiki
Zur Navigation springen Zur Suche springen
(Automatischer Neustart um 5:15 Uhr ... hat geklappt. wieder keine Möglichkeit das Phänomen zu debuggen.)
(Diskussion zu einem Serverausfall von 2013 gelöscht)
Zeile 1: Zeile 1:
Kopiert von http://ka.stadtwiki.net/Diskussion:Rhein-Neckar-Wiki#downtime :


Datenbankserver ist seit Tagen down. Allmende ist auch betroffen. --[[Benutzer:Ikar.us|Ikar.us]] ([[Benutzer Diskussion:Ikar.us|Diskussion]]) 01:38, 17. Dez. 2013 (CET)
: Aktuell geht alles wieder. --[[Benutzer:Mmaddin|mmaddin]] ([[Benutzer Diskussion:Mmaddin|Diskussion]]) 08:39, 17. Dez. 2013 (CET)
:: Ursache: Das Backup-Script, welches zwecks Snapshot das Datenbank-Jail kurz herunter fährt, ZFS-snapshottet und dann neu startet, hatte ein Problem.
:: Das Jail ließ sich zwar beenden, der snapshot wurde auch angelegt, allerdings ließ sich das Jail nicht mehr starten, weil beim Herunterfahren zuvor ein einzelner Prozess (genauer: Eine Referenz auf ein noch offenenes File!) hängen geblieben war und beim Start des Jails dann "läuft schon, kann nicht nochmal starten" kam. Leider ließ sich das Problem manuell nicht nachstellen.
:: Aus diesem Grunde war die Datenbank sowohl Sonntag morgen als auch Montag unten.
:: Ich bin aktuell dabei das MySQL-Jail zu modernisieren, die allermeisten Projekte laufen inzwischen schon auf der neuen DB.
:: Generell: Ich bin in dringenden Fällen per SMS erreichbar und kann das Problem dann normalerweise auch kurzfristig beheben.
:: Ich habe nur nicht die Zeit jeden Tag (seit 8 Jahren) nachzusehen, ob alles läuft. Wer mich hier unterstützen will, z.B. Betrieb eines externen Monitoring-Systems, welches '''auch''' SMS verschicken kann, ... sehr gerne! Ich kann Unterstützung in jedem Fall sehr gut gebrauchen.
:: --[[Benutzer:Rabe|Raphael Eiselstein]] <sup><small>[[Benutzer Diskussion:Rabe|talk]]</small></sup> 10:11, 17. Dez. 2013 (CET)
::: Um die Frage nach "bei mir geht es immer noch nicht" zu beantworten: Ich habe den Inhalt der Datenbank zu einem Zeitpunkt am Dienstag morgen 1:1 auf einer neuen Datenbank eingespielt. Die Daten in der Datenbank sind also vollkommen identisch. Eine andere Veränderung mit Außenwirkung gab es keine.
::: Denkbar ist, dass die Parameter, über die die im Browser ge''cache''ten Daten seitens MediaWiki "kontrolliert" werden auch am konkret konfigurierten Namen des jeweils genutzten Datenbankservers hängt.
::: So etwas ähnliches macht MediaWiki auch bei Cookies, wo es den *Namen* eines Cookies direkt abhängig macht vom Namen des Datenbank-'''Schemas''' under der eingestllten Tabellennamen-Prefixe, hier zB '''rnw_wiki_rnw__session''' direkt aus '''$wgDBname = "rnw_wiki"''' und '''$wgDBprefix = "rnw_";'''
::: Ich will nicht auschließen, dass sich die Konfigurations-Änderung von '''$wgDBserver = "intern.stwserv.de";''' nach '''$wgDBserver = "mysql.stwserv.lan";''' nicht auch zumindest indirekt über die interne Generierung von Hash-Summen z.B. für Cache-Schlüssel dafür gesorgt haben, dass bestimmte im MediaWiki-Cache oder aber auch im Browser-Cache liegende Daten "invalid" geworden sind und die entsprechenden Inhalte neu erzeugt werden müssen (in MediaWiki) oder schlichtweg neu geladen werden müssen (im Webbrowser).
::: Lange Rede, viel Spekulation: Bitte in solchen Fällen die Seite vom Server (nicht vom Cache) neu Laden. Bei vielen Webbrowsern funktioniert das durch gedrückt halten der Shift-Taste während man mit der Maus auf dem "Neu Laden"-Knopf klickt oder aber z.B. F5 (also Shift+F5) drückt.
::: Sollten sich Probleme gar nicht beheben lassen, bitte Screenshot an mich schicken, dann versuche ich das genauer zu analysieren. --[[Benutzer:Rabe|Raphael Eiselstein]] <sup><small>[[Benutzer Diskussion:Rabe|talk]]</small></sup> 05:31, 18. Dez. 2013 (CET)
::::Laien wie ich verstehen das Obige nicht und müssen es auch nicht verstehen. Wir benutzen das Wiki als Black Box. Glücklicherweise tauchen solche Probleme eher selten auf, seltener als z.B. bei meinem E-Mail-Provider. Kämen die Störungen häufig vor, könnte man Neulinge, die nur mal paar Artikel schreiben wollen, kaum beim Projekt halten, wenn sie z.B. aufgefordert werden, den "Cache" zu leeren.
::::Mich würde bei dieser Gelegenheit interessieren, was mal aus den ganzen Dateien würde, falls es mal zum definitiven Zusammenbruch kommt. Anscheinend kann ja die ganze Datenbank kopieren. Kann das auch jemand, der keinen Zugriff auf einen Server hat?  Bei Wikipedia geht das, so viel ich weiß. Also z.B. die Texte für sich selbst retten ggf. ohne die Bilder. Dieselbe Frage wird sich ja eines Tages stellen, wenn das Projekt beendet wird, nichts lebt ewig. Wie groß müsste der Festplattenplatz sein? (bzw. in der Cloud). Das ist nun eine eher langfristige Frage, erwarte keine baldige Antwort. --[[Benutzer:Peewit|Peewit]] ([[Benutzer Diskussion:Peewit|Diskussion]]) 09:43, 18. Dez. 2013 (CET)
:::Denkbar wäre auch, dass nur die Fehlerseite, die mitteilt, dass die Datenbank nicht erreichbar ist, keine brauchbaren Validitätsangaben macht. Und dass verschiedene Browser unterschiedlich damit umgehen. --[[Benutzer:Ikar.us|Ikar.us]] ([[Benutzer Diskussion:Ikar.us|Diskussion]]) 10:52, 18. Dez. 2013 (CET)
A database error has occurred. Did you forget to run maintenance/update.php after upgrading? See: https://www.mediawiki.org/wiki/Manual:Upgrading#Run_the_update_script
Query: SELECT MAX(rc_timestamp) FROM `rnw_recentchanges` LIMIT 1
Function: SpecialRecentChanges::checkLastModified
Error: 1317 Query execution was interrupted (mysql.stwserv.lan)
--01:32, 21. Dez. 2013 (CET)
:: Jaja, ich bin wieder am Datenbankthema dran und musste dazu MySQL ein paarmal neu starten um herauszufinden, unter welchen bedingungen der Neustart von MySQL in die Hose geht. Leider ist der Fehler nicht mehr aufgetreten und das Fehlerbild lässt sich daher nicht weiter analysieren.
:: Gesamtkontext: Automatisches Erzeugen von konsistenten MySQL-Backups mis Hilfe von ZFS-Snapshots in FreeBSD-Jails, siehe dazu meinen Beitrag auf der UUGRN-Mailingliste von gerade eben: http://lists.uugrn.org/uugrn/13/12/16742.html
:: Aktuell ist für täglich morgens um 5:15 Uhr ein automatischer Neustart von MySQL per cron vorgesehen, Downtime (Außenwirkung) sollte dabei unter einer Minute betragen, im Test waren es eben 7 Sekunden. Wir werden morgen früh sehen, ob es jetzt klappt oder ob MySQL dabei wieder stirbt.
:: --[[Benutzer:Rabe|Raphael Eiselstein]] <sup><small>[[Benutzer Diskussion:Rabe|talk]]</small></sup> 02:07, 21. Dez. 2013 (CET)
::: Hat diesmal wohl funktioniert. vermutlich geht es dann wieder schief, wenn ich es nicht aktiv verfolge
<pre>
131221  5:15:00 [Note] /usr/local/libexec/mysqld: Normal shutdown
131221  5:15:00 [Note] Event Scheduler: Purging the queue. 0 events
131221  5:15:00  InnoDB: Starting shutdown...
131221  5:15:01  InnoDB: Shutdown completed; log sequence number 44308253563
131221  5:15:01 [Note] /usr/local/libexec/mysqld: Shutdown complete
131221 05:15:02 mysqld_safe mysqld from pid file /var/db/mysql/mysql.stwserv.de.pid ended
131221 05:15:03 mysqld_safe Starting mysqld daemon with databases from /var/db/mysql
131221  5:15:03 InnoDB: The InnoDB memory heap is disabled
131221  5:15:03 InnoDB: Mutexes and rw_locks use GCC atomic builtins
131221  5:15:03 InnoDB: Compressed tables use zlib 1.2.7
131221  5:15:03 InnoDB: Initializing buffer pool, size = 5.0G
131221  5:15:04 InnoDB: Completed initialization of buffer pool
131221  5:15:04 InnoDB: highest supported file format is Barracuda.
131221  5:15:06  InnoDB: Waiting for the background threads to start
131221  5:15:07 InnoDB: 5.5.30 started; log sequence number 44308253563
131221  5:15:07 [Note] Server hostname (bind-address): '10.253.1.48'; port: 3306
131221  5:15:07 [Note]  - '10.253.1.48' resolves to '10.253.1.48';
131221  5:15:07 [Note] Server socket created on IP: '10.253.1.48'.
131221  5:15:08 [Note] Event Scheduler: Loaded 0 events
131221  5:15:08 [Note] /usr/local/libexec/mysqld: ready for connections.
Version: '5.5.30-log'  socket: '/tmp/mysql.sock'  port: 3306  Source distribution
</pre>
::: Gute Nacht --[[Benutzer:Rabe|Raphael Eiselstein]] <sup><small>[[Benutzer Diskussion:Rabe|talk]]</small></sup> 05:22, 21. Dez. 2013 (CET)

Version vom 22. Februar 2017, 23:49 Uhr