Auch hier nun zur Information, wir haben seit gestern Abend ca. 22 Uhr massive Probleme, dass mehrere unserer Systeme nicht mehr erreichbar sind.
Das sind vor allem Wolke, Wekan, Wiki, Portal und unsere Website.
Mattermost, Mail, Plenum, Mitgliederanträge und weitere dagegen funktionieren, die ebenfalls auf dem Server laufen, wobei manche von Euch auch dort über Probleme berichten.
Ein Reboot des Servers letzte Nacht hat leider nicht geholfen. Es sieht wohl so aus, als ob es Probleme mit den Zertifikaten und/oder den IPv6 Verbindungen gibt.
Ich kann aktuell nicht sagen, wann diese Systeme wieder zur Verfügung stehen werden.
Ich melde mich wieder, wenn die Systeme wieder erreichbar sind.
Der Marktplatz hier scheint aktuell nicht von dem Problem betroffen zu sein, er läuft aber auch auf einem anderen physischen Server.
soweit ich das sehe wird die Veranstaltung am Donnerstag ja so beworben, dass auf die Webseite verlinkt wird, wo dann die Zugangsdaten zu finden wären. Gibt es schon einen Plan, wie dieser Zugang ohne die Webseite organisiert werden sollte?
Danke für den Hinweis! Ich habe den Link in den sozialen Medien durch den Link auf die Website des LV BaWue ersetzt, auf der die Veranstaltung zum Glück auch beworben wird.
OK. Ich habe nämlich den Facebook-Post vom LV RLP geteilt, da kommt man aber eben auf nicht weiter sondern eine Zertifikatswarnung. Wäre vielleicht auch noch anzupassen.
Inzwischen laufen fast alle Systeme wieder, nur die Website und das in unserer Wolke integrierte OnlyOffice machen noch Probleme. An den verbliebenen Problemen werde ich morgen und am Wochenende dann weiter arbeiten.
evtl. ja, aber ich weiß es nicht wirklich. Die neuen Zertifikate wurden zwar irgendwann auch für die Websites korrekt erstellt, aber dann nicht geladen. Bei vielen anderen Systemen dagegen hat es korrekt funktioniert.
Also habe ich, nachdem fast alle Systeme vorletzte Woche Donnerstag Abend nicht mehr erreichbar waren, angefangen alles nach und nach auf duales IP NAT umzustellen. Von Haus aus macht Docker (unsere Systeme laufen alle in Docker Containern) bei IPv4 automatisch NAT, bei IPv6 aber nicht. Allerdings kann Docker und unser zentraler Webproxy Nginx, der also Frontend vor all unseren Systemen läuft, problemlos IPv6. Daher habe ich wie gesagt nach und nach alle Systeme auf duales IP NAT sowohl für IPv4 als auch für IPv6 umgestellt. Für IPv6 musste dazu aber eine weitere Software installiert werden, die das NAT für IPv6 übernimmt und es so macht, wie es beim IPv4 NAT auch gemacht wird.
Gestern Abend wurden dann als letzte Baustelle endlich auch die Zertifikate der Websites korrekt geladen, aber es wurden weiterhin keine Daten anzeigt, weil der upstream rejected wurde.
Dafür musste ich dann heute noch so einiges anpassen, bis auch endlich die Websites mit Daten anzeigt wurden.
Auch beim Mailing war es ziemlich schwierig, da ging dann zwar relativ schnell das externe Mailing (auch über unseren externen Mail Clients wie Thunderbird , Outlook, etc.), aber unsere Systeme selber (außer dem Marktplatz, der physisch aber auf einem anderen Server läuft) konnten keine Mails mehr versenden. Aber auch dies konnte ich dann gestern endlich lösen, seitdem können unsere Systeme wieder Mails versenden.
Insgesamt hat mich der ganze Spaß nun locker 60 Stunden Aufwand gekostet, die Nächte und die Wochenenden waren sehr kurz. Vor allem da ich letzte Woche ja das Wochenende über in NRW war für die Neugründung des Landesverbands und die Aufstellung der Liste für die Bundestagswahl, also auch dafür noch 10 Stunden auf der Autobahn verbracht habe.
Aber ich habe viel dabei gelernt und kann nun anderen helfen, die ähnliche Probleme bei ihren Setups haben.
Danke für die Beschreibung, ich versteh das schon, wenn ich da auch kein Fachmann bin. Ich hatte ja gesehen, dass das Zertifikat weder neu noch abgelaufen war, was häufig die Ursache für solche Arten von Fehlermeldungen ist. Und mit den Docker Containern sollten ja Versionsprobleme selten sein…
Die fiesen Frage ist jetzt, was hatte sich denn geändert? Gab es ein Update? Hat der Provider sein Routing oder etwas am Netzwerk geändert? Na ja, es läuft jetzt!
Vielen Dank für die viele Arbeit, das dauert in Firmen mit bezahlten Fachleuten schon oft länger!