Lite struligt


Fick ett antal larm idag med. Det har skett failover medan backupen pågick. Inte bara det, en AG hade tappat kontakten så att status var unkown, det skedde ingen synkning till de andra replikorna.

Men efter en stund såg jag att den fattade att den skulle synka automatiskt så att den kom upp och fick kontakt med de andra replikorna och synkade allt.

Backupjobbet hade blivit klar med just den AG.

Loggade ut och en stund senare fick jag larm på nytt. Backupjobbet hade gått till nästa steg och samma AG hade åter fått status unkown.

Backupsteget skulle ta de backup på de icke AG databaserna.

Loggade på nytt på servern, men det tog tid innan den svarade. Loggade in på en annan server i samma klustrer och startade Failover Cluster Manager. Såg att en role var nere.

Startade rolen och startade om backuptjänsten. Ooops, jag var på fel server och hade startat upp backuptjänsten på fel servern 😦 Nya larm, backupen hade failat på fel server. Klant!

Anslöt till den server som hade strul via tjänster och startade om dennes backuptjänst. Nya larm om att backupjobb hade failat. Men det var det jag ville.

Den felande AG hade nu fått liv.

Såg att den totala backuptiden var mer än 20 minuter än vad det brukar ta och backupen hade ju inte gått klart. Startade backupsteget som jag hade stoppat och det gick klar på 5 minuter (backup + verify).

Kollade status på backup på den server jag av misstag hade stoppat. Den var inte klar med sista databasen än.

Kollade på rollerna i Failover Cluster Manager. Normalt är det failover 2 gånger på 6 timmar (ibland har det stått 1 failover på 6 timmar).

Jag hade tidigare ändrat det värdet till 6 failover på 1 timme. Ändrade det till 20 failover på 1 timme. Det hade strulat på samma kluster igår med, men inte så många gånger att en role hade stannat.

Nu hoppas jag att det backuptjänsten som inte mådde bra, och att det löste sig med omstart. Har inte haft lust och ork att kolla loggarna varken igår kväll eller ikväll! Får kolla det på måndag.

Ändrade antal failover på de andra AG i samma kluster. Så jag får sänka antal failover/timme på måndag med.

Såg att backup hade gått klart på den server jag av misstag hade startat om backuptjänsten. Så jag startade jobbet för den AG jag av misstag kapade grenen den satt på.

Kommentera

Fyll i dina uppgifter nedan eller klicka på en ikon för att logga in:

WordPress.com-logga

Du kommenterar med ditt WordPress.com-konto. Logga ut /  Ändra )

Twitter-bild

Du kommenterar med ditt Twitter-konto. Logga ut /  Ändra )

Facebook-foto

Du kommenterar med ditt Facebook-konto. Logga ut /  Ändra )

Ansluter till %s

Denna webbplats använder Akismet för att minska skräppost. Lär dig om hur din kommentarsdata bearbetas.