Presentation Transcript
Ausfallsicherheit mit der Oracle DatenbankKlaus-Michael Hatzinger, DBConcepts Ges.m.b.H. :Ausfallsicherheit mit der Oracle DatenbankKlaus-Michael Hatzinger, DBConcepts Ges.m.b.H. Business Breakfast: Schluss mit Zwangspausen!
Agenda :Agenda Hochverfügbarkeit ist ...
Oracle Architekturen für Hochverfügbarkeit
Desaster Recovery im Ernstfall
Online Maintenance
Hochverfügbarkeit ist ... :Hochverfügbarkeit ist ... ...wenn das System möglichst stabil läuft und nie ausfällt
...wenn man Wartungsabschaltungen minimieren kann
... wenn das System verfügbar bleibt, auch wenn typischerweise ein Meteorit im Gebäude einschlägt
Das Firmengebäude könnte dann so aussehen... :Das Firmengebäude könnte dann so aussehen...
Hochverfügbarkeit ist aber auch... :Hochverfügbarkeit ist aber auch... ...optimale Systemperformance
...Sicherheit (System, Daten)
...wenn alle beteiligten Personen (Benutzer, Admins, Techniker, Geschäftsführer, Abteilungsleiter...) möglichst fehlerfrei arbeiten
Was braucht man für Hochverfügbarkeit ? :Was braucht man für Hochverfügbarkeit ? Hochverfügbare Infrastruktur & Hardware (Redundante Komponenten, Cluster,...)
Die richtige Software und Konfiguration
Präventive Wartung (Monitoring)
Notfallpläne (Technisch & Organisatorisch, Checklisten)
Know How !
Und die richtige Balance... :Und die richtige Balance... Was kostet
ein Stillstand ? Was kostet
das HA System ?
Oracle Datenbank Editionen :Oracle Datenbank Editionen Oracle Express Edition (gratis, 1 GB Mem, 4GB, 1 CPU)
Oracle Standard Edition One (max 2 Sockets)
Oracle Standard Edition (max 4 Sockets)
Oracle Enterprise Edition
Enterprise Options
Grid Control
Noch 12 Themen... :Noch 12 Themen...
Oracle Architekturen fürHochverfügbarkeit :Oracle Architekturen fürHochverfügbarkeit
Oracle Failover Cluster (Cold Standby) :Oracle Failover Cluster (Cold Standby) Ein aktiver und ein passiver Server mit gemeinsamen Storage
Im Fehlerfall startet der passive Server die Datenbank vom gemeinsamen Storage und wird somit aktiv
Oracle Failover Cluster - Normalbetrieb :Oracle Failover Cluster - Normalbetrieb Heartbeat Aktiv Passiv Shared Storage
Oracle Failover Cluster - Failoverfall :Oracle Failover Cluster - Failoverfall Heartbeat Defekt Aktiv Shared Storage
Oracle Failover Cluster (Cold Standby) :Oracle Failover Cluster (Cold Standby) Bei Serverausfall übernimmt der zweite Server ohne manuellen Eingriff
Günstige Lösung: Nur der aktive Server muss lizenziert werden (wenn passiver Server <= 10Tage/Jahr aktiv)
Funktioniert auch mit Standard Edition
Erhöhter Zeitaufwand bei Wiederanlauf
Keine Desaster Toleranz
Kompletter Systemausfall bei Storage Problemen
Kein Schutz gegen Benutzerfehler / Datenkorruption
Die Ressourcen des zweiten Servers werden nicht genutzt
Oracle Failover Stretch-Cluster (Cold Standby) :Oracle Failover Stretch-Cluster (Cold Standby) Stretch Cluster arbeiten mit zwei synchron gespiegelten Storages, die mehrere Kilometer Abstand voneinander haben können.
Sicherung gegen lokale Desaster
Stretch Cluster - Normalbetrieb :Stretch Cluster - Normalbetrieb Heartbeat Aktiv Passiv Hardwarespiegelung
Strech Cluster - Failoverfall :Strech Cluster - Failoverfall Heartbeat Defekt Aktiv
Oracle Failover Stretch-Cluster (Cold Standby) :Oracle Failover Stretch-Cluster (Cold Standby) Bei Serverausfall übernimmt der zweite Server ohne manuellen Eingriff
Günstige Lösung: Nur der aktive Server muss lizenziert werden (wenn passiver Server <= 10Tage/Jahr aktiv)
Funktioniert auch mit Standard Edition
Erhöhter Zeitaufwand bei Wiederanlauf
Desaster Toleranz
Kein Schutz gegen Benutzerfehler / Datenkorruption
Die Ressourcen des zweiten Servers werden nicht genutzt
Failover mit Remote Mirroring :Failover mit Remote Mirroring Vom Prinzip her ähnlich Stretch Cluster
Synchron oder asynchrone Spiegelung
Beide Seiten müssen voll lizenziert werden !!
Oracle Physical Standby / Dataguard (EE) :Oracle Physical Standby / Dataguard (EE) Ein (bis max. 9) eigenständiger Standby Server recovered mit den Redo Log Dateien des Produktionsservers
Die Daten sind auf beiden Servern vorhanden
Im Fehlerfall wird die Standby Seite aktiviert
Oracle Physical Standby / Dataguard (EE) :Oracle Physical Standby / Dataguard (EE)
Oracle Physical Standby / Dataguard (EE) :Oracle Physical Standby / Dataguard (EE) Bei Serverausfall kann man auf den zweiten Server umschalten
Schutz gegen Benutzerfehler / Datenkorruption durch Zeitverzögertes Recovery möglich
Desaster Tolerant
Die Durchführung von Backups kann auf den Standby Server verlagert werden
Erhöhter Zeitaufwand bei Wiederanlauf
Beide Seiten müssen voll lizenziert werden
Die Ressourcen des zweiten Servers werden nicht wirklich genutzt
Funktioniert auch mit Standard Edition, allerdings ohne Dataguard => erhöhter Wartungsaufwand & Fehleranfälliger
Oracle Logical Standby mit Dataguard (EE) :Oracle Logical Standby mit Dataguard (EE) Ein eigenständiger Standby Server extrahiert SQL Statements aus Redo Logs des Produktionssystems und führt diese am Standby System aus
Standby System kann Read/Write offen sein
Die Daten sind auf beiden Servern vorhanden
Oracle Logical Standby mit Dataguard (EE) :Oracle Logical Standby mit Dataguard (EE)
Oracle Logical Standby mit Dataguard :Oracle Logical Standby mit Dataguard Bei Serverausfall kann man auf den zweiten Server umschalten
Schutz gegen Benutzerfehler / Datenkorruption durch Zeitverzögertes Recovery möglich
Desaster Tolerant
Die Ressourcen des zweiten Servers können genutzt werden (z.B. Reporting => Entlastung Produktion)
Erhöhter Zeitaufwand bei Wiederanlauf
Beide Seiten müssen voll lizenziert werden
Unterstützt nicht alle Datentypen /Einsatz nicht immer möglich
Oracle11g Active Dataguard (EE-Option) :Oracle11g Active Dataguard (EE-Option) Ist eine Physical Standby Datenbank
Während dem Recovern lesend offen !!
Oracle11g Active Dataguard (EE-Option) :Oracle11g Active Dataguard (EE-Option)
Oracle11g Active Dataguard (EE-Option) :Oracle11g Active Dataguard (EE-Option) Bei Serverausfall kann man auf den zweiten Server umschalten
Schutz gegen Benutzerfehler / Datenkorruption durch Zeitverzögertes Recovery möglich
Desaster Tolerant
Die Ressourcen des zweiten Servers können genutzt werden (z.B. Backup, Reporting => Entlastung Produktion)
Erhöhter Zeitaufwand bei Wiederanlauf
Beide Seiten müssen voll lizenziert werden
Active Dataguard ist eine Enterprise Option und zu lizenzieren
Oracle Real Application Clusters (SE/EE) :Oracle Real Application Clusters (SE/EE) Zwei oder mehrere Server arbeiten aktiv auf gemeinsamen Storage
Im Normalbetrieb verteilt sich die Last über alle Server
Fällt ein Server aus, so übernimmt der/die verbleibende(n) Server die Last
Oracle Real Application Clusters (SE/EE) :Oracle Real Application Clusters (SE/EE) Bei Ausfall eines Servers übernehmen der/die restlichen Server die Arbeit des ausgefallennen Servers
Zeitaufwand bei Wiederanlauf ist praktisch 0
Alle Ressourcen werden optimal genutzt
Skalierbarkeit -> Performance
Desaster Tolerant bei Implementierung als „Stretch RAC“
Kein Schutz gegen Benutzerfehler / Datenkorruption
Alle Server müssen voll lizenziert werden + RAC Options für EE
Oracle Real Application Clusters „Standard Edition“ :Oracle Real Application Clusters „Standard Edition“ Günstigste RAC Lösung
Bis zu maximal 4 Sockets einsetzbar (2 x 2)
RAC Options bei Standard Edition bereits inklusive
Keine weitere Skalierbarkeit
Cluster Ready Services & ASM muss eingesetzt werden (kein 3rd Party Produkt erlaubt)
Downtime / Oracle Technologie :Downtime / Oracle Technologie
Nur noch 2 Themen... :Nur noch 2 Themen...
Desaster Recovery im Ernstfall... :Desaster Recovery im Ernstfall... Recovery Zeit sollte möglichst kurz sein
Wahl der richtigen Backup/Recovery Strategie
Technische und organisatorische Planung für Desaster Recovery => Checkliste DRP + MTTR
Regelmäßige Überprüfung der Strategie
Einsatz des richtigen Werkzeugs: Oracle Recovery Manager (RMAN) / Fast Recovery
Online Maintenance :Online Maintenance Geplante Downtimes durch Online Maintenance minimieren
Oracle bietet dazu einige Features an...
Online Maintenance :Online Maintenance Online Reorganisation (EE)
Daten im laufenden Betrieb reorganisieren
Online Redefinition (EE)
Änderung von Datenstrukturen im laufenden Betrieb
Änderung von Partitionierungen
Online Reconfiguration (SE/EE)
Änderung von Datenbankparametern (z.B. SGA) im laufenden Betrieb ohne Neustart
Online Maintenance :Online Maintenance Rolling Patch Updates (EE)
Patchen im laufenden Betrieb
Rolling Release Upgrades (EE)
Release Upgrades im laufenden Betrieb
Downtime / Oracle Technologie :Downtime / Oracle Technologie
Vielen Dank :Vielen Dank