Bei Oracle Datenbanken werden viele Log-Files, Trace-Files, Audit-Files etc. erzeugt, die an unterschiedlichen Orten im Dateisystem und in der Datenbank gespeichert werden.
Bereits seit Oracle 11g gibt es den Parameter diagnostic_dest, der den Pfad angibt, wo die Trace-Files, Log-Files, das Alertlog, etc. abgelegt werden. Dieser Parameter zeigt auf den zentralen Ort, in dem alle Information zusammengefasst werden: das Diagnostic Repository.
Oracle stellt ein leistungsfähiges Tool zur Verfügung, das neben Dateien löschen, bei auftretenden ORA-Fehlern auch zugeordnete Incidents und Problems darstellen kann. Außerdem können Sie mit diesem Tool alle notwendigen Files für den Oracle Support komfortabel zusammenstellen und zippen, das Alertlog anzeigen, sowie Trace-Dateien im laufenden Betrieb löschen. In diesem Monatstipp wird nun näher beleuchtet, wie aufgetretene Incidents (Vorfälle) und Problems (Probleme) ermittelt und die zugehörigen Counter zurückgesetzt werden können. Die Informationsquelle für die aufgetretenen Problems und Incidents stellt die Tabelle V$DIAG_INFO dar.
Erster Schritt
Über die Tabelle V$DIAG_INFO ermitteln wir zunächst die Anzahl der aufgetretenen Probleme und Incidents:
SQL> select name,value from v$diag_info;
NAME VALUE
--------------------- --------------------------------------------
Diag Enabled TRUE
ADR Base D:\APP\ROLAND
ADR Home D:\oracle\diag\rdbms\o19c\o19c
Diag Trace D:\oracle\diag\rdbms\o19c\o19c\trace
Diag Alert D:\oracle\diag\rdbms\o19c\o19c\alert
Diag Incident D:\oracle\diag\rdbms\o19c\o19c\incident
Diag Cdump D:\oracle\diag\rdbms\o19c\o19c\cdump
Health Monitor D:\oracle\diag\rdbms\o19c\o19c\hm
Default Trace File
D:\oracle\diag\rdbms\o19c\o19c\trace\o19c_ora_9620.trc
Active Problem Count 2
Active Incident Count 2
Um die zugrundeliegenden Problems bzw. Incidents genauer zu analysieren, wird der Automatic Diagnostic Report Command
Interpreter [ADRCI] auf OS-Ebene aufgerufen.
Zweiter Schritt - Aufruf des ADRCI auf Betriebssystem-Ebene
C:\Windows\System32>adrci
ADRCI: Release 12.2.0.1.0 - Production on Mo Jun 26 11:11:12 2017
Copyright (c) 1982, 2017, Oracle and/or its affiliates. All rights reserved.
ADR base = "D:\app\roland"
adrci>
Die Ausgabe oben zeigt das per Default gesetzte ADR BASE an. Durch Aufruf der Tool-Hilfe mittels help können Sie sich weitere Informationen anzeigen lassen.
Der Output sieht dann folgendermaßen aus:
adrci> help
HELP [topic]
Available Topics:
CREATE REPORT
ECHO
ESTIMATE
EXIT
HELP
HOST
IPS
PURGE
RUN
SELECT
SET BASE
SET BROWSER
SET CONTROL
SET ECHO
SET EDITOR
SET HOMES | HOME | HOMEPATH
SET TERMOUT
SHOW ALERT
SHOW BASE
SHOW CONTROL
SHOW HM_RUN
SHOW HOMES | HOME | HOMEPATH
SHOW INCDIR
SHOW INCIDENT
SHOW LOG
SHOW PROBLEM
SHOW REPORT
SHOW TRACEFILE
SPOOL
There are other commands intended to be used directly by Oracle, type
"HELP EXTENDED" to see the list
Dritter Schritt - ADRCI-Homes anzeigen und setzen
Um das korrekte ADRCI-Home anzuzeigen, lassen wir uns alle verfügbaren ADRCI-Homes mit dem Befehl show homes auflisten.
adrci> show homes
ADR Homes:
diag\clients\user_roland\host_1513561619_107
diag\clients\user_roland\host_1513561619_82
diag\clients\user_SYSTEM\host_1513561619_107
diag\clients\user_SYSTEM\host_1513561619_82
diag\rdbms\o12c\o12c
diag\rdbms\o12c2\o12c2
diag\tnslsnr\Host02\listener
diag\tnslsnr\Host02\listener_o12c2
adrci>
Setzen Sie dann per set Befehl das richtige ADRCI-HOME:
adrci> set home diag\rdbms\o12c2\o12c2
adrci> show home
ADR Homes:
diag\rdbms\o12c2\o12c2
Nachdem nun das richtige ADRCI-HOME gesetzt wurde, beginnen wir mit der Auswertung der in V$DIAG_INFO angezeigten Problems und Incidents.
Vierter Schritt - Feststellen der Problems bzw. Incidents
Dafür stehen Ihnen die Befehle SHOW PROBLEM oder SHOW INCIDENT zur Verfügung. Diese Befehle verschaffen schnell einen guten Überblick über den Datenbankserver.
adrci> SHOW PROBLEM
ADR Home = D:\app\roland\diag\rdbms\o12c2\o12c2:
***************************************************************
PROBLEM_ID PROBLEM_KEY LAST_INCIDENT LASTINC_TIME
---------- ----------------- ------------- -------------------
1 ORA 63999 69258 2017-06-26 09:52:10
2 ORA 7445 [kslwtbctx] 74242 2017-06-26 09:55:32
2 rows fetched
Die Ausgabe zeigt die PROBLEM_KEYs ORA 7445 und ORA 63999, die den gleichnamigen Oracle-Fehlermeldungen zugrunde liegen, mit den zugeordneten INCIDENT Nummern an.
Ausgabe gelistet nach den aufgetretenen Incidents:
adrci> SHOW INCIDENT
ADR Home = D:\app\roland\diag\rdbms\o12c2\o12c2:
***************************************************************
INCIDENT_ID PROBLEM_KEY CREATE_TIME
----------- -------------------- -------------------
69258 ORA 63999 2017-06-26 09:52:10
74242 ORA 7445 [kslwtbctx] 2017-06-26 09:55:32
2 rows fetched
Eine detailliertere Ausgabe zum aufgetretenen Incident bekommen Sie über die Abfrage:
adrci> show incident -mode detail
==> gibt Details zu ALLEN Incidents
adrci> show incident -mode detail -p "incident_id=<Nr>"
==> gibt Details zu einer speziellen Incident ID
Beispielausgabe für Incident 74242:
adrci> show incident -mode detail -p "incident_id=74242"
ADR Home = D:\app\roland\diag\rdbms\o12c2\o12c2:
*************************************************************************
**********************************************************
INCIDENT INFO RECORD 1
**********************************************************
INCIDENT_ID 74242
STATUS ready
CREATE_TIME 2017-06-26 09:55:32.403000 +02:00
PROBLEM_ID 3
CLOSE_TIME <NULL>
FLOOD_CONTROLLED none
ERROR_FACILITY ORA
ERROR_NUMBER 7445
ERROR_ARG1 kslwtbctx
ERROR_ARG2 ACCESS_VIOLATION
ERROR_ARG3 ADDR:0x30
ERROR_ARG4 PC:0x7FF6E2F9A5AF
ERROR_ARG5 UNABLE_TO_READ
ERROR_ARG6 <NULL>
ERROR_ARG7 <NULL>
ERROR_ARG8 <NULL>
ERROR_ARG9 <NULL>
ERROR_ARG10 <NULL>
ERROR_ARG11 <NULL>
ERROR_ARG12 <NULL>
SIGNALLING_COMPONENT <NULL>
SIGNALLING_SUBCOMPONENT <NULL>
SUSPECT_COMPONENT <NULL>
SUSPECT_SUBCOMPONENT <NULL>
ECID <NULL>
IMPACTS 0
CON_UID 0
PROBLEM_KEY ORA 7445 [kslwtbctx]
FIRST_INCIDENT 74242
FIRSTINC_TIME 2017-06-26 09:55:32.403000 +02:00
LAST_INCIDENT 74242
LASTINC_TIME 2017-06-26 09:55:32.403000 +02:00
IMPACT1 0
IMPACT2 0
IMPACT3 0
IMPACT4 0
KEY_NAME Client ProcId
KEY_VALUE ORACLE.EXE.4072_11416
OWNER_ID 1
INCIDENT_FILE
D:\app\roland\diag\rdbms\o12c2\o12c2\trace\o12c2_ora_11416.trc
OWNER_ID 1
INCIDENT_FILE
D:\app\roland\diag\rdbms\o12c2\o12c2\incident...
...\incdir_74242\o12c2_ora_11416_i74242.trc
Die Ausgabe zeigt, dass eine Zugriffsverletzung vorlag.
Optionales Package erzeugen für den Oracle Support
Diese Informationen können nun verwendet werden, um ein sogenanntes Incident- bzw. Problempaket zu erzeugen, welches anschließend an den Oracle Support hochgeladen werden kann.
adrci> ips pack incident 69258 in C:\temp
Generated package 2 in file C:\temp\ORA63999_20170626152636_COM_1.zip,
mode complete
adrci> ips pack problem 1 in C:\temp
Generated package 1 in file C:\temp\IPSPKG_20170626152435_COM_1.zip,
mode complete
Auch im Alertlog werden Problems mit den entsprechenden ORA-Fehlermeldungen mitprotokolliert:
Mon Jun 26 09:09:15 2017
Errors in file D:\APP\ROLAND\diag\rdbms\o12c\o12c\trace\o12c_ckpt_7244.trc:
ORA-63999: Datenträgerfehler bei Datendatei
ORA-01122: Überprüfung von Datenbank-Datei 6 nicht erfolgreich
ORA-01110: Datendatei 6: 'D:\TEMP\DATA01.DBF'
ORA-01210: Datendateiheader hat physikalischen Fehler
Mon Jun 26 09:09:15 2017
Errors in file D:\APP\ROLAND\diag\rdbms\o12c\o12c\trace\o12c_ckpt_7244.trc:
ORA-63999: Datenträgerfehler bei Datendatei
ORA-01122: Überprüfung von Datenbank-Datei 6 nicht erfolgreich
ORA-01110: Datendatei 6: 'D:\TEMP\DATA01.DBF'
ORA-01210: Datendateiheader hat physikalischen Fehler
Mon Jun 26 09:09:16 2017
System state dump requested by (instance=1, osid=7244 (CKPT)), summary=[abnormal instance
termination].
Diese Fehlermeldungen (für Incidents) würden von Oracle nun für die Dauer von einem Jahr vorgehalten und in V$DIAG_INFO als Alarmcounter solange angezeigt werden. Der SHOW CONTROL Aufruf gibt nähere Auskunft zu den Aufbewahrungsfristen.
adrci> SHOW CONTROL
ADR Home = D:\app\roland\diag\rdbms\o12c2\o12c2:
************************************************************
ADRID SHORTP_POLICY LONGP_POLICY LAST_MOD_TIME
---------- ------------- ------------ --------------------
946440162 720 8760 2017-05-03 12:18:21
SHORTP_POLICY (kurzfristig) ist standardmäßig auf 30 Tage (720 Stunden) voreingestellt.
==> verwaltet die Trace- und Core-Dump-Dateien.
LONGP_POLICY (langfristig) ist standardmäßig auf 365 Tage (8760 Stunden) voreingestellt.
==> verantwortlich für Incidents (Vorfälle) und Health-Monitoring Warnungen.
Ebenso legt der Wert auch fest, wann veraltete Alert_<nummer>.xml Dateien gelöscht werden dürfen.
Um den Counter wieder auf null zurückzusetzen steht Ihnen der purge Befehl zur Verfügung:
Syntax für Incident:
adrci> purge -i <Incident id> [<Incident id> <Incident id> ...]
adrci> purge -age < älter als Minuten> -type incident
Beispiel für Incident:
adrci> purge -i 69258 74242
adrci> purge -age 5 -type incident
Angewendet auf das vorherige Beispiel:
adrci> purge -age 5 -type incident
adrci> show incident
ADR Home = D:\app\roland\diag\rdbms\o12c2\o12c2:
*************************************************************************
0 rows fetched
SQL> select name,value from v$diag_info;
NAME VALUE
---------------------- ------------------------------------------
Diag Enabled TRUE
ADR Base D:\APP\ROLAND
ADR Home D:\APP\ROLAND\diag\rdbms\o12c2\o12c2
Diag Trace D:\APP\ROLAND\diag\rdbms\o12c2\o12c2\trace
Diag Alert D:\APP\ROLAND\diag\rdbms\o12c2\o12c2\alert
Diag Incident D:\APP\ROLAND\diag\rdbms\o12c2\o12c2\incident
Diag Cdump D:\app\roland\diag\rdbms\o12c2\o12c2\cdump
Health Monitor D:\APP\ROLAND\diag\rdbms\o12c2\o12c2\hm
Default Trace File
D:\APP\ROLAND\diag\rdbms\o12c2\o12c2\trace\o12c2_ora_9620.trc
Active Problem Count 0
Active Incident Count 0
Fazit
Um eine saubere Datenbank zu betreiben und zu erhalten, bedarf es ein wenig adminstrativer Tätigkeiten. ADRCI ist eines der Tools, die dem DBA die Arbeit zum großen Teil erleichtern.
Wenn wir Sie neugierig gemacht haben und Sie weitere nützliche Informationen zu ADRCI benötigen, besuchen Sie doch einfach unseren Reorg & Wartungskurs.