Bei Oracle Datenbanken werden viele Log-Files, Trace-Files, Audit-Files etc. erzeugt, die an unterschiedlichen Orten im Dateisystem und in der Datenbank gespeichert werden.
Bereits seit Oracle 11g gibt es den Parameter diagnostic_dest, der den Pfad angibt, wo die Trace-Files, Log-Files, das Alertlog, etc. abgelegt werden. Dieser Parameter zeigt auf den zentralen Ort, in dem alle Information zusammengefasst werden: das Diagnostic Repository.
Oracle stellt ein leistungsfähiges Tool zur Verfügung, das neben Dateien löschen, bei auftretenden ORA-Fehlern auch zugeordnete Incidents und Problems darstellen kann. Außerdem können Sie mit diesem Tool alle notwendigen Files für den Oracle Support komfortabel zusammenstellen und zippen, das Alertlog anzeigen, sowie Trace-Dateien im laufenden Betrieb löschen. In diesem Monatstipp wird nun näher beleuchtet, wie aufgetretene Incidents (Vorfälle) und Problems (Probleme) ermittelt und die zugehörigen Counter zurückgesetzt werden können. Die Informationsquelle für die aufgetretenen Problems und Incidents stellt die Tabelle V$DIAG_INFO dar.
Über die Tabelle V$DIAG_INFO ermitteln wir zunächst die Anzahl der aufgetretenen Probleme und Incidents:
SQL> select name,value from v$diag_info;NAME VALUE--------------------- --------------------------------------------Diag Enabled TRUEADR Base D:\APP\ROLANDADR Home D:\oracle\diag\rdbms\o19c\o19cDiag Trace D:\oracle\diag\rdbms\o19c\o19c\traceDiag Alert D:\oracle\diag\rdbms\o19c\o19c\alertDiag Incident D:\oracle\diag\rdbms\o19c\o19c\incidentDiag Cdump D:\oracle\diag\rdbms\o19c\o19c\cdumpHealth Monitor D:\oracle\diag\rdbms\o19c\o19c\hmDefault Trace File D:\oracle\diag\rdbms\o19c\o19c\trace\o19c_ora_9620.trcActive Problem Count 2Active Incident Count 2
Um die zugrundeliegenden Problems bzw. Incidents genauer zu analysieren, wird der Automatic Diagnostic Report CommandInterpreter [ADRCI] auf OS-Ebene aufgerufen.
C:\Windows\System32>adrciADRCI: Release 12.2.0.1.0 - Production on Mo Jun 26 11:11:12 2017Copyright (c) 1982, 2017, Oracle and/or its affiliates. All rights reserved.ADR base = "D:\app\roland"adrci>
Die Ausgabe oben zeigt das per Default gesetzte ADR BASE an. Durch Aufruf der Tool-Hilfe mittels help können Sie sich weitere Informationen anzeigen lassen.
Der Output sieht dann folgendermaßen aus:
adrci> help HELP [topic] Available Topics: CREATE REPORT ECHO ESTIMATE EXIT HELP HOST IPS PURGE RUN SELECT SET BASE SET BROWSER SET CONTROL SET ECHO SET EDITOR SET HOMES | HOME | HOMEPATH SET TERMOUT SHOW ALERT SHOW BASE SHOW CONTROL SHOW HM_RUN SHOW HOMES | HOME | HOMEPATH SHOW INCDIR SHOW INCIDENT SHOW LOG SHOW PROBLEM SHOW REPORT SHOW TRACEFILE SPOOL There are other commands intended to be used directly by Oracle, type "HELP EXTENDED" to see the list
Um das korrekte ADRCI-Home anzuzeigen, lassen wir uns alle verfügbaren ADRCI-Homes mit dem Befehl show homes auflisten.
adrci> show homesADR Homes:diag\clients\user_roland\host_1513561619_107diag\clients\user_roland\host_1513561619_82diag\clients\user_SYSTEM\host_1513561619_107diag\clients\user_SYSTEM\host_1513561619_82diag\rdbms\o12c\o12cdiag\rdbms\o12c2\o12c2diag\tnslsnr\Host02\listenerdiag\tnslsnr\Host02\listener_o12c2adrci>
Setzen Sie dann per set Befehl das richtige ADRCI-HOME:
adrci> set home diag\rdbms\o12c2\o12c2adrci> show homeADR Homes:diag\rdbms\o12c2\o12c2
Nachdem nun das richtige ADRCI-HOME gesetzt wurde, beginnen wir mit der Auswertung der in V$DIAG_INFO angezeigten Problems und Incidents.
Dafür stehen Ihnen die Befehle SHOW PROBLEM oder SHOW INCIDENT zur Verfügung. Diese Befehle verschaffen schnell einen guten Überblick über den Datenbankserver.
adrci> SHOW PROBLEMADR Home = D:\app\roland\diag\rdbms\o12c2\o12c2:***************************************************************PROBLEM_ID PROBLEM_KEY LAST_INCIDENT LASTINC_TIME---------- ----------------- ------------- -------------------1 ORA 63999 69258 2017-06-26 09:52:102 ORA 7445 [kslwtbctx] 74242 2017-06-26 09:55:322 rows fetched
Die Ausgabe zeigt die PROBLEM_KEYs ORA 7445 und ORA 63999, die den gleichnamigen Oracle-Fehlermeldungen zugrunde liegen, mit den zugeordneten INCIDENT Nummern an.
Ausgabe gelistet nach den aufgetretenen Incidents:
adrci> SHOW INCIDENTADR Home = D:\app\roland\diag\rdbms\o12c2\o12c2:***************************************************************INCIDENT_ID PROBLEM_KEY CREATE_TIME----------- -------------------- -------------------69258 ORA 63999 2017-06-26 09:52:1074242 ORA 7445 [kslwtbctx] 2017-06-26 09:55:322 rows fetched
Eine detailliertere Ausgabe zum aufgetretenen Incident bekommen Sie über die Abfrage:
adrci> show incident -mode detail
==> gibt Details zu ALLEN Incidents
adrci> show incident -mode detail -p "incident_id=<Nr>"
==> gibt Details zu einer speziellen Incident IDBeispielausgabe für Incident 74242:
adrci> show incident -mode detail -p "incident_id=74242" ADR Home = D:\app\roland\diag\rdbms\o12c2\o12c2:***********************************************************************************************************************************INCIDENT INFO RECORD 1********************************************************** INCIDENT_ID 74242 STATUS ready CREATE_TIME 2017-06-26 09:55:32.403000 +02:00 PROBLEM_ID 3 CLOSE_TIME <NULL> FLOOD_CONTROLLED none ERROR_FACILITY ORA ERROR_NUMBER 7445 ERROR_ARG1 kslwtbctx ERROR_ARG2 ACCESS_VIOLATION ERROR_ARG3 ADDR:0x30 ERROR_ARG4 PC:0x7FF6E2F9A5AF ERROR_ARG5 UNABLE_TO_READ ERROR_ARG6 <NULL> ERROR_ARG7 <NULL> ERROR_ARG8 <NULL> ERROR_ARG9 <NULL> ERROR_ARG10 <NULL> ERROR_ARG11 <NULL> ERROR_ARG12 <NULL> SIGNALLING_COMPONENT <NULL> SIGNALLING_SUBCOMPONENT <NULL> SUSPECT_COMPONENT <NULL> SUSPECT_SUBCOMPONENT <NULL> ECID <NULL> IMPACTS 0 CON_UID 0 PROBLEM_KEY ORA 7445 [kslwtbctx] FIRST_INCIDENT 74242 FIRSTINC_TIME 2017-06-26 09:55:32.403000 +02:00 LAST_INCIDENT 74242 LASTINC_TIME 2017-06-26 09:55:32.403000 +02:00 IMPACT1 0 IMPACT2 0 IMPACT3 0 IMPACT4 0 KEY_NAME Client ProcId KEY_VALUE ORACLE.EXE.4072_11416 OWNER_ID 1 INCIDENT_FILE D:\app\roland\diag\rdbms\o12c2\o12c2\trace\o12c2_ora_11416.trc OWNER_ID 1 INCIDENT_FILE D:\app\roland\diag\rdbms\o12c2\o12c2\incident... ...\incdir_74242\o12c2_ora_11416_i74242.trc
Die Ausgabe zeigt, dass eine Zugriffsverletzung vorlag.
Diese Informationen können nun verwendet werden, um ein sogenanntes Incident- bzw. Problempaket zu erzeugen, welches anschließend an den Oracle Support hochgeladen werden kann.
adrci> ips pack incident 69258 in C:\tempGenerated package 2 in file C:\temp\ORA63999_20170626152636_COM_1.zip,mode completeadrci> ips pack problem 1 in C:\tempGenerated package 1 in file C:\temp\IPSPKG_20170626152435_COM_1.zip,mode complete
Auch im Alertlog werden Problems mit den entsprechenden ORA-Fehlermeldungen mitprotokolliert:
Mon Jun 26 09:09:15 2017Errors in file D:\APP\ROLAND\diag\rdbms\o12c\o12c\trace\o12c_ckpt_7244.trc:ORA-63999: Datenträgerfehler bei DatendateiORA-01122: Überprüfung von Datenbank-Datei 6 nicht erfolgreichORA-01110: Datendatei 6: 'D:\TEMP\DATA01.DBF'ORA-01210: Datendateiheader hat physikalischen FehlerMon Jun 26 09:09:15 2017Errors in file D:\APP\ROLAND\diag\rdbms\o12c\o12c\trace\o12c_ckpt_7244.trc:ORA-63999: Datenträgerfehler bei DatendateiORA-01122: Überprüfung von Datenbank-Datei 6 nicht erfolgreichORA-01110: Datendatei 6: 'D:\TEMP\DATA01.DBF'ORA-01210: Datendateiheader hat physikalischen FehlerMon Jun 26 09:09:16 2017System state dump requested by (instance=1, osid=7244 (CKPT)), summary=[abnormal instancetermination].
Diese Fehlermeldungen (für Incidents) würden von Oracle nun für die Dauer von einem Jahr vorgehalten und in V$DIAG_INFO als Alarmcounter solange angezeigt werden. Der SHOW CONTROL Aufruf gibt nähere Auskunft zu den Aufbewahrungsfristen.
adrci> SHOW CONTROLADR Home = D:\app\roland\diag\rdbms\o12c2\o12c2:************************************************************ADRID SHORTP_POLICY LONGP_POLICY LAST_MOD_TIME---------- ------------- ------------ --------------------946440162 720 8760 2017-05-03 12:18:21
SHORTP_POLICY (kurzfristig) ist standardmäßig auf 30 Tage (720 Stunden) voreingestellt.
==> verwaltet die Trace- und Core-Dump-Dateien.
LONGP_POLICY (langfristig) ist standardmäßig auf 365 Tage (8760 Stunden) voreingestellt.
==> verantwortlich für Incidents (Vorfälle) und Health-Monitoring Warnungen.
Ebenso legt der Wert auch fest, wann veraltete Alert_<nummer>.xml Dateien gelöscht werden dürfen.
Um den Counter wieder auf null zurückzusetzen steht Ihnen der purge Befehl zur Verfügung:
adrci> purge -i <Incident id> [<Incident id> <Incident id> ...]adrci> purge -age < älter als Minuten> -type incident
Beispiel für Incident:
adrci> purge -i 69258 74242adrci> purge -age 5 -type incident
Angewendet auf das vorherige Beispiel:
adrci> purge -age 5 -type incidentadrci> show incidentADR Home = D:\app\roland\diag\rdbms\o12c2\o12c2:*************************************************************************0 rows fetchedSQL> select name,value from v$diag_info;NAME VALUE---------------------- ------------------------------------------Diag Enabled TRUEADR Base D:\APP\ROLANDADR Home D:\APP\ROLAND\diag\rdbms\o12c2\o12c2Diag Trace D:\APP\ROLAND\diag\rdbms\o12c2\o12c2\traceDiag Alert D:\APP\ROLAND\diag\rdbms\o12c2\o12c2\alertDiag Incident D:\APP\ROLAND\diag\rdbms\o12c2\o12c2\incidentDiag Cdump D:\app\roland\diag\rdbms\o12c2\o12c2\cdumpHealth Monitor D:\APP\ROLAND\diag\rdbms\o12c2\o12c2\hmDefault Trace File D:\APP\ROLAND\diag\rdbms\o12c2\o12c2\trace\o12c2_ora_9620.trcActive Problem Count 0Active Incident Count 0
Um eine saubere Datenbank zu betreiben und zu erhalten, bedarf es ein wenig adminstrativer Tätigkeiten. ADRCI ist eines der Tools, die dem DBA die Arbeit zum großen Teil erleichtern.
Wenn wir Sie neugierig gemacht haben und Sie weitere nützliche Informationen zu ADRCI benötigen, besuchen Sie doch einfach unseren Reorg & Wartungskurs.