最近在因归档日志暴增,使用delete archivelog all貌似无法清除所有的归档日志,到底是什么原因呢?

  1. 1、演示环境
  2. SQL> select * from v$version where rownum<2;
  3. BANNER
  4. ----------------------------------------------------------------
  5. Oracle Database 10g Release 10.2.0.3.0 - 64bit Production
  6. SQL> select inst_id,instance_name from gv$instance; -->两节点RAC
  7. INST_ID INSTANCE_NAME
  8. ---------- ----------------
  9. 1 GOBO4A
  10. 2 GOBO4B
  11. SQL> show parameter db_recovery   -->+REV,使用了ASM 存储方式
  12. NAME                                 TYPE        VALUE
  13. ------------------------------------ ----------- -------------
  14. db_recovery_file_dest                string      +REV
  15. db_recovery_file_dest_size           big integer 1G
  16. SQL> select flashback_on from v$database;  -->数据库未开启闪回特性,也就是说尽管指定了闪回区,未启用闪回特性
  17. -->相应的,归档日志充满整个闪回区时,闪回区空间并不会被重用
  18. FLASHBACK_ON
  19. ------------------
  20. NO
  21. 2、查看及清除现有的归档日志文件
  22. oracle@bo2dbp:~> export ORACLE_SID=+ASM1
  23. oracle@bo2dbp:~> asmcmd
  24. ASMCMD> cd +REV/GOBO4/ARCHIVELOG
  25. ASMCMD> ls
  26. 2012_10_08/
  27. ....
  28. arch_795194241_1_10.arc
  29. arch_795194241_1_100.arc
  30. ....
  31. oracle@bo2dbp:~> export ORACLE_SID=GOBO4A
  32. oracle@bo2dbp:~> rman target /
  33. Recovery Manager: Release 10.2.0.3.0 - Production on Thu Nov 29 16:23:15 2012
  34. Copyright (c) 1982, 2005, Oracle.  All rights reserved.
  35. connected to target database: GOBO4 (DBID=921286879)
  36. #下面通过使用rman backup archivelog方式来删除所有的归档日志文件
  37. RMAN> backup format '/install_source/rman_bak/arch_%d_%U'
  38. 2> archivelog all delete input;
  39. Starting backup at 29-NOV-12
  40. current log archived
  41. using target database control file instead of recovery catalog
  42. allocated channel: ORA_DISK_1
  43. channel ORA_DISK_1: sid=1058 instance=GOBO4A devtype=DISK
  44. channel ORA_DISK_1: starting archive log backupset
  45. channel ORA_DISK_1: specifying archive log(s) in backup set
  46. input archive log thread=1 sequence=139 recid=214 stamp=797450261
  47. input archive log thread=1 sequence=140 recid=215 stamp=797450292
  48. input archive log thread=1 sequence=141 recid=216 stamp=797450308
  49. input archive log thread=1 sequence=142 recid=218 stamp=797450347
  50. input archive log thread=1 sequence=143 recid=219 stamp=797450372
  51. input archive log thread=1 sequence=144 recid=220 stamp=797450409
  52. channel ORA_DISK_1: starting piece 1 at 29-NOV-12
  53. channel ORA_DISK_1: finished piece 1 at 29-NOV-12
  54. piece handle=/install_source/rman_bak/arch_GOBO4_1dnrhkn4_1_1 tag=TAG20121129T162806 comment=NONE
  55. channel ORA_DISK_1: backup set complete, elapsed time: 00:02:15
  56. channel ORA_DISK_1: deleting archive log(s)
  57. archive log filename=+REV/gobo4/archivelog/arch_795194241_1_139.arc recid=214 stamp=797450261
  58. archive log filename=+REV/gobo4/archivelog/arch_795194241_1_140.arc recid=215 stamp=797450292
  59. archive log filename=+REV/gobo4/archivelog/arch_795194241_1_141.arc recid=216 stamp=797450308
  60. ........
  61. piece handle=/install_source/rman_bak/arch_GOBO4_1hnrhli2_1_1 tag=TAG20121129T162806 comment=NONE
  62. channel ORA_DISK_1: backup set complete, elapsed time: 00:00:09
  63. channel ORA_DISK_1: deleting archive log(s)
  64. archive log filename=+REV/gobo4/archivelog/arch_795194241_2_141.arc recid=427 stamp=800547491
  65. archive log filename=+REV/gobo4/archivelog/arch_795194241_2_142.arc recid=429 stamp=800549193
  66. archive log filename=+REV/gobo4/archivelog/arch_795194241_2_143.arc recid=433 stamp=800578944
  67. archive log filename=+REV/gobo4/archivelog/arch_795194241_2_144.arc recid=437 stamp=800641679
  68. Finished backup at 29-NOV-12
  69. #再次查看依然有很多归档日志文件存在,而且都是10月23日之前的
  70. ASMCMD> pwd
  71. +REV/GOBO4/ARCHIVELOG
  72. ASMCMD> ls
  73. 2012_09_30/
  74. 2012_10_09/
  75. 2012_10_10/
  76. 2012_10_11/
  77. 2012_10_12/
  78. 2012_10_13/
  79. 2012_10_14/
  80. 2012_10_15/
  81. 2012_10_16/
  82. 2012_10_17/
  83. 2012_10_18/
  84. 2012_10_22/
  85. 2012_10_23/
  86. arch_795194241_1_100.arc
  87. arch_795194241_1_101.arc
  88. arch_795194241_1_102.arc
  89. ............
  90. #再次删除日志文件,来个更狠的命令,直接delete所有的archivelog,最近新增的一个archivelog被删除
  91. RMAN> delete noprompt archivelog all;
  92. released channel: ORA_DISK_1
  93. allocated channel: ORA_DISK_1
  94. channel ORA_DISK_1: sid=1081 instance=GOBO4A devtype=DISK
  95. List of Archived Log Copies
  96. Key     Thrd Seq     S Low Time  Name
  97. ------- ---- ------- - --------- ----
  98. 453     1    294     A 29-NOV-12 +REV/gobo4/archivelog/arch_795194241_1_294.arc
  99. deleted archive log
  100. archive log filename=+REV/gobo4/archivelog/arch_795194241_1_294.arc recid=453 stamp=800662185
  101. Deleted 1 objects
  102. # 上面输出的结果只有一个归档日志被删除,何以故?
  103. # 这个我们的分析一下delete noprompt archivelog all以及备份归档日志时使用的 delete input
  104. # 回顾一下Oracle控制文件以及Oracle RMAN的的备份恢复的原理。
  105. # 我们知道,Oracle 控制文件里边记录了数据库的名字,id,创建的时间戳....一大堆的信息,当然也有不可少的归档信息以及备份信息。
  106. # 如果不知道控制文件有什么? 那就参考:Oracle 控制文件,文章尾部有给出链接。
  107. # 其次,Oracle RMAN的备份恢复的所有信息都依赖于两个东东,要么是控制文件,要么是恢复目录(catalog)。
  108. # 因为所有的备份与恢复信息都会依据备份是的方式存储到这两个位置。
  109. # 理所当然的是,对这两个东东里的备份集,镜像副本,归档日志,等等所有能备份的对象的任意操作,首先会参考这些对象的记录的信息。
  110. # 其次是当被记录的对象发生变化时做相应的更新。
  111. 3、深度分析无法清除的原因
  112. #先来看看gv$archived_log,如果是单实例使用v$archived_log
  113. #从下面的查询可知,又有两个新的归档日志产生,一个从第一个instance产生,一个从第二个instance产生。
  114. SQL> select name,status,count(*) from gv$archived_log group by name,status;
  115. NAME                                               S   COUNT(*)
  116. -------------------------------------------------- - ----------
  117. D        444
  118. +REV/gobo4/archivelog/arch_795194241_1_295.arc     A          2
  119. +REV/gobo4/archivelog/arch_795194241_2_150.arc     A          2
  120. # 从上面的查询可知,当前的两个节点其归档日志只有2个,其余的444个其名字都是NULL值。
  121. # 看看关于视图v$archived_log中NAME列的解释
  122. # Archived log file name. If set to NULL, either the log file was cleared before it was archived or an RMAN backup command
  123. #  with the "delete input" option was executed to back up archivelog all (RMAN> backup archivelog all delete input;).
  124. # 上面的这段话表明当前的这些日志文件要么被手动清除,要么被rman的delete input选项清除。
  125. # 其次status列的D字段也表明了这些个名字为空的归档日志已经被Deleted.也就是说有444个归档日志已经被删除了。
  126. # 再次尝试删除归档日志,尾数为295和150的归档日志也被删除
  127. RMAN> delete noprompt archivelog all;
  128. released channel: ORA_DISK_1
  129. allocated channel: ORA_DISK_1
  130. channel ORA_DISK_1: sid=1081 instance=GOBO4A devtype=DISK
  131. List of Archived Log Copies
  132. Key     Thrd Seq     S Low Time  Name
  133. ------- ---- ------- - --------- ----
  134. 454     1    295     A 29-NOV-12 +REV/gobo4/archivelog/arch_795194241_1_295.arc
  135. 455     2    150     A 29-NOV-12 +REV/gobo4/archivelog/arch_795194241_2_150.arc
  136. deleted archive log
  137. archive log filename=+REV/gobo4/archivelog/arch_795194241_1_295.arc recid=454 stamp=800712037
  138. deleted archive log
  139. archive log filename=+REV/gobo4/archivelog/arch_795194241_2_150.arc recid=455 stamp=800712038
  140. Deleted 2 objects
  141. # 查询gv$archived_log视图,表明所有现有的archivelog都已经被删除
  142. SQL> select name,status,count(*) from gv$archived_log group by name,status;
  143. NAME                                               S   COUNT(*)
  144. -------------------------------------------------- - ----------
  145. D        448
  146. # 在asmcmd命令下也无法找到我们刚刚删除的归档日志文件
  147. ASMCMD> pwd
  148. +REV/GOBO4/ARCHIVELOG
  149. ASMCMD> ls -l arch_795194241_1_295.arc
  150. asmcmd: entry 'arch_795194241_1_295.arc' does not exist in directory '+REV/GOBO4/ARCHIVELOG/'
  151. ASMCMD> ls -l arch_795194241_2_150.arc
  152. asmcmd: entry 'arch_795194241_2_150.arc' does not exist in directory '+REV/GOBO4/ARCHIVELOG/'
  153. # 在A节点上再次切换一次
  154. SQL> alter system switch logfile;
  155. System altered.
  156. SQL> select inst_id,name,count(*) from gv$archived_log group by inst_id,name;
  157. INST_ID NAME                                                 COUNT(*)
  158. ---------- -------------------------------------------------- ----------
  159. 2                                                           223
  160. 1 +REV/gobo4/archivelog/arch_795194241_1_296.arc              1
  161. 2 +REV/gobo4/archivelog/arch_795194241_1_296.arc              1
  162. 1                                                           223
  163. --上面的查询可以看到当前的一个归档日志arch_795194241_1_296.arc基于Inst_id为1的有1个,而基于Inst_id为2的也有一个
  164. --而直接查询v$archived_log时只有1个当前的归档日志,实际上arch_795194241_1_296.arc文件是由第一个instance产生的。
  165. --数字296之前的1即可以表明为第一个instance产生的。
  166. SQL> select name from v$archived_log where name='+REV/gobo4/archivelog/arch_795194241_1_296.arc';
  167. NAME
  168. --------------------------------------------------
  169. +REV/gobo4/archivelog/arch_795194241_1_296.arc
  170. # 关于这个地方个人认为这个应该是用于做恢复时用的。
  171. # RAC数据库在恢复时,无论多个少节点,只有所有的归档日志的集合才能完成地表述数据库的变迁。
  172. # 此时,无论从哪个节点上看,或者说做无论从哪个节点恢复,都可以看到该归档日志。
  173. # 而具体是哪个instance产生则由'%t'重做线程编号来判断。
  174. #下面再来看看控制文件
  175. SQL> select * from gv$controlfile_record_section where type='ARCHIVED LOG';
  176. INST_ID TYPE                         RECORD_SIZE RECORDS_TOTAL RECORDS_USED FIRST_INDEX LAST_INDEX LAST_RECID
  177. ---------- ---------------------------- ----------- ------------- ------------ ----------- ---------- ----------
  178. 1 ARCHIVED LOG                         584           224          224         149        148        456
  179. 2 ARCHIVED LOG                         584           224          224         149        148        456
  180. # RECORDS_TOTAL:Number of records allocated for the section
  181. # 列RECORDS_TOTAL表明为当前TYPE分配的可存储的总数,在两个instance上都为224条
  182. # 从最近一次切换日志的查询结果可知,被删除的有223条,新增的一条为arch_795194241_1_296.arc,总条数为224条。
  183. # 如果下次日志切换再增加一条往哪里放呢?那些已经超出缺省保留期的归档日志被覆盖,即被重用。
  184. # 用户在控制文件中保存ARCHIVED LOG部分的保留时间由谁来决定呢,参数control_file_record_keep_time,缺省为7天
  185. # 这意味着7天前的归档日志和备份信息可能在控制文件中已经不存在了
  186. SQL> show parameter control_file_record_keep_time
  187. NAME                                 TYPE        VALUE
  188. ------------------------------------ ----------- ------------------------------
  189. control_file_record_keep_time        integer     7
  190. SQL> select count (*) from v$archived_log;
  191. COUNT(*)
  192. ----------
  193. 224
  194. # Author : Robinson
  195. # Blog : http://blog.csdn.net/robinson_0612
  196. SQL> alter session set nls_date_format='yyyymmdd hh24:mi:ss';
  197. Session altered.
  198. # 下面的查询正好表明为什么2012_10_23和之前的日志为什么没有被删除
  199. # 因为20121023 18:04:53之后的归档日志已经被覆盖了,所以使用delete archivelog all时是根本无法清除之前的日志的,无能为力阿。
  200. # 对于rman下的delete archivelog all方式不会删除控制文件中对应的归档日志信息,但在控制文件中设置delete状态,
  201. # 即v$archived_log视图的status列为deleted
  202. SQL> select min (FIRST_TIME), min (COMPLETION_TIME), max (FIRST_TIME), max (COMPLETION_TIME) from
  203. 2  v$archived_log;
  204. MIN(FIRST_TIME)   MIN(COMPLETION_TI MAX(FIRST_TIME)   MAX(COMPLETION_TI
  205. ----------------- ----------------- ----------------- -----------------
  206. 20121023 18:03:12 20121023 18:04:53 20121130 12:00:26 20121130 12:14:51
  207. SQL> select min (FIRST_TIME), min (COMPLETION_TIME), max (FIRST_TIME), max (COMPLETION_TIME) from
  208. 2  gv$archived_log;
  209. MIN(FIRST_TIME)   MIN(COMPLETION_TI MAX(FIRST_TIME)   MAX(COMPLETION_TI
  210. ----------------- ----------------- ----------------- -----------------
  211. 20121023 18:03:12 20121023 18:04:53 20121130 12:00:26 20121130 12:14:51
  212. # 既然这般,如何是好啊?
  213. # 那就直接在asmcmd命令行下删除吧。一顿狂删 rm -rf 2012_09_30/
  214. # 莫急,莫急,一不小心删完了,我晕,ORA-00254/ORA-15173 Archive_log Directory On Asm Being Deleted 在等候阿。

小结
a、delete archivelog all将会毫无保留的删除所有的归档日志(在控制文件中有相应记录的)
b、归档日志的信息被记录在控制文件之中,其生存期和可保留的总数也受到控制文件创建初以及参数control_file_record_keep_time限制
c、对于那些已经在控制文件中被覆盖的归档日志,该方式不起作用,使用backup archivelog all delete input同样不起作用
d、注意backup archivelog all时delete input与delete all input有些差异,前者删除仅仅被备份过的归档日志,而后者则对于多个归档位置
  下的所有归档日志全部删除。
e、视图v$archived_log或gv$archived_log提供了归档日志的相关详细信息
f、建议备份归档日志后再删除。注,RAC+ASM下切不可使得archivedlog文件夹为空,否则,整个文件夹连同上级空目录会被删除

转:http://blog.csdn.net/leshami/article/details/8245736#comments

04-28 23:11