一直以来,Oracle的发展是如火如荼,依然非常成熟,无论是行业的人员和资料的丰富程度。对于数据库的体系结构的内容,下面这张图我估计很多DBA都快看吐了,每次一提起体系结构,总是会看到这张图。
而看着10年前的图,发现依旧能讲出不少的东西,很多技术的改变都是添砖加瓦,而动地基之类的改动,那就相当难了,从12c的体系结构可以看出,Oracle真是下了血本了,根深蒂固的基础架构都要动,而且这个架构貌似以前还是在SQL Server已经有成形的使用。
我想说的是,技术的发展,我们都是其中的分子或者分母,如果说ROWID这个概念有什么可值得深挖的,估计想想都不大可能。一方面很多人可能因为一些特殊原因了解到它的存在,另一方面似乎它可用的空间就不是很大,而且如果想继续深究它的具体实现方式,这个就更难了。
先来说说ROWID的组成,如果说ROWID的格式如下:
OOOOOO.FFF.BBBBBB.RRR
那么OOOOOO就是OBJECT_ID,可以通过DBA_OBJECTS查得。
FFF是对应的数据文件号,可以通过DBA_DATA_FILES或者是V$DATAFILE查到
BBBBBB是数据块号,这一点尤其值得说一说,数据字典层面,Oracle对外开放的数据字典,最细粒度也就是dba_extents了,如果想看到更细节的数据块的信息,那也就只有ROWID可以看到了。
而RRR是对应的行数,也就是row number
ROWID看起来如此强大,能够定位到如此细节的信息,那么ROWID我们有什么快捷的方式来查看和管理呢,我们能够像到的就是DBMS_ROWID了。
比如下面的语句,能够查到一些很详细的信息。
select
rowid as therowid, id,
dbms_rowid.rowid_object(rowid) as objid,
dbms_rowid.rowid_relative_fno(rowid) as relfilenum,
dbms_rowid.ROWID_RELATIVE_FNO(rowid) as absfilenum,
dbms_rowid.rowid_block_number(rowid) as blocknum,
dbms_rowid.rowid_row_number(rowid) as rowslot
from t where id in(1, 2, 500, 501)
order by id;
THEROWID ID OBJID RELFILENUM ABSFILENUM BLOCKNUM ROWSLOT
------------------ ---------- ---------- ---------- ---------- ---------- ----------
AAAVs+AABAAAXHJAAA 1 88894 1 1 94665 0
AAAVs+AABAAAXHJAAB 2 88894 1 1 94665 1
AAAVs+AABAAAXHJAHz 500 88894 1 1 94665 499
AAAVs+AABAAAXHJAH0 501 88894 1 1 94665 500但是可能你也有一种疑惑,这个ROWID看起来格式还真不简单,到底是咋实现的呢? DBMS_ROWID是不会披露这些信息的,毫无疑问,这些内容是肯定被加密的。
我们有什么其他的办法来解读呢。首先一种说法是ROWID是根据base64来编码的。我们有没有办法来试一试,这一点还真找到了同样想法的技术友人,感兴趣可以参考这篇。
https://www.experts-exchange.com/articles/931/Decoding-the-Oracle-ROWID-and-some-Base64-for-fun.html
我们来简单测试一下。
首先是数据初始化,我们建立一个表,插入10000条数据,两个SQL轻松搞定。
create table t( id integer primary key,name varchar(1));
insert into t select level,'A' name from dual connect by level<=10000;
我们查看几行数据。
SQL> select rowid from t where id<=2;
ROWID
------------------
AAAVs+AABAAAXHJAAA
AAAVs+AABAAAXHJAAB
末尾的3位是行数,那么我们解读一下它吧。
SQL> select substr(rowid, 16, 3)
from t where id <= 2;
SUBSTR(ROWID,16,3)
------------------
AAA
AAB这一点很显然就是如此,没有什么特别之处,而base64是要求至少24位,所以我们可以尝试再补充一位。
SQL> select LPAD(substr(rowid, 16, 3), 4, 'A')
from t where id <= 2;
LPAD(SUBSTR(ROWID,16,3),
------------------------
AAAA
AAAB
下面的这个步骤就很值得玩味了,那就是使用base64的方法来处理。
SQL> select utl_encode.base64_decode(utl_raw.cast_to_raw(lpad(substr(rowid, 16, 3), 4, 'A')))
from t where id in(1, 2, 500, 501);
------------------------------------
000000
000001
0001F3
0001F4可以看出这个现实的结果是行数,但是实际上这个是十六进制的方式。沃恩需要再这个基础上进一步转换。
SQL> select to_number(utl_encode.base64_decode(utl_raw.cast_to_raw(lpad(substr(rowid, 16, 3), 4, 'A'))), 'XXXXXX') as rowslot
from t where id in(1, 2, 500, 501);
ROWSLOT
----------
0
1
499
500
如此一来,整个过程是清晰了很多,那么这个说法到底是否靠谱呢。
我们可以使用它来得到和dbms_rowid同样的效果。
select rowid as therowid, id,
to_number(utl_encode.base64_decode(utl_raw.cast_to_raw(lpad(substr(rowid,1, 6), 8, 'A'))), 'XXXXXXXXXXXX') as objid,
to_number(utl_encode.base64_decode(utl_raw.cast_to_raw(lpad(substr(rowid, 7, 3), 4, 'A'))), 'XXXXXX') as filenum,
to_number(utl_encode.base64_decode(utl_raw.cast_to_raw(lpad(substr(rowid, 10, 6), 8, 'A'))), 'XXXXXXXXXXXX') as blocknum,
to_number(utl_encode.base64_decode(utl_raw.cast_to_raw(lpad(substr(rowid, 16, 3), 4, 'A'))), 'XXXXXX') as rowslot
from t where id <= 2 ;
THEROWID ID OBJID FILENUM BLOCKNUM ROWSLOT
------------------ ---------- ---------- ---------- ---------- ----------
AAAVs+AABAAAXHJAAA 1 88894 1 94665 0
AAAVs+AABAAAXHJAAB 2 88894 1 94665
所以说如此一来整个ROWID的实现方式就一目了然了,而在这个测试中如果结合ROWNUM其实也就更有意思了。我们后续来揉在一起来对比一下。