Oracle索引梳理系列（九）

发布时间：2016-11-07 12:00:30

1、聚簇因子的概念

聚簇因子，是CBO优化器决定是否使用索引的因素之一，主要反映索引块上的数据（顺序存储）,与该索引基于的表块上的数据（无序存储）的顺序相似程度的差异性。即表数据的存储顺序是否与相应索引数据的存储顺序一致。
通过查询dba_indexes视图、user_indexes视图以及all_indexes视图的CLUSTERING_FACTOR列，可以了解当前索引的聚簇因子值。

对于索引块的数据存储，这里以普通btree索引为例，索引块中键值的分布总是有序的，且根据键值及其相应的rowid信息，唯一定位一行记录在相应表的数据块中的分布。理想情况下，相同或相邻的键值，尽量定位在相同的数据块上，可以避免对于数据块多余的I/O操作。
对于数据块的数据存储，并不是有序存储的。且ORACLE为节省空间，会优先使用当前当水位线（HWM）以下的可用数据块，而不是按序使用最后被使用的块。当HWM以下无可用数据块时，再开辟新的数据块使用。
正因为数据块中数据存储的特点，随着时间的推移，数据在相应数据块间的分布越发零散，进而影响索引块中，相同或相邻键值对应的相应数据行信息（rowid），所指向的数据块越加分散，进而导致聚簇因子变差。

聚簇因子大致的计算方法顺序如下：

良好的CF值，会趋向于数据表的块数。

较差的CF值，会趋向于数据表的行数。

需要注意的是：随着时间的推移，频繁的DML操作，会让CF值总是趋向于恶劣方向发展。

示例：

本示例主要说明CF的趋势性。

--查看当前测试表中索引的聚簇因子情况

原标题：Oracle索引梳理系列（九）

关键词：oracle

oracle

*特别声明：以上内容来自于网络收集，著作权属原作者所有，如有侵权，请联系我们： admin#shaoqun.com （#换成@）。