b树索引和hash索引_哈希值是唯一的吗

b树索引和hash索引_哈希值是唯一的吗后端开发-MySQL学习之索引机制最详细版(B+树)一、索引是什么?索引是为了加速对表中数据行的检索而创建的一种分散存储的数据结构。而且是实现了高级查找算法的数据结构,索引一般以文件形式存储在磁盘上,索引检索需要磁盘I/O操作。

后端开发-MySQL学习之索引机制最详细版(B+树)   一、索引是什么?   索引是为了加速对表中数据行的检索而创建的一种分散存储的数据结构。而且是实现了高级查找算法的数据结构,索引一般以文件形式存储在磁盘上,索引检索需要磁盘I/O操作。   文章视频讲解:后端开发中MySQL InnoDB 索引以及事务   C/C++ Linux服务器开发高级架构免费学习视频:C/C++Linux服务器开发高级架构师/Linux后台架构师   二、为什么要使用索引?   索引能极大的减少存储引擎需要扫描的数据量。索引可以把随机IO变成顺序IO。索引可以帮助我们在进行分组、排序等操作时,避免使用临时表。   三、磁盘存取原理   磁盘存取有以下特点:寻道时间(速度慢,费时);旋转时间(速度较快);预读:长度为页的整倍数( 主存和磁盘以页为单位交换数据,一页4K);空间连续性原理:被访问的数据,其所在的位置周围的数据也有更高的可能性被访问。
b树索引和hash索引_哈希值是唯一的吗
b树索引和hash索引_哈希值是唯一的吗   四、索引是什么实现的?   Indexes是第三方公司提供的可插拔的插件式存储引擎。   MySQL结构体系:
b树索引和hash索引_哈希值是唯一的吗
b树索引和hash索引_哈希值是唯一的吗   五、为什么选用B+树?   1、Hash索引方式   
b树索引和hash索引_哈希值是唯一的吗
b树索引和hash索引_哈希值是唯一的吗   其实在我们数据库中也使用到了Hash的索引方式,数据库默认有就是这两种实现方式:Hash和B+树,如图所示:
b树索引和hash索引_哈希值是唯一的吗
b树索引和hash索引_哈希值是唯一的吗   优点:如果是等值查询,哈希索引明显有绝对优势, 前提:键值唯一,而且不涉及到范围查找,模糊匹配,如电话号码就很适合。   缺点:利用Hash存储的话需要将所有的数据文件添加到内存,比较耗费内存空间。哈希索引没办法完成范围查询检索哈希索引也没办法利用索引完成排序,以及like ‘xxx%’ 这样的部分模糊查询哈希索引也不支持多列联合索引的在有大量重复键值情况下,哈希索引的效率也最左前缀原则是极低的,因为存在哈希碰撞问题   2、二叉树、红黑树索引方式   
b树索引和hash索引_哈希值是唯一的吗
b树索引和hash索引_哈希值是唯一的吗   缺点:太深:数据处的高/深度决定着他的IO操作次数, IO操作耗时大。应先把数据读取效率。太小:每一个磁盘块(节点/页)保存的数据量太小了。   C/C++Linux服务器开发高级架构师学习文档电子书籍 linux服务器学习资料 ,内容知识点包括Linux,Nginx,ZeroMQ,MySQL,Redis,线程池,MongoDB,ZK,Linux内核,CDN,P2P,epoll,Docker,TCP/IP,协程,DPDK等等。学习视频:C/C++Linux服务器开发高级架构师/Linux后台架构师
b树索引和hash索引_哈希值是唯一的吗
b树索引和hash索引_哈希值是唯一的吗   3、B树(B-树)的索引方式   
b树索引和hash索引_哈希值是唯一的吗
b树索引和hash索引_哈希值是唯一的吗   缺点:   B树的每个节点既有key又有data,但是每个页存储的空间是有限的,如果data较大的话,那么会导致每个节点存储的key数量变小。当存储的数据量很大的时候会导致深度较大,增大查询时候的磁盘IO次数,影响查询性能。Mysql查询的时候使用到了大量的范围查找,B树在性能上并不能满足大量范围查找。
b树索引和hash索引_哈希值是唯一的吗
b树索引和hash索引_哈希值是唯一的吗   B+Tree与B-Tree的区别:   B+节点关键字搜索采用闭合区间。(MYSQL推崇使用ID作为索引,由于ID是自增的数字类型,只会增大,所以采用向右拓展的一个方式。)B+非叶节点不保存数据相关信息, 只保存关键字和子节点的引用。B+关键字对应的数据保存在叶子节点中。B+叶子节点是顺序排列的, 并且相邻节点具有顺序引用的关系。   选择B+Tree优点:   B+树是B-树的变种( PLUS版) 多路绝对平衡查找树, 他拥有B-树的优势。B+树的叶子节点是顺序排列的,且相邻接点具有顺序引用关系,因此在范围查找时扫库、 表能力更强,同时排序能力更强。B+树仅仅在叶子节点存储数据,这样索引文件更小,磁盘读写能力更强。B+树的树高较低,索引文件较小,IO次数稳定,查询效率更加稳定。   六、B+树的索引实现方式   查看数据存储位置:   1、MyIsam(非聚集索引)   索引和数据分别存储。表定义存在.frm文件中(每个存储引擎都会有)。表中数据存在.MYD文件中。索引存在.MYI文件中。
b树索引和hash索引_哈希值是唯一的吗
b树索引和hash索引_哈希值是唯一的吗   如果同一张表多个索引:
b树索引和hash索引_哈希值是唯一的吗
b树索引和hash索引_哈希值是唯一的吗   每个索引都存有每条数据的地址,一旦有变,维护起来比较耗时。   2、InnoDB(聚集索引)   
b树索引和hash索引_哈希值是唯一的吗
b树索引和hash索引_哈希值是唯一的吗   数据就存在索引的叶子节点中。  辅助索引:
b树索引和hash索引_哈希值是唯一的吗
b树索引和hash索引_哈希值是唯一的吗   其他索引存主键,再从主键索引中找数据。   注意:InnoDB是通过B+树结构对主键创建索引,然后叶子节点中储存记录,如果没有主键,那么会选择唯一键,如果没有唯一键,那么会生成一个6位的row_id来作为主键。如果创建索引的键是其他字段,那么在叶子节点中存储的是该记录的主键,然后再通过主键索引找到对应的记录。   为什么不推荐UUID,使用UUID有以下问题:   UUID一般是32位,长度较长,由于一次预读是4K,这样就增加了读的次数,同时会造成度degree变小,树变高;UUID是一个无序的序列,在插入到B+树的时候,设计多次B+树的平衡调整,当树大了的时候性能就会变得很低;由于无序的原因,因此分页查询的时候就会很麻烦。   七、索引注意事项   1、联合索引列选择原则   经常用的列优先 【 最左匹配原则】选择性( 离散度) 高的列优先【 离散度高原则】(列的离散性越高,选择性就越好。)宽度小的列优先【 最少空间原则】   2、覆盖索引   如果查询列可通过索引节点中的关键字直接返回, 则该索引称之为覆盖索引。   覆盖索引可减少数据库IO, 将随机IO变为顺序IO, 可提高查询性能。   比如创建索引:   查询语句:   可直接从索引树中返回关键字,不会再去查数据内容。   3、其他注意事项   索引列的数据长度能少则少。索引一定不是越多越好, 越全越好, 一定是建合适的。匹配列前缀可能用到索引 like 9999%, like %9999%、 like %9999用不到索引。like 9999%得看情况,如果索引列离散性高,就能用到索引,离散性低,就用不到索引。Where 条件中 not in 和 <>操作无法使用索引。匹配范围值, order by 也可用到索引。多用指定列查询, 只返回自己想到的数据列, 少用select * 以减少IO。联合索引中如果不是按照索引最左列开始查找, 无法使用索引。在执行常量等值查询时,改变索引列的顺序并不会更改explain的执行结果,因为mysql底层优化器会进行优化,但是推荐按照索引顺序列编写sql语句。联合索引中精确匹配最左前列并范围匹配另外一列可以用到索引。(索引列为name,age的话,name=‘zhangsan’ and age>20)联合索引中如果查询中有某个列的范围查询, 则其右边的所有列都无法使用索引。(索引列为age,name的话,age>20 and name=‘zhangsan’)   附:B+树添加和删除数据图解 (请放大查看)   
b树索引和hash索引_哈希值是唯一的吗
b树索引和hash索引_哈希值是唯一的吗

2024最新激活全家桶教程,稳定运行到2099年,请移步至置顶文章:https://sigusoft.com/99576.html

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请联系我们举报,一经查实,本站将立刻删除。 文章由激活谷谷主-小谷整理,转载请注明出处:https://sigusoft.com/67004.html

(0)
上一篇 2024年 8月 9日 上午7:06
下一篇 2024年 8月 9日 上午7:10

相关推荐

关注微信