当一个key-value键值对传递给一个哈希函数的时候,经过哈希函数的计算之后,根据结果会把key-value键值对放在合适的hash buckets(哈希存储桶)里

举个栗子

我们假设对10取模( % 10 )就是哈希函数。如果key-value键值对的key是1525 ,传递到哈希函数,那么1525 会存放在第五个bucket里

因为5 as 1525 % 10 = 5。

同样,537 会存放在第七个bucket ,2982 会存放在第二个bucket ,依次类推

同样,在hash index里面,哈希索引列会被传递给哈希函数做匹配(类似于java里面的HashMap的Map操作),匹配成功之后,

索引列会被存储在匹配到的hash bucket里面的表里,这个表里会有实际的数据行指针,再根据实际的数据行指针查找对应的数据行。

概括来说,要查找一行数据或者处理一个where子句,SQL Server引擎需要做下面几件事

1、根据where条件里面的参数生成合适的哈希函数

2、索引列进行匹配,匹配到对应hash bucket,找到对应hash bucket意味着也找到了对应的数据行指针(row pointer)

3、读取数据

哈希索引比起B树索引简单,因为它不需要遍历B树,所以访问速度会更快

哈希函数和相应语法的例子

CREATE TABLE dbo.HK_tbl (  [ID] INT IDENTITY(1, 1)    NOT NULL    PRIMARY KEY NONCLUSTERED HASH WITH ( BUCKET_COUNT = 100000 ) ,  [Data] char(32) COLLATE Latin1_General_100_BIN2      NULL ,  [dt] datetime NOT NULL, ) WITH (   MEMORY_OPTIMIZED =   ON,   DURABILITY =   SCHEMA_AND_DATA);

添加哈希索引是一个离线操作。

哈希索引的Bucket 数量

( BUCKET_COUNT = 100000 )定义了哈希索引能够使用的BUCKET数量,这个Bucket 是固定的并且由用户指定Bucket 数量,

而不是执行查询的时候由SQL Server决定生成的Bucket 数量。BUCKET数量总是2的次方的四舍五入( 1024, 2048, 4096 etc..)

SQL Server2014的哈希索引其实跟MySQL的自适应哈希索引原理其实差不多,都是为了摆脱B树的束缚,使查找效率更快

How does a relational database work这篇文章也有描述hash join的原理,大家可以看一下

更多相关文章

  1. SQL Server之JSON 函数详解
  2. MySQL系列多表连接查询92及99语法示例详解教程
  3. MySQL 什么时候使用INNER JOIN 或 LEFT JOIN
  4. Android(安卓)- Manifest 文件 详解
  5. Android的Handler机制详解3_Looper.looper()不会卡死主线程
  6. Selector、shape详解(一)
  7. [android源码下载索引贴】微信+二维码那都不是事......
  8. android2.2资源文件详解4--menu文件夹下的菜单定义
  9. Android发送短信方法实例详解

随机推荐

  1. 为独立的“产品”打包django项目及其依赖
  2. 基于Python的行为驱动开发实战
  3. 将字节列表转换为字节字符串
  4. Python 用hashlib求中文字符串的MD5值
  5. 长安铃木经销商爬取(解析xml、post提交、p
  6. Python基础(4) - 变量
  7. 关于Python的super用法研究
  8. 以DAG方式调度作业
  9. Python阻止复制对象作为参考
  10. Python下numpy不成功的解决办法(wheel方法