散列:排解冲突(二)

平方试探Quadratic probing

以平方数为距离,确定下一试探桶单元

[hash(key) + 1^2] % M,[hash(key) + 2^2] % M,[hash(key) + 3^2] % M,......


优点、缺点及疑惑

数据聚集现象有所缓解

查找链上,各桶间距线性递增

一旦冲突,可聪明地跳离是非之地

若涉及外存,I/O将激增

只要有空桶,就一定能找出来吗?不能

【装填因子须足够小】

M若为合数,n^2 % M可能的取值必然少于M/2(向下取整)种——此时,只要对应的桶均非空

M若为素数:n^2 % M可能的取值恰好会有M/2(向下取整)种——此时,恰由查找链的前M/2(向下取整)项取遍

定理:若M是素数,且装填因子λ<=0.5,就一定能够找出,否则,不见得

【查找链前缀须足够长】

反证:假设M是素数,且装填因子λ<=0.5,存在0<=a<b<M/2(向下取整),使得沿着查找链,第a项和第b项彼此冲突

于是:a^2和b^2自然属于M的某一同余类,亦即

a^2=b^2 (mod M)

b^2 - a^2 = (b+a)(b-a) = 0 (mod M)

然而:0<b-a<a+b<M ——与M为素数矛盾


双向平方试探

自冲突位置起,依次向后试探

[hash(key) + 1^2] % M,[hash(key) - 1^2] % M,[hash(key) + 2^2] % M,[hash(key) - 2^2] % M,[hash(key) + 3^2] % M,[hash(key) - 3^2] % M,......

正向和逆向的子查找链,各包含M/2(向下取整)个互异的桶

表长取作素数M=4*k+3,必然可以保证查找链的前M项均互异

反之,M=4*k+1,就必然不可使用


双平方定理Two-Square Theorem of Fermat

任一素数p可表示为一对整数的平方和,当且仅当p%4 =1

只要注意到:

(u^2+v^2)*(s^2+t^2) = (us+vt)^2 + (ut - vs)^2

就不难推知:

任一自然数n可表示为一对整数的平方和,当且仅当在其素分解中,形如M=4*k+3的每一素因子均为偶数次方

©著作权归作者所有,转载或内容合作请联系作者
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

推荐阅读更多精彩内容