【密码学】一文读懂SipHash

本文涉及的产品
Redis 开源版,标准版 2GB
推荐场景:
搭建游戏排行榜
云数据库 Tair(兼容Redis),内存型 2GB
简介: 在redis的源码当中也有给出siphash(https://github.com/redis/redis/blob/unstable/src/siphash.c)的实现,这里直接给出链接,不贴出来具体的代码了,接下来,我们来看一下这个算法具体的结构。

【密码学】一文读懂SipHash


[WWBUB_7_KS[VYRLKF65O3R.jpgSIPHASH

在redis的源码当中也有给出siphash(https://github.com/redis/redis/blob/unstable/src/siphash.c)的实现,这里直接给出链接,不贴出来具体的代码了,接下来,我们来看一下这个算法具体的结构。


算法结构

从理论上来说SipHash这个算法实际上是有两个参数c和d的,因此完整的SipHash算法的表示方法为SipHash-c-d(k, m) 但是呢,一般情况下c取2然后d取4在上面提到过的redis的实现当中,就是这么干的,完整的SipHash过程如下:

Initialization

这一步,把输入的128bit的密钥,分成两个64bit的子密钥,然后得到如下的初始化的值:

image.png

Compression

首先,将输入的消息进行分块,按照小端序将每8个字节转换成为一个u64的数字  ,之后做如下的操作:

image.png

然后,经过c轮的SipRound,之后做如下的操作:

image.png

Finalization

经过上面压缩过程的处理,我们得到处理之后的四个状态值,v0, v1, v2, v3,然后通过

image.png

之后,经过d轮的SipRound,四个状态值异或得到最后的64bit的哈希输出。

image.png

感觉我对于上面这三个词,咋翻译咋别扭,索性就不翻译了,直接用英文来吧,完整的过程如下图:

R}_S{F2BHASA}T8AOC)GALL.pngSipHash过程

整个结构,到这里就介绍完了,整体其实也不算特别复杂,相对于前几篇文章提到过的MurMurHash系列稍微复杂了一点点,但是比起之前的MD5 SHA系列,这个过程相对来说就简单太多了。


代码实现

为了不让我写的go代码一股c味,因此呢,我去借(拷)鉴(贝)了一下Go 官方的密码学库,根据官方的风格来写一下这个代码。然后又去借鉴了一下其他人的代码实现,最终有了我这份代码,这里感谢开源作者们的贡献,这么搞一通之后,总算感觉我这代码有点Go的感觉了。

// blocks.go
package siphash
import (
  "encoding/binary"
  "math/bits"
)
func once(d *digest) {
  blocks(d, d.x[:])
}
func sipRound(v0, v1, v2, v3 uint64) (uint64, uint64, uint64, uint64) {
  v0 += v1
  v1 = bits.RotateLeft64(v1, 13)
  v1 ^= v0
  v0 = bits.RotateLeft64(v0, 32)
  v2 += v3
  v3 = bits.RotateLeft64(v3, 16)
  v3 ^= v2
  v0 += v3
  v3 = bits.RotateLeft64(v3, 21)
  v3 ^= v0
  v2 += v1
  v1 = bits.RotateLeft64(v1, 17)
  v1 ^= v2
  v2 = bits.RotateLeft64(v2, 32)
  return v0, v1, v2, v3
}
func finalize(d *digest) uint64 {
  d0 := *d
  once(&d0)
  v0, v1, v2, v3 := d0.v0, d0.v1, d0.v2, d0.v3
  v2 ^= 0xff
  v0, v1, v2, v3 = sipRound(v0, v1, v2, v3)
  v0, v1, v2, v3 = sipRound(v0, v1, v2, v3)
  v0, v1, v2, v3 = sipRound(v0, v1, v2, v3)
  v0, v1, v2, v3 = sipRound(v0, v1, v2, v3)
  return v0 ^ v1 ^ v2 ^ v3
}
func blocks(d *digest, p []uint8) {
  v0, v1, v2, v3 := d.v0, d.v1, d.v2, d.v3
  for len(p) >= BlockSize {
    m := binary.LittleEndian.Uint64(p)
    v3 ^= m
    v0, v1, v2, v3 = sipRound(v0, v1, v2, v3)
    v0, v1, v2, v3 = sipRound(v0, v1, v2, v3)
    v0 ^= m
    p = p[BlockSize:]
  }
  d.v0, d.v1, d.v2, d.v3 = v0, v1, v2, v3
}
// siphash.go
package siphash
import (
  "encoding/binary"
  "hash"
)
const (
  // BlockSize is the block size of hash algorithm in bytes.
  BlockSize = 8
  // Size is the size of hash output in bytes.
  Size = 8
  // Size128 is the size of 128-bit hash output in bytes.
  Size128 = 16
)
const (
  c0 = 0x736f6d6570736575
  c1 = 0x646f72616e646f6d
  c2 = 0x6c7967656e657261
  c3 = 0x7465646279746573
)
type digest struct {
  v0, v1, v2, v3 uint64  // state
  k0, k1         uint64  // keys
  x              [8]byte // buffer for unprocessed bytes
  nx             int     // number of bytes in buffer x
  size           int     // output size in bytes (8 or 16)
  t              uint8   // message bytes counter (mod 256)
}
func (d *digest) Sum(b []byte) []byte {
  if b != nil {
    _, _ = d.Write(b)
  }
  if d.size == Size {
    var res [8]byte
    r := d.Sum64()
    binary.LittleEndian.PutUint64(res[:], r)
    return res[:]
  } else {
    var res [16]byte
    r0, r1 := d._Sum128()
    binary.LittleEndian.PutUint64(res[:8], r0)
    binary.LittleEndian.PutUint64(res[8:], r1)
    return res[:]
  }
}
func newDigest(size int, key []byte) *digest {
  if size != Size && size != Size128 {
    panic("size must be 8 or 16")
  }
  d := new(digest)
  d.k0 = binary.LittleEndian.Uint64(key[0:])
  d.k1 = binary.LittleEndian.Uint64(key[8:])
  d.size = size
  d.Reset()
  return d
}
func New(key []byte) hash.Hash64 {
  return newDigest(Size, key)
}
func New128(key []byte) hash.Hash {
  return newDigest(Size128, key)
}
func (d *digest) Size() int { return d.size }
func (d *digest) BlockSize() int { return BlockSize }
func (d *digest) Write(p []byte) (nn int, err error) {
  nn = len(p)
  d.t += uint8(nn)
  if d.nx > 0 {
    n := len(p)
    if n > BlockSize-d.nx {
      n = BlockSize - d.nx
    }
    d.nx += copy(d.x[d.nx:], p)
    if d.nx == BlockSize {
      once(d)
      d.nx = 0
    }
    p = p[n:]
  }
  if len(p) >= BlockSize {
    n := len(p) &^ (BlockSize - 1)
    blocks(d, p[:n])
    p = p[n:]
  }
  if len(p) > 0 {
    d.nx = copy(d.x[:], p)
  }
  return
}
func (d *digest) Sum64() uint64 {
  for i := d.nx; i < BlockSize-1; i++ {
    d.x[i] = 0
  }
  d.x[7] = d.t
  return finalize(d)
}
func (d *digest) _Sum128() (r0, r1 uint64) {
  for i := d.nx; i < BlockSize-1; i++ {
    d.x[i] = 0
  }
  d.x[7] = d.t
  blocks(d, d.x[:])
  v0, v1, v2, v3 := d.v0, d.v1, d.v2, d.v3
  v2 ^= 0xee
  v0, v1, v2, v3 = sipRound(v0, v1, v2, v3)
  v0, v1, v2, v3 = sipRound(v0, v1, v2, v3)
  v0, v1, v2, v3 = sipRound(v0, v1, v2, v3)
  v0, v1, v2, v3 = sipRound(v0, v1, v2, v3)
  r0 = v0 ^ v1 ^ v2 ^ v3
  v1 ^= 0xdd
  v0, v1, v2, v3 = sipRound(v0, v1, v2, v3)
  v0, v1, v2, v3 = sipRound(v0, v1, v2, v3)
  v0, v1, v2, v3 = sipRound(v0, v1, v2, v3)
  v0, v1, v2, v3 = sipRound(v0, v1, v2, v3)
  r1 = v0 ^ v1 ^ v2 ^ v3
  return
}
func (d *digest) Reset() {
  d.v0 = d.k0 ^ c0
  d.v1 = d.k1 ^ c1
  d.v2 = d.k0 ^ c2
  d.v3 = d.k1 ^ c3
  d.t = 0
  d.nx = 0
  if d.size == Size128 {
    d.v1 ^= 0xee
  }
}

接下来的rust版,那么就佛系来写了,虽然感觉我rust写的也是一股c味,等着我去抄一抄rust的官方实现,这里偷个懒,只给出64位hash的实现了。

use std::cmp::min;
use std::convert::TryInto;
struct SipHash {
    v0: u64,
    v1: u64,
    v2: u64,
    v3: u64,
}
impl SipHash {
    pub fn new(key: &[u8]) -> SipHash {
        // initialization
        let k0 = u64::from_le_bytes(key[0..8].try_into().unwrap());
        let k1 = u64::from_le_bytes(key[8..16].try_into().unwrap());
        SipHash {
            v0: k0 ^ 0x736f6d6570736575,
            v1: k1 ^ 0x646f72616e646f6d,
            v2: k0 ^ 0x6c7967656e657261,
            v3: k1 ^ 0x7465646279746573,
        }
    }
    fn round(&mut self) {
        self.v0 = self.v0.wrapping_add(self.v1);
        self.v1 = self.v1.rotate_left(13);
        self.v1 ^= self.v0;
        self.v0 = self.v0.rotate_left(32);
        self.v2 = self.v2.wrapping_add(self.v3);
        self.v3 = self.v3.rotate_left(16);
        self.v3 ^= self.v2;
        self.v0 = self.v0.wrapping_add(self.v3);
        self.v3 = self.v3.rotate_left(21);
        self.v3 ^= self.v0;
        self.v2 = self.v2.wrapping_add(self.v1);
        self.v1 = self.v1.rotate_left(17);
        self.v1 ^= self.v2;
        self.v2 = self.v2.rotate_left(32);
    }
    pub fn hash(&mut self, message: &[u8]) -> Vec<u8> {
        // config
        let c = 2;
        let d = 4;
        // b
        let b: u64 = ((message.len() % 256) as u64) << (8 * 7);
        let mut chunks = message.chunks_exact(8);
        while let Some(chunk) = chunks.next() {
            let mut chunk = u64::from_le_bytes(chunk.try_into().unwrap());
            self.v3 ^= chunk;
            for _ in 0..c {
                self.round();
            }
            self.v0 ^= chunk;
        }
        let mut remainder = chunks.remainder().to_vec();
        if remainder.len() > 0 {
            for _ in 0..(8 - remainder.len()) {
                remainder.push(0x00)
            }
            let mut chunk = u64::from_le_bytes(remainder.try_into().unwrap());
            chunk ^= b;
            self.v3 ^= chunk;
            for _ in 0..c {
                self.round();
            }
            self.v0 ^= chunk;
        }
        // finalization
        self.v2 ^= 0xff;
        for _ in 0..d {
            self.round();
        }
        (self.v0 ^ self.v1 ^ self.v2 ^ self.v3).to_be_bytes().to_vec()
    }
}


相关实践学习
基于Redis实现在线游戏积分排行榜
本场景将介绍如何基于Redis数据库实现在线游戏中的游戏玩家积分排行榜功能。
云数据库 Redis 版使用教程
云数据库Redis版是兼容Redis协议标准的、提供持久化的内存数据库服务,基于高可靠双机热备架构及可无缝扩展的集群架构,满足高读写性能场景及容量需弹性变配的业务需求。 产品详情:https://www.aliyun.com/product/kvstore &nbsp; &nbsp; ------------------------------------------------------------------------- 阿里云数据库体验:数据库上云实战 开发者云会免费提供一台带自建MySQL的源数据库&nbsp;ECS 实例和一台目标数据库&nbsp;RDS实例。跟着指引,您可以一步步实现将ECS自建数据库迁移到目标数据库RDS。 点击下方链接,领取免费ECS&amp;RDS资源,30分钟完成数据库上云实战!https://developer.aliyun.com/adc/scenario/51eefbd1894e42f6bb9acacadd3f9121?spm=a2c6h.13788135.J_3257954370.9.4ba85f24utseFl
相关文章
|
存储 Rust 并行计算
【密码学】一文读懂XTS模式
这篇文章的灵感来源于我偶然翻到的一个某U盘有关磁盘加密的一个介绍(这一篇不是广告蛤), 然后发现这个模式我之前还真没遇到过,因此呢,就学习了一下,就出来了这一篇文章。
5266 0
【密码学】一文读懂XTS模式
|
Rust 算法 Go
【密码学】一文读懂MurMurHash3
本文应该是MurMurHash算法介绍的最后一篇,来一起看一下最新的MurMurHash算法的具体过程,对于最新的算法来说,整个流程和之前的其实也比较相似,这里从维基百科当中找到了伪代码,也就不贴出来Google官方给出的推荐代码了,先来看一下维基百科给出的伪代码,这里只有32位的伪代码。
2191 0
【密码学】一文读懂MurMurHash3
|
Rust 算法 网络安全
【密码学】一文读懂CMAC
介于上一篇文章比较水,然后这个和上一篇也比较相似,CMAC是为了解决DAA当中安全性不足的问题而出现的,这个算法一共有三个密钥,K, K1, K2, 其中K1和K2可以由K导出,接下来就来一起看一下CMAC的具体过程吧,这一篇文章其实也不长。
3786 0
【密码学】一文读懂CMAC
|
算法 数据安全/隐私保护
【密码学】一文读懂Whirlpool
首先呢,祝大家今晚节日快乐,Whirlpool是由Vincent Rijmen(高级加密标准的联合创始人)和Paulo S.L.M.Barreto设计的,后者于2000年首次提出了它。
1119 0
【密码学】一文读懂Whirlpool
|
Web App开发 Rust 算法
【密码学】一文读懂ChaCha20
好久没写新的加密算法的原理了, 这次所选取的加密算法结构比较简单, 一起来看一下吧。
7809 0
【密码学】一文读懂ChaCha20
|
Rust 算法 安全
【密码学】一文读懂MurMurHash2
上次我们聊过了一代的MurMurHash算法,是的,我又来水文章了,今天呢,接着来聊一下二代的MurMurHash算法,二代算法的整体结构实际上和一代算法差不太多,只是对于每一轮数据的处理过程当中的运算有一些差异,算法的来源依然是来自于Google官网给提供的源码,对着源码看的结构,对于这个算法呢,有两个版本,一个是32位的,一个是64位的,对于32位的算法和64位的算法,区别在于两个初始的魔数不同,整体运算过程还是十分相似的。
2224 0
【密码学】一文读懂MurMurHash2
|
Rust 算法 数据安全/隐私保护
【密码学】一文读懂XTEA加密
本篇文章,我们来看一下上一次讲过的TEA加密算法的一个升级版XTEA, 相比于TEA, XTEA的安全性显然是更高的,其中的过程要比TEA稍微复杂一点点。
1285 0
【密码学】一文读懂XTEA加密
|
算法 安全 Go
【密码学】一文读懂HKDF
我这又来水一篇文章,来聊一下HKDF(基于HMAC的密钥导出函数)。密钥派生函数是密钥管理的组成部分,他的目标是通过一些初始的数据派生出来密码学安全的随机密钥。
3120 1
【密码学】一文读懂HKDF
|
存储 安全 算法
为什么人人都要懂点密码学
人类进入二十一世纪以来,随着计算机和移动设备的普及高速发展,我们的社会已经高度信息化,为了防止信息被窃取、修改,就需要对信息的存储、传递进行加密处理,而加密就需要使用到加密算法,解密需要使用密码才可以看到原文。
236 1
|
算法 搜索推荐 安全
【密码学】一文读懂CCM
本文简单介绍了CCM模式下的认证和加密机制,实际上这个是AES-CTR模式和CMAC的一个组合,如果理解了前面这两个,本文应该还是比较好理解的。
3417 0
【密码学】一文读懂CCM