目前的网卡都提供了multi queue的功能, 为了提高I/O能力, 在多核cpu上可以打开RSS功能,使同一条流的数据包hash到同一个rx queue中, 将每一个rx queue绑定到一个cpu core上, 这样就可以多个cpu core并行的处理数据包, 使得处理能力大大的提高。
但是根据Intel 82599手册提供的算法, 发现目前的算法只能将同一个tcp会话中同一个方向的数据包hash到同一个rx queue中, 而另一个方向的数据包会hash到不同的rx queue中, 这对后面应用层的分析会造成很大的cache trashing
下面是Intel 82599手册提供的RSS 算法:
function ComputeRSSHash(Input[], RSK)
ret = 0;
for each bit b in Input[] do
if b == 1 then
ret ˆ= (left-most 32 bits of RSK);
end if
shift RSK left 1 bit position;
end for
end function
为了提高性能, Intel将这个算法通过硬件实现, 因此想要通过修改算法而得到一个对称的RSS几乎是不可能的, 但是RSK是我们在驱动中可以控制的, 在driver第一次load的时候可以指定,所以我们可以通过更新RSK来得到一个对称的hash结果。
下面是韩国人发表的一篇paper中提到的算法
http://www.ndsl.kaist.edu/~shinae/papers/TR-symRSS.pdf
TO-DO