现在的位置: 首页 > 综合 > 正文

BLAS开发过程难题

2013年09月20日 ⁄ 综合 ⁄ 共 351字 ⁄ 字号 评论关闭
文章目录

问题

1.kernel内部怎么写成模版形式?

2.BLAS中N注释是vector的长度,但在fortran语句中有歧义?XY长度关系需要优化

3.opencl部分应该写成一个父类然后继承。

 

过程日志

1.2013.2.25 xasum中的(sasum、dasum、dzasum、scasum)求和函数不能写成kernel,而且复数求和,方法有问题,SC中绝对值求和,是把实部的绝对值和虚部的绝对值加到一起,这与复数求绝对值的方法不一样。DZ中,是把复数变成双精度后加上虚部的绝对值,不可理解。

2.2013.2.25 xrotm程序跟注释描述不一样,注释中描述的DFLAG=-2的情况,在程序中并没有

3.2013.2.26 XDOTU incy incx地方需要优化 可以有小于零的情况,需要加个Y数组的长度  以增加灵活性。

抱歉!评论已关闭.