程序优化：算法对上SIMD+OMP(1)

现在的位置: 首页 > 综合 > 正文

RSS

程序优化：算法对上SIMD+OMP(1)

2013年02月04日 ⁄ 综合 ⁄ 共 1111字 ⁄ 字号小中大 ⁄ 评论关闭

传统处理方法

传统处理方法纯粹基于C＋＋，通过指针操作进行处理。通常的优化是使用定点数来代替浮点数，这里使用的方法为：

比值＝(颜色分量值 * 65535) / 255

转换成位移操作：

比值＝(颜色分量值 << 16) >> 8

进行一步简化：

比值＝颜色分量值 << 8

代码如下：

float test_Normal_Filter()

{

BYTE* buf = (BYTE *)malloc(1024 * 1024 * sizeof(int)); //分配内存：1024X1024 32bpp

BYTE* ptr = buf; // 操作指针

// 背景色，该颜色将与前景色进行溶

int background_R = 0xF8, background_G = 0xF8, background_B = 0xF8; 合

int dr, dg, db; // 颜色过滤比值

BEGIN_PERF() //记录开始时间

for ( int h = 0; h < 1024; h++ ) // 按行循环

{

for (int w = 0; w < 1024; w++ ) // 处理行

{

if ( (*(int *)ptr & 0x00070707) != 0 ) // 如果符合过滤条件，则进行处理

{

dr = (int)*(ptr + 2) << 8; // 计算比值：R * 65535 / 255

dg = (int)*(ptr + 1) << 8;

db = (int)*(ptr + 0) << 8;

//依次处理3个颜色分量

*(ptr + 2) = ((int)*(ptr + 2) * (65535 - dr) + background_R * dr) >> 16;

*(ptr + 1) = ((int)*(ptr + 1) * (65535 - dg) + background_R * dg) >> 16;

*(ptr + 0) = ((int)*(ptr + 0) * (65535 - db) + background_R * db) >> 16;

}

ptr += 4; // 以4为步进

}

END_PERF() // 记录结束时间

free(buf); // 释放内存

return GET_PERF(); // 返回操作花费的时间

}

在测试中发现，如果不使用OMP，该方法其实是最快的。这样的数据无关处理在形成流水线后，速度那是相当的快!

【上篇】判断iE并创建A标签
【下篇】再读声卡驱动(1)

作者: artichoke

该日志由 artichoke 于11年前发表在综合分类下，最后更新于 2013年02月04日.
转载请注明: 程序优化：算法对上SIMD+OMP(1) | 学步园 +复制链接

抱歉!评论已关闭.

学步园

程序优化：算法对上SIMD+OMP(1)

作者: artichoke

书签

最新文章New

本站推荐

返回首页