本文主要是介绍RGB2GRAY 各种算法速度比较,整形乘法比查表法快!,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!
1. 查表法,外循环用 这种格式 :
//for(int j = 0; j != h; ++j)//
for(int i = 0; i!=w;++i)//、
for(int j = 0; j != h; ++j)for(int i = 0; i!=w;++i){int r,g,b,y,r1,g1,b1,y1;r = D[in[of3]];//查表 //这里给第一个ALU执行g = E[in[of3+1]];b = F[in[of3+2]];y = r + g + b;out[of] = y;of3 +=3;of+=1;}
耗时: 1000ms
2. 查表法, 外循环用这种格式 : for(int i = 0; i != img_size; ++i)
for(int i = 0; i != img_size; ++i){int r,g,b,y,r1,g1,b1,y1;r = D[in[of3+2]];//查表 //这里给第一个ALU执行g = E[in[of3+1]];b = F[in[of3]];y = r + g + b;out[i] = y;of3 +=3;}
耗时 700ms
3. 整形乘法, 1ALU
for(int i = 0; i != img_size; ++i){int r,g,b,y,r1,g1,b1,y1;r = 1224 * in[of3+2];g = 2404 * in[of3+1];b = 467 * in[of3];y = r + g + b;y = y >> 12; //这里去掉了除法运算out[i] = y;of3 +=3;}
耗时: 550ms
4. 整形乘法 : 2ALU
for(int i = 0; i != img_size; i+=2) //一次并行处理2个数据{int r,g,b,y,r1,g1,b1,y1;r = 1224 * in[of6+2];g = 2404 * in[of6+1];b = 467 * in[of6];y = r + g + b;y = y >> 12;out[i] = y;r1 = 1224 * in[of6+5];g1 = 2404 * in[of6+4];b1 = 467 * in[of6+3];y = r1 + g1 + b1;y = y >> 12;out[i + 1] = y;of6 += 6;//of += 1;}
耗时:450ms
5. 根据实验,发现bgr2y 函数是否加inline 对耗时无明显影响, 为了保险,还是应该加上inline。
思考:
1. 2ALU算法比1ALU算法快10%~25%
2.整形乘法法比查表法快 18%,至于为什么会比查表法快,是因为现在的CPU使用的都是硬件乘法器,比操作内存要快!!
这篇关于RGB2GRAY 各种算法速度比较,整形乘法比查表法快!的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!