网站首页 > 物联资讯 > 技术分享

图像编程学习笔记2――bmp位图平移

2016-09-28 00:00:00 广州睿丰德信息科技有限公司 阅读
睿丰德科技 专注RFID识别技术和条码识别技术与管理软件的集成项目。质量追溯系统、MES系统、金蝶与条码系统对接、用友与条码系统对接

以下文字内容copy于<<数字图像处理编程入门>>,code为自己实现,是win32控制台程序。

2.1 平移

平移(translation)变换大概是几何变换中最简单的一种了。

如图2.1所示,初始坐标为(x0,y0)的点经过平移(tx,ty)(以向右,向下为正方向)后,坐标变为(x1,y1)。这两点之间的关系是x1=x0+tx,y1=y0+ty

RFID设备管理RFID资产管理,RFID仓库管理,RFID珠宝,RFID生产线,RFID手持机,RFID读写器,广州睿丰德

 

图2.1    平移的示意图

以矩阵的形式表示为

RFID设备管理RFID资产管理,RFID仓库管理,RFID珠宝,RFID生产线,RFID手持机,RFID读写器,广州睿丰德(2.1)

 

       

我们更关心的是它的逆变换:

RFID设备管理RFID资产管理,RFID仓库管理,RFID珠宝,RFID生产线,RFID手持机,RFID读写器,广州睿丰德(2.2)

这是因为:我们想知道的是平移后的图象中每个象素的颜色。例如我们想知道,新图中左上角点的RGB值是多少?很显然,该点是原图的某点经过平移后得到的,这两点的颜色肯定是一样的,所以只要知道了原图那点的RGB值即可。那么到底新图中的左上角点对应原图中的哪一点呢?将左上角点的坐标(0,0)入公式(2.2),得到x0=-tx,y0=-ty;所以新图中的(0,0)点的颜色和原图中(-tx, -ty)的一样。

这样就存在一个问题:如果新图中有一点(x1,y1),按照公式(2.2)得到的(x0,y0)不在原图中该怎么办?通常的做法是,把该点的RGB值统一设成(0,0,0)或者(255,255,255)。

另一个问题是:平移后的图象是否要放大?一种做法是不放大,移出的部分被截断。例如,图2.2为原图,图2.3为移动后的图。这种处理,文件大小不会改变。

RFID设备管理RFID资产管理,RFID仓库管理,RFID珠宝,RFID生产线,RFID手持机,RFID读写器,广州睿丰德

 

图2.2     移动前的图

RFID设备管理RFID资产管理,RFID仓库管理,RFID珠宝,RFID生产线,RFID手持机,RFID读写器,广州睿丰德

 

图2.3     移动后的图

还有一种做法是:将图象放大,使得能够显示下所有部分,如图2.4所示。

 

RFID设备管理RFID资产管理,RFID仓库管理,RFID珠宝,RFID生产线,RFID手持机,RFID读写器,广州睿丰德

图2.4    移动后图象被放大

这种处理,文件大小要改变。设原图的宽和高分别是w1,h1则新图的宽和高变为w1+|tx|和h1+|ty|,加绝对值符号是因为tx,ty有可能为负(即向左,向上移动)。

下面的函数Translation采用的是第一种做法,即移出的部分被截断。在给出源代码之前,先说明一个问题。

如果你用过Photoshop,CorelPhotoPaint等图象处理软件,可能听说过“灰度图”(grayscale)这个词。灰度图是指只含亮度信息,不含色彩信息的图象,就象我们平时看到的黑白照片:亮度由暗到明,变化是连续的。因此,要表示灰度图,就需要把亮度值进行量化。通常划分成0到255共256个级别,其中0最暗(全黑),255最亮(全白)。.bmp格式的文件中,并没有灰度图这个概念,但是,我们可以很容易在.bmp文件中表示灰度图。方法是用256色的调色板,只不过这个调色板有点特殊,每一项的RGB值都是相同的。也就是说RGB值从(0,0,0),(1,1,1)一直到(255,255,255)。(0,0,0)是全黑色,(255,255,255)是全白色,中间的是灰色。这样,灰度图就可以用256色图来表示了。为什么会这样呢?难道是一种巧合?其实并不是。

在表示颜色的方法中,除了RGB外,还有一种叫YUV的表示方法,应用也很多。电视信号中用的就是一种类似于YUV的颜色表示方法。

在这种表示方法中,Y分量的物理含义就是亮度,U和V分量代表了色差信号(你不必了解什么是色差,只要知道有这么一个概念就可以了)。使用这种表示方法有很多好处,最主要的有两点:

(1)    因为Y代表了亮度,所以Y分量包含了灰度图的所有信息,只用Y分量就能完全能够表示出一幅灰度图来。当同时考虑U,V分量时,就能够表示出彩色信息来。这样,用同一种表示方法可以很方便的在灰度和彩色图之间切换,而RGB表示方法就做不到这一点了。

(2)    人眼对于亮度信号非常敏感,而对色差信号的敏感程度相对较弱。也就是说,图象的主要信息包含在Y分量中。这就提示我们:如果在对YUV信号进行量化时,可以“偏心”一点,让Y的量化级别多一些(谁让它重要呢?)而让UV的量化级别少一些,就可以实现图象信息的压缩。这一点将在第9章介绍图象压缩时仔细研究,这里就不深入讨论了。而RGB的表示方法就做不到这一点,因为RGB三个分量同等重要,缺了谁也不行。YUV和RGB之间有着如下的对应关系

 

RFID设备管理RFID资产管理,RFID仓库管理,RFID珠宝,RFID生产线,RFID手持机,RFID读写器,广州睿丰德(2.3)

RFID设备管理RFID资产管理,RFID仓库管理,RFID珠宝,RFID生产线,RFID手持机,RFID读写器,广州睿丰德(2.4)

当RGB三个分量的大小一样时,假设都是a,代入公式(2.3),得到Y=a,U=0,V=0 。你现在该明白我前面所说不是巧合的原因了吧。

使用灰度图有一个好处,那就是方便。首先RGB的值都一样;其次,图象数据即调色板索引值,也就是实际的RGB值,也就是亮度值;另外,因为是256色调色板,所以图象数据中一个字节代表一个象素,很整齐。如果是2色图或16色图,还要拼凑字节,很麻烦。如果是彩色的256色图,由于图象处理后有可能会产生不属于这256种颜色的新颜色,就更麻烦了;这一点,今后你就会有深刻体会的。所以,做图象处理时,一般采用灰度图。为了将重点放在算法本身上,今后给出的程序如不做特殊说明,都是针对256级灰度图的。其它颜色的情况,你可以自己想一想,把算法补全。

如果想得到一幅灰度图,可以使用Sea或者PhotoShop等软件提供的颜色转换功能将彩色图转换成灰度图。

好了,言归正传,下面给出Translation的源代码。算法的思想是先将所有区域填成白色,然后找平移后显示区域的左上角点(x0,y0)和右下角点(x1,y1) ,分几种情况进行处理。

先看x方向(width指图象的宽度)

(1)    tx≤-width:很显然,图象完全移出了屏幕,不用做任何处理;

(2)    -width<tx≤0:如图2.5所示。容易看出,图象区域的x范围从0到width-|tx|,对应原图的范围从|tx|到width;

RFID设备管理RFID资产管理,RFID仓库管理,RFID珠宝,RFID生产线,RFID手持机,RFID读写器,广州睿丰德

 

图2.5     tx≤0,ty≤0的情况

(3)    0< tx<width:如图2.6所示。容易看出,图象区域的x范围从tx到width,对应原图的范围从0到width - tx

RFID设备管理RFID资产管理,RFID仓库管理,RFID珠宝,RFID生产线,RFID手持机,RFID读写器,广州睿丰德

 

图2.6     0< tx<width,0<ty<height的情况

(4)    tx≥width:很显然,图象完全移出了屏幕,不用做任何处理。

y方向是对应的(height表示图象的高度):

(1)    ty≤-height,图象完全移出了屏幕,不用做任何处理;

(2)    -height<ty≤0,图象区域的y范围从0到height-|ty|,对应原图的范围从|ty|到height;

(3)    0<ty<height,图象区域的y范围从ty到height,对应原图的范围从0到height-ty

(4)    ty≥height,图象完全移出了屏幕,不用做任何处理。

这种做法利用了位图存储的连续性,即同一行的象素在内存中是相邻的。利用memcpy函数,从(x0,y0)点开始,一次可以拷贝一整行(宽度为x1-x0),然后将内存指针移到(x0,y0+1)处,拷贝下一行。这样拷贝(y1-y0)行就完成了全部操作,避免了一个一个象素的计算,提高了效率。

CODE:(注:该程序需要一副bmp格式的灰度图像,并放到工程目录下,文件名为nv1.bmp)

 

[cpp] view plaincopy  
    1. /** 
    2. * 程序名: Translation.cpp 
    3. * 功  能: 实现bmp格式灰度图片的平移,移出部分用白色填充 
    4. */  
    5. #include <iostream>  
    6. #include <cstdio>  
    7. #include <fstream>  
    8. #include <cstring>  
    9. #include <windows.h>  
    10. using namespace std;  
    11. BITMAPFILEHEADER bmpFileHeader;      //位图文件头  
    12. BITMAPINFOHEADER bmpInfoHeader;      //位图信息头  
    13. RGBQUAD *pColorTable = new RGBQUAD[256];  //颜色表指针  
    14. unsigned char *pBmpData;             //图像数据指针  
    15. unsigned char *pBmpData1;            //平移后图像数据指针  
    16. unsigned char *pTemp,*pTemp1;        //临时指针   
    17. int width,height,imgSize;            //图像宽,高,实际大小,imgSize必须为4的倍数,bmp格式文件结构规定  
    18. int srcX[2],srcY[2],dstX[2],dstY[2]; //平移前后位置  
    19. /** 
    20. * 函数名: readBmp 
    21. * 参  数: bmpFileName--指向读入bmp文件的文件名指针 
    22. * 功  能: 读入一个bmp文件,获得相应数据 
    23. */   
    24. bool readBmp(char *bmpFileName)  
    25. {  
    26.     FILE *fp = fopen(bmpFileName,"rb");    //以二进制读方式打开指定的图像文件  
    27.     if(NULL == fp)  
    28.     {  
    29.         printf("%s is not exist!",bmpFileName);  
    30.         return FALSE;  
    31.     }  
    32.     fread(&bmpFileHeader,sizeof(BITMAPFILEHEADER),1,fp);   //读取位图头信息放入bmpFileHeader,注:指针也相应移动  
    33.     fread(&bmpInfoHeader,sizeof(BITMAPINFOHEADER),1,fp);   //读取位图信息头放入bmpInfoHeader  
    34.     width = bmpInfoHeader.biWidth;                          //宽  
    35.     height = bmpInfoHeader.biHeight;                        //高  
    36.     fread(pColorTable,sizeof(RGBQUAD),256,fp);              //读取颜色表放入pColorTable  
    37.     //  int bytePerLine = (bmpInfoHeader.biWidth * bmpInfoHeader.biBitCount + 31) / 32 * 4;  
    38.     pBmpData = new unsigned char [imgSize = bmpInfoHeader.biSizeImage];   
    39.     pBmpData1 = new unsigned char [imgSize];  
    40.     memset(pBmpData1,(BYTE)255,sizeof(char)*imgSize);       //把新的图像信息用255(白色)填充,平移后没有图像的区域就是白色了  
    41.     fread(pBmpData,sizeof(char),bmpInfoHeader.biSizeImage,fp);  //读取图像信息放入pBmpData  
    42.     fclose(fp);                //记住要关闭文件  
    43.     return TRUE;  
    44.       
    45. }  
    46. /** 
    47. * 函数名: translation 
    48. * 参  数: tx--平移的x距离,ty--平移的y距离 
    49. * 功  能: 实现平移,并把平移后图像信息写入pBmpData1 
    50. */   
    51. void translation(int tx,int ty)  
    52. {  
    53.     bool xVisible = TRUE,yVisible = TRUE;  
    54.     //xVisible为FALSE时,表示x方向已经移出了可显示的范围  
    55.     if(tx <= -width)  
    56.     {  
    57.         xVisible = FALSE;  
    58.     }  
    59.     else if(tx <= 0)  
    60.     {  
    61.         dstX[0] = 0;    //表示移动后,有图区域的左上角点的x坐标  
    62.         dstX[1] = width + tx;   //表示移动后,有图区域的右下角点的x坐标  
    63.     }  
    64.     else if(tx < width)  
    65.     {  
    66.         dstX[0] = tx;  
    67.         dstX[1] = width;  
    68.     }  
    69.     else  
    70.         xVisible = FALSE;  
    71.     srcX[0] = dstX[0] - tx;      //对应DstX0在原图中的x坐标  
    72.     srcX[1] = dstX[1] - tx;     //对应DstX1在原图中的x坐标  
    73.     int rectWidth = srcX[1] - srcX[0];  //有图区域的宽度  
    74.     //y的和x类似,就不加注释了  
    75.     if(ty <= -height)  
    76.         yVisible = FALSE;  
    77.     else if(ty <= 0)  
    78.     {  
    79.         dstY[0] = 0;  
    80.         dstY[1] = height + ty;  
    81.     }  
    82.     else if(ty < height)  
    83.     {  
    84.         dstY[0] = ty;  
    85.         dstY[1] = height;  
    86.     }  
    87.     else   
    88.         yVisible = FALSE;  
    89.     srcY[0] = dstY[0] - ty;  
    90.     srcY[1] = dstY[1] - ty;  
    91.     int rectHeight = srcY[1] - srcY[0];  
    92.   
    93.     int lineBytes = (width * bmpInfoHeader.biBitCount + 31) / 32 * 4;   //每行所占的字节数,必须为4的倍数  
    94.     if(xVisible && yVisible)  
    95.     {  
    96.         for(int i = 0; i < rectHeight; i++ )  
    97.         {  
    98.             //pTemp指向要拷贝的那一行的最左边的象素对应在原图中的位  
    99.             //置。特别要注意的是,由于.bmp是上下颠倒的,  
    100.             pTemp = pBmpData + (height - 1 - (srcY[0] + i)) * lineBytes + srcX[0];    
    101.             //pTemp1指向要拷贝的那一行的最左边的象素对应在新图中的位置。同样要注意上面的问题。  
    102.             pTemp1 = pBmpData1 + (height - 1 - (dstY[0] + i)) * lineBytes + dstX[0];  
    103.             memcpy(pTemp1,pTemp,rectWidth);   //从pTemp中复制大小为rectWidth的数据到pTemp1,这里就是copy图像的一行数据  
    104.         }  
    105.     }  
    106. }  
    107. /** 
    108. * 函数名: writeBmp 
    109. * 功  能: 新建一个bmp文件,把平移后的图像信息写入,生成一个新的bmp 
    110. */   
    111. void writeBmp()  
    112. {  
    113.     char writeBmpName[] = "new.bmp";  
    114.     FILE *fp = fopen(writeBmpName,"wb");   //以二进制写方式打开指定的图像文件  
    115.     if(NULL == fp)        
    116.     {  
    117.         cout<<"file not exist!";  
    118.         return ;  
    119.     }  
    120.     //写入BMP文件数据  
    121.     fwrite(&bmpFileHeader,sizeof(BITMAPFILEHEADER),1,fp);  
    122.     fwrite(&bmpInfoHeader,sizeof(BITMAPINFOHEADER),1,fp);  
    123.     fwrite(pColorTable,sizeof(RGBQUAD),256,fp);  
    124.     fwrite(pBmpData1,sizeof(char),imgSize,fp);  
    125.     fclose(fp);  
    126.     //释放内存  
    127.     delete []pColorTable;  
    128.     delete []pBmpData1;  
    129.     delete []pBmpData;  
    130.   
    131.       
    132. }  
    133. /** 
    134. * 函数名: work 
    135. * 功  能: 处理 
    136. */   
    137. void work()  
    138. {  
    139.     int x,y;  
    140.     char readBmpName[] = "nv1.bmp";  
    141.     if ( !readBmp(readBmpName) )  
    142.         printf("Bmp file reads faliure");  
    143.     printf("the distance of translation,cx,cy:");  //读入平移的x和y  
    144.     scanf("%d %d",&x,&y);  
    145.     translation(x,y);  
    146.     writeBmp();  
    147. }  
    148. int main()  
    149. {  
    150.     work();   
    151.     return 0;  
    152. }  
    153.                                  from:http://blog.csdn.net/sun1956/article/details/8646800
RFID管理系统集成商 RFID中间件 条码系统中间层 物联网软件集成