數(shù)字圖像縮放技術(shù)研究 畢業(yè)論文3

上傳人:仙*** 文檔編號:28888838 上傳時(shí)間:2021-09-17 格式:DOC 頁數(shù):33 大?。?.13MB
收藏 版權(quán)申訴 舉報(bào) 下載
數(shù)字圖像縮放技術(shù)研究 畢業(yè)論文3_第1頁
第1頁 / 共33頁
數(shù)字圖像縮放技術(shù)研究 畢業(yè)論文3_第2頁
第2頁 / 共33頁
數(shù)字圖像縮放技術(shù)研究 畢業(yè)論文3_第3頁
第3頁 / 共33頁

下載文檔到電腦,查找使用更方便

15 積分

下載資源

還剩頁未讀,繼續(xù)閱讀

資源描述:

《數(shù)字圖像縮放技術(shù)研究 畢業(yè)論文3》由會員分享,可在線閱讀,更多相關(guān)《數(shù)字圖像縮放技術(shù)研究 畢業(yè)論文3(33頁珍藏版)》請?jiān)谘b配圖網(wǎng)上搜索。

1、 本科畢業(yè)論文 題 目 數(shù)字圖像縮放技術(shù)研究 學(xué) 院 信息工程學(xué)院 專 業(yè) 電子信息工程 班 級 08信工3班 學(xué) 號 200883092 姓 名 張?bào)K 指導(dǎo)老師 于帥真 28 安徽財(cái)經(jīng)大學(xué)管理科學(xué)與工程學(xué)院本科畢業(yè)論文 摘 要 本文先對當(dāng)今數(shù)字電視的視頻格式特點(diǎn)做了一個(gè)總結(jié),以數(shù)字電視的視頻格式變換

2、為基礎(chǔ),引出了數(shù)字圖像縮放這一很重要的技術(shù)。接著在數(shù)學(xué)上從生產(chǎn)實(shí)踐上遇到的插值問題出發(fā),對插值技術(shù)做了一個(gè)必要的介紹,指明了目前數(shù)學(xué)的常見的插值類型。為了對算法進(jìn)行實(shí)現(xiàn),性能與運(yùn)算量做一個(gè)分析,引入了MATLAB這個(gè)功能強(qiáng)大的數(shù)學(xué)運(yùn)算軟件,對其功能、用途以及在數(shù)字圖像處理上常用的函數(shù)做了介紹。 數(shù)字圖像縮放技術(shù)主要基于插值算法。本文在介紹插值算法時(shí)首先介紹了最近鄰插值、雙線性插值和雙三次差值三種傳統(tǒng)插值算法,并從數(shù)學(xué)形態(tài)上分析其插值核函數(shù)引起的計(jì)算量和處理效果的不同。在此基礎(chǔ)上研究了當(dāng)今比較流行的1種縮放算法。然后對三種傳統(tǒng)算法和1種改進(jìn)算法編寫MATLAB程序進(jìn)行了數(shù)據(jù)實(shí)驗(yàn),對四種改進(jìn)算法

3、分別進(jìn)行必要的運(yùn)算量與性能分析,并進(jìn)行對比。最后,對文中所述插值算法做了總結(jié)。 關(guān)鍵詞:圖像縮放,插值技術(shù),分辨率變換,數(shù)字電視,圖像處理 ABSTRACT This paper researches on image scaling technology in HDTV. Firstly, popular HDTV video formats and interpolation algorithms are summarized briefly. Then, MATLAB, a powerful mathema

4、tical software, is introduced. Base on introduction of related technologies, three kinds of traditional interpolation algorithms and features of their kernel function are analyzed, including Nearest Neighbor Interpolation, Bilinear Interpolation and Bicubic Interpolation.. After that, one popular i

5、mage scaling algorithms are researched, and all mentioned algorithms are programmed on MATLAB. Performances of each algorithm are compared after data experiments on MATLAB. Finally, interpolation algorithms used in image scaling are summarized. KEY WORDS: image scaling, interpolation techniques, re

6、solution transform, HDTV, digital image processing 第1章 緒論 1 1.1 什么是數(shù)字電視 1 1.2 數(shù)字電視的視頻格式特點(diǎn) 1 1.3 研究意義和論文內(nèi)容安排 2 第2章 數(shù)字圖像縮放技術(shù)理論基礎(chǔ) 3 2.1 插值及其縮放技術(shù)綜述 3 2.1.1 圖像插值的目的與應(yīng)用 3 2.1.2 圖像縮放的目的與應(yīng)用 4 2.1.3 圖像插值與縮放的關(guān)系 4 2.1.4 圖像插值方法綜述 4 2.2 數(shù)字圖像(

7、image)數(shù)字圖像處理基本知識介紹 7 2.2.1 什么是數(shù)字圖像 7 2.2.2 數(shù)字圖像在計(jì)算機(jī)內(nèi)的處理 9 2.2.3 數(shù)字圖像處理概述 10 2.2.4 數(shù)字圖像文件格式 11 第3章傳統(tǒng)數(shù)字圖像縮放技術(shù) 13 3.1 數(shù)字圖像縮放技術(shù)概述 13 3.2 傳統(tǒng)的數(shù)字圖像縮放技術(shù) 14 3.2.1 最近鄰插值 14 3.2.2 雙線性插值 15 第4章當(dāng)今主流數(shù)字圖像縮放技術(shù)的算法 19 4.1 帶系數(shù)自適應(yīng)插值算法及其改進(jìn) 19 4.1.1 問題引出 19 4.1.2 數(shù)學(xué)推導(dǎo)與算法實(shí)現(xiàn) 19 第5章縮放算法處理結(jié)果

8、及比較 23 5.1 概述 23 5.2 傳統(tǒng)圖像縮放算法處理結(jié)果 23 5.3 帶系數(shù)自適應(yīng)插值算法及其改進(jìn)分析 24 總 結(jié) 26 致謝 27 參考文獻(xiàn) 28 第1章 緒論 隨著信息化時(shí)代的到來,數(shù)字化成為其中的主角,可以說信息化的實(shí)現(xiàn)是以信息化為前提的。從計(jì)算機(jī),互聯(lián)網(wǎng),數(shù)碼相機(jī),到數(shù)字電視無一例外的在演繹著這場數(shù)字化風(fēng)暴。尤其是數(shù)字電視,正在經(jīng)歷一場數(shù)字化的革命。但不管是數(shù)字電視,還是計(jì)算機(jī)都在利用數(shù)字化的視頻聲音與圖像等多媒體因素來沖擊人們的感官神經(jīng)。數(shù)字圖像的處理便成了其中的不可或缺的技術(shù),數(shù)字電

9、視接收各種圖像信號,包括標(biāo)清信號,高清信號等,最終把這些不同分辨率的視頻信號轉(zhuǎn)化為同一種分辨率的視頻信號進(jìn)行播放。因此,數(shù)字圖像分辨率放大和縮小技術(shù)是所有數(shù)字顯示設(shè)備的關(guān)鍵技術(shù)之一。 1.1 什么是數(shù)字電視 數(shù)字電視,即HDTV, 全稱High Definition Television,直譯即為“高清晰度電視”,現(xiàn)一般簡稱“高清電視”。與當(dāng)前采用模擬信號傳輸?shù)膫鹘y(tǒng)電視系統(tǒng)不同,HDTV采用數(shù)字信號傳輸。由于HDTV從電視節(jié)目的采集、制作到電視節(jié)目的傳輸以及用戶終端的接收全部實(shí)現(xiàn)數(shù)字化,因此HDTV可以帶給我們極高的清晰度,其分辨率最高可達(dá)19201080,幀速率高達(dá)60fps,視角也由原

10、先的4:3變成了16:9,同時(shí)全面應(yīng)用了數(shù)字技術(shù),其信號抗噪能力也大大加強(qiáng)。 1.2 數(shù)字電視的視頻格式特點(diǎn) 電視機(jī)的圖像分辨率可以用它的固有分辨率來表示,固有分辨率是指電視機(jī)或其他顯示設(shè)備無需采用行倍頻、行內(nèi)插或其他形式的分辨率變換手段而本身就能做到的圖像分辨率。它通常用水平方向像素和垂直方向像素兩者相乘來表示。例 如1027*768對于如等離子電視、液晶顯示電視或數(shù)字光處理電視等一類固定像素的顯示器來說固有分辨率與它們的實(shí)際像素排列結(jié)構(gòu)相同。 電視的畫面清晰度是以水平清晰度作為單位。通俗地說,我們可以把電視機(jī)上的畫面以水平方向分割成很多很多掃描線,分得越細(xì),這些畫面就越清楚。而水平線

11、數(shù)的掃描線數(shù)量也就越多。清晰度的單位是電視行(TV line)也稱線意思是從水平方向上看相當(dāng)于每行掃描線豎立起來,然后乘上)4:3 或者16:9的寬高比,構(gòu)成水平方向的總線數(shù)。 數(shù)字電視常見的視頻格式有: 1)1080i格式,是標(biāo)準(zhǔn)數(shù)字電視顯示模式1125條水平掃描線1080條可見水平掃描線,16:9,分辨率為1920*1080隔行/60Hz,行頻為33.75KHz。 2)720P格式,是標(biāo)準(zhǔn)數(shù)字電視顯示模式。750條水平掃描線,720條可見水平掃描線,16:9,分辨率為1280*720逐行/60Hz,行頻為45kHz。 3)1080P格式,是標(biāo)準(zhǔn)數(shù)字電視顯示模式,1125條水平掃描線

12、,1080條可見水平掃描線,16:9分辨率為 1920*1080逐行掃描,專業(yè)格式。 以上標(biāo)準(zhǔn)中i表示隔行P表示逐行TDTV標(biāo)準(zhǔn)是高品質(zhì)視頻信號標(biāo)準(zhǔn)包括1080i,720P,1080P。需要注意的是,對于電視機(jī)處理能力(例如帶寬)的要求則是1080i<720P。數(shù)字高清電視的720P,1080 I和1080P是由美國電影電視工程師協(xié)會確定的高清標(biāo)準(zhǔn)格式。其中1080P被稱為目前數(shù)字電視的頂級顯示格式。這種格式的電視在逐行掃描下能夠達(dá)到1920*1080的分辨率。目前世界上只有60英寸以上的顯示屏才能夠顯示出1920*1080的信號。 目前市場上出現(xiàn)的所謂1080P高清數(shù)字電視并不能真正給消費(fèi)

13、者帶來1920*1080的圖像。這些彩電只是能夠接收和處理1920*1080格式的信號而已。 1.3 研究意義和論文內(nèi)容安排 無論是何種視頻格式的終端顯示設(shè)備,其高清信號源都是同樣的分辨率。而當(dāng)今數(shù)字電視信號終端顯示設(shè)備又是各種各樣的,從普通的CRT,到高檔的液晶,等離子,其顯示方式和大小不盡相同,隨著3G技術(shù)的逐漸成熟,越來越多的手機(jī)可以接收數(shù)字電視信號,在小小的屏幕上顯示。這些都需要終端設(shè)備具備數(shù)字圖像的分辨率變換功能,因此數(shù)字圖像縮放技術(shù)顯得越來越重要,本文正是從這個(gè)背景出發(fā),來對傳統(tǒng)的以及當(dāng)今主流的縮放技術(shù)做了一個(gè)系統(tǒng)研究。第一章總結(jié)了數(shù)字電視的視頻格式特點(diǎn);第二章介紹了圖像縮放的

14、數(shù)學(xué)基礎(chǔ);第三章和第四章是論文主要內(nèi)容詳盡介紹傳統(tǒng)插值于主流插值算法并進(jìn)行算法實(shí)現(xiàn);第五章對論文所研究算法做了性能與運(yùn)算量的對比最后是對算法的技術(shù)展望。 第2章 數(shù)字圖像縮放理論基礎(chǔ) 2.1 插值及其縮放技術(shù)綜述 2.1.1 圖像插值的目的與應(yīng)用 Lehmann 等1999 年在其文獻(xiàn)中闡明,自從有了計(jì)算機(jī)圖形學(xué)和圖像處理,便有了圖像插值。所謂圖像插值就是一個(gè)圖像數(shù)據(jù)再生的過程——它由原始具有較低分辨率的圖像數(shù)據(jù)再生出具有更高分辨率的圖像數(shù)據(jù)。若根據(jù)一幅較低分辨率的圖像轉(zhuǎn)化成另一幅較高分辨率的圖像, 這種插值可看作“圖像內(nèi)的插值”(如應(yīng)用于圖像放大)。 若在若干幅圖像之間再生出幾幅新

15、的圖像,這種插值可看作“圖像間的插值”(如應(yīng)用于序列切片之間的插值)。圖像插值的直接后果是原來由較少的像素所刻劃的圖像(因而是粗糙的圖像)變成了由較多的像素所刻劃的圖像(因而是精細(xì)的圖像)。 圖像插值是圖像處理中的圖像重采樣過程的重要組成部分,而重采樣過程廣泛用于改善圖像質(zhì)量、進(jìn)行有損壓縮等等,因而圖像插值在醫(yī)學(xué)圖像處理中占據(jù)著特殊位置。 如醫(yī)學(xué)圖像處理中,序列切片圖像是重建三維解剖結(jié)構(gòu)的研究對象, 但由于切片之間的間距通常大于切片上像素之間的間距,因而不具有各向同性(isotropic),所以難以將序列切片直接用于三維重建。 Grevera 等在1996 年指出,產(chǎn)生醫(yī)學(xué)圖像插值的原因

16、大致有 ● 在產(chǎn)生圖像數(shù)據(jù)時(shí),無法給出各種應(yīng)用場合所需的分辨率; ● 圖像的分辨率受提供數(shù)據(jù)的設(shè)備的限制; ● 不允許花費(fèi)大量的時(shí)間去采集具有很高分辨率的數(shù)據(jù); ● 圖像數(shù)據(jù)量受存儲設(shè)備容量的限制; ● 有些采集數(shù)據(jù)的方法受輻射劑量的限制。 Lehmann 等在1999 年指出,插值在醫(yī)學(xué)圖像處理中主要用于 ● CCD(charge coupled device)照片中屏幕高寬比(aspect retio)的校正; ● MRI 等切片圖像的旋轉(zhuǎn); ● X 線圖像的透視投影(perspective projection)。 2.1.2 圖像縮放的目的與應(yīng)用 圖像放大和縮

17、?。ê喎Q縮放或放縮)是圖像處理的另一基本操作。所謂圖像縮放是指改變圖像的分辨率(image resolution)[MBU01]。圖像的這種處理手法在圖像顯示、傳輸(通訊)、圖像分析以及動畫制作、電影合成等方面有著相當(dāng)廣的應(yīng)用。 在醫(yī)學(xué)圖像處理中, 圖像縮放還用于 ● 切片間的圖像插值(reslicing); ● 用于診斷環(huán)節(jié)的器官細(xì)節(jié)定位; ● 多尺度處理時(shí)的圖像金字塔表示。 2.1.3 圖像插值與縮放的關(guān)系 圖像縮放常常借助于圖像插值來實(shí)現(xiàn)。 但,通常圖像縮放指的是一幅圖像的重采樣;而插值還指序列切片(或多幅圖像)間的采樣點(diǎn)加密。 因此,圖像插值、圖像縮放與圖像重采樣是互為

18、依存的圖像處理技術(shù)。 2.1.4 圖像插值方法綜述 將插值廣義地分為兩類――基于場景(scene-based)的圖像插值和基于對象(object-based)的圖像插值。前者用已有的切片體素?cái)?shù)據(jù)直接決定被插值體素?cái)?shù)據(jù),而后者則從已有的像素中獲取對象信息來決定被插值體素?cái)?shù)據(jù),完成插值。 1、常見的基于場景(scene-based)的插值方法有 1)最近領(lǐng)域法 該方法為最簡單、最快速、但最粗糙的插值方法, 它以歐氏距離最近的已知體素值作為待插值體素值。 2)灰度級線性插值 將未知像素顏色值用相鄰切片上對應(yīng)位置的兩已知像素顏色值線性組合表示。假設(shè)圖像在vk-1 及vk+1 處的顏

19、色值為f(vk-1)和 f(vk+1), 則圖像在未知的vk 處的顏色值可由下式近似計(jì)算 其中 而此處的模表示歐氏距離。上式常用于兩相鄰切片間的插值。 3) 二維線性插值(雙線性插值) 這是對最近領(lǐng)域法的一種改進(jìn), 即待插點(diǎn)處的顏色值用離待插點(diǎn)最近的四個(gè)點(diǎn)的顏色值加權(quán)求得。 4) 三次多項(xiàng)式 根據(jù)連續(xù)信號采樣定理, 若對采樣值用插值函數(shù) 則可準(zhǔn)確恢復(fù)原函數(shù), 當(dāng)然也就可以準(zhǔn)確得到采樣點(diǎn)間的任意點(diǎn)的值。三次插 值法將C(x)近似為三次多項(xiàng)式, 利用待插點(diǎn)周圍的16 個(gè)點(diǎn)的顏色值加權(quán)求得 待插點(diǎn)處的顏色值。 其它多項(xiàng)式形式的插值還有三次樣條插值、改進(jìn)的三次樣條插值、

20、雙三次 樣條插值、三次B-樣條插值等。 如三次樣條插值是將作為節(jié)點(diǎn), 構(gòu)造三次樣條插值插值多項(xiàng)式f(v), 求得f(vk)。這種方法常用于序列切片間的插值。 2、常見的基于對象(object-based)的插值方法有 1) 二進(jìn)制形式的基于形狀的插值 該方法分以下幾步 (1) 對二值圖像施行距離變換, 將每一像素賦以其到物體邊界的帶符號距離, 得到距離圖(distance map); (2) 插值此距離圖到所需的分辨率, 得到目的圖像的距離圖; (3) 將目的圖像的距離圖逆變換成二值形式的目的圖像 2) 灰度形式的基于形狀的插值 該方法分以下幾步 (1) 將相鄰兩已知

21、切片轉(zhuǎn)化成三維二值圖像;轉(zhuǎn)化的方法用“提升”(lifting)操作, 即在每一像素處拉出一個(gè)三維坐標(biāo), 其坐標(biāo)值為該像素的顏色值; (2) 將距離變換應(yīng)用到這兩幅二值圖像,即將每一像素賦以其到邊界的距離; (3) 插值這兩幅距離圖像得到未知切片的距離圖像, 其中插值方法通常用線性插值; (4) 將未知切片的距離圖像轉(zhuǎn)化為未知切片的三維二值圖像; (5) 將上述三維二值圖像“崩塌”(collapse)成二維灰度圖像。 3) Goshtasby 方法 Goshtasby 等提出了先找對應(yīng)點(diǎn), 再進(jìn)行線性插值的方法。這是切片間的插值方法,在每次插值時(shí)僅利用一對相鄰切片的像素信息。Gosh

22、tasby 將這兩片稱作參考圖像(reference image)和目標(biāo)圖像(target image),并將具有大梯度值的像素稱作特征點(diǎn)(feature point)。算法將位于參考圖像和目標(biāo)圖像上的特征點(diǎn)建立對應(yīng)關(guān)系,這種對應(yīng)關(guān)系允許參考圖像上的一個(gè)特征點(diǎn)可以和目標(biāo)圖像上n 個(gè)特征點(diǎn)建立對應(yīng)(n 為非負(fù)整數(shù))。 然后, 按每一組對應(yīng)點(diǎn)建立線性插值, 求得未知切片上的相應(yīng)像素的顏色值;而對于梯度較小的像素應(yīng)用常規(guī)的灰度形式的線性插值, 求得未知切片上其它像素的顏色值。 4) 其它的基于對象的插值方法 將序列切片先予以配準(zhǔn),再進(jìn)行線性插值, 算法自動根據(jù)兩片之間的組織信息進(jìn)行兩幅圖像上像素

23、之間的對應(yīng)( 包括誤配的檢測及校正)。Higgins 等1996 年提出了基于非線性過濾(nonlinear filtering)的序列切片灰度插值方法, 比傳統(tǒng)的插值算法(如最近鄰域法、線性、三次卷積及基于樣條的插值算法)更好地保持了區(qū)域邊界。Tam 等1998 年將二維圖像每一像素的顏色值看成第三維坐標(biāo), 建立一種稱為聯(lián)合球(union of spheres)的三維模型,再根據(jù)任兩幅切片圖像的聯(lián)合球產(chǎn)生任一新切片的聯(lián)合球, 從而反求出此新切片。這種方法較好地解決了數(shù)值不穩(wěn)定性問題――即許多處理技術(shù)所體現(xiàn)的算法依賴于輸入數(shù)據(jù)的情況,也無需用戶過多干預(yù)[TF98]。2000年,Chatzis

24、等引入了形態(tài)學(xué)骨架(morphological skeleton。)方法,這是一種有效的基于形狀的插值方法,Lee 等利用形態(tài)學(xué)的膨脹與腐蝕算法進(jìn)行切片間的插值。2001 年,Ballester 等在[BBC01]中研究了將圖像插值歸結(jié)為二階偏微分方程的變分問題的求解方法。 所有以上方法均可用作圖像間插值。 關(guān)于圖像內(nèi)的插值,除了前述的常規(guī)插值方法(如線性插值)外,還有以下一些技術(shù)。1993 年,Mahmoodi 等給出了自適應(yīng)的插值算法,對于文本區(qū)域使用5 階插值多項(xiàng)式,對于圖形區(qū)域利用三次樣條多項(xiàng)式,具有較好的處理效果。Gao 等1997 年將一幅二維圖像看成是對某二維連續(xù)函數(shù)(稱作圖

25、像場)的采樣結(jié)果。將圖像場(image field)看成能量場,則插值問題轉(zhuǎn)化成確定任一點(diǎn)處的勢能, 最后歸結(jié)為沿等勢能線的插值。該算法同時(shí)可用于圖像放大。1999 年,Plaziac 利用神經(jīng)網(wǎng)路的BP(back propagation)模型,通過自學(xué)習(xí),改善圖像插值的質(zhì)量。 2.2數(shù)字圖像(image)數(shù)字圖像處理基本知識介紹 2.2.1 什么是數(shù)字圖像 所謂數(shù)字圖像就是把傳統(tǒng)圖像的畫面分割成如圖2.1所示的被成為像素(picture element, 簡稱pixel。有時(shí)候也用pel這一簡寫詞)的小的離散點(diǎn),各像素的灰度值也是用離散值即整數(shù)值來表示的。數(shù)字圖像(digital

26、imagine)和傳統(tǒng)的圖像即模擬圖像(picture)是有差別的。 圖2.1 數(shù)字圖像 為了從一般的照片,景物等模擬圖像中得到數(shù)字圖像,需要對傳統(tǒng)的模擬圖像進(jìn)行采樣與量化兩種操作(二者統(tǒng)稱為數(shù)字化)[5]。 1. 采樣 采樣(sampling)就是把在時(shí)間上和空間上連續(xù)的圖像變成離散點(diǎn)(采樣點(diǎn),即像素)的集合的一種操作。 圖像基本上是在二維平面上連續(xù)分布的信息形式要把它輸入到計(jì)算機(jī)中,首先要把二維信號變成一維信號,因此要進(jìn)行掃描(scanning)。最常用的掃描方法是在二維平面上按一定間隔順序地從上方順序地沿水平方向的直線(掃描線)掃描,從而取出濃淡值(灰度值)的線掃描(Las

27、ter掃描)。對于由此得到的一維信號,通過求出每一特定間隔的值,可以得到離散的信號。對于運(yùn)動圖像除進(jìn)行水平,垂直兩個(gè)方向的掃描以外,還有進(jìn)行時(shí)間軸上的掃描。 通過采樣,如設(shè)橫向的像素?cái)?shù)為M,縱向的像素?cái)?shù)為N,則畫面的大小可以表示為“M*N”個(gè)像素。 2. 量化 經(jīng)過采樣,圖像被分解成在時(shí)間上和空間上離散分布的像素,但是像素的值(灰度值)還是連續(xù)值。像素的值,是指白色-灰色-黑色的濃淡值,有時(shí)候也指光的強(qiáng)度(亮度)值或灰度值。把這些連續(xù)的濃淡值或灰度值變?yōu)殡x散的值(整數(shù)值)的操作就是量化。 如果把這些連續(xù)變化的值(灰度值)量化為8bit,則灰度值被分成0-2552的256個(gè)級別,分別對應(yīng)

28、于各個(gè)灰度值的濃淡程度,叫做灰度等級或灰度標(biāo)度。 在0-255的值對應(yīng)于白-黑的時(shí)候,有以0為白,255為黑的方法,也有以0為黑,255為白0的方法,這取決于圖像的輸入方法以及用什么樣的觀點(diǎn)對圖像進(jìn)行處理等,這是在編程時(shí)應(yīng)特別注意的問題。但在只有黑白二值的二值圖像的情形,一般設(shè)0為白,1為黑。 對連續(xù)的灰度值賦予量化級的,即灰度值方法有:均勻量化(uniform quantization),線性量化(liner quantization),對數(shù)量化,MAX量化,錐形量化(tapered quantization)等。 3. 采樣、量化和圖像細(xì)節(jié)的關(guān)系 上面的數(shù)字化過程,需要確定

29、數(shù)值N和灰度級的級數(shù)K。在數(shù)字圖像處理中,一般都取成2的整數(shù)冪,即: (2.3) (2.4) 一幅數(shù)字圖像在計(jì)算機(jī)中所占的二進(jìn)制存儲位數(shù)b為: (2.5) 例如,灰度級為256級(m=8)的512512的一幅數(shù)字圖像,需要大約210萬個(gè)存儲位。隨著N和m的增加,計(jì)算機(jī)所需要的存儲量也隨之迅速增加。 由于數(shù)字圖像是連續(xù)圖像的近似,從圖像數(shù)字化的過程可以看到。這種近似的程度主要取決于采樣樣本的大小和數(shù)量(N

30、值)以及量化的級數(shù)K(或m值)。N和K的值越大,圖像越清晰。 2.2.2 數(shù)字圖像在計(jì)算機(jī)內(nèi)的處理 設(shè)一幅圖像f(x,y),我們?nèi)魧λ鞯乳g隔的采樣,在x,y方向上都取N個(gè)采樣點(diǎn),總共為NN個(gè)圖像點(diǎn)。每一像素f (i, 1=0,1,2, …N-1)就是點(diǎn)的灰度值。形成離散化了的坐標(biāo)和灰度值可以用一個(gè)矩陣來表示,其行和列的交點(diǎn)標(biāo)出圖像的每個(gè)像素,該數(shù)字圖像矩陣可表示為圖2.2 圖2.2 數(shù)字圖像矩陣 在計(jì)算機(jī)中對數(shù)字圖像進(jìn)行處理時(shí),實(shí)質(zhì)上就是在對量化后的矩陣進(jìn)行處理。 從原理上將,傳統(tǒng)的彩色圖像分析是基于RGB色彩空間的,但是RGB空間是顏色顯示空間,并不適合人的視覺特性,

31、對目標(biāo)物體的顏色模式描述復(fù)雜,各個(gè)分量之間冗余信息多,計(jì)算量大,而HSV空間通過對RGB顏色進(jìn)行變換,能體現(xiàn)人眼辨別顏色特點(diǎn)。在HSV空間,圖像特征明顯,易于進(jìn)行邊緣檢測,分割和目標(biāo)識別處理。 顏色可用明度、色調(diào)和飽和度來描述,人眼看到的任一顏色都是這三個(gè)特性的綜合效果。明度是光作用于人眼時(shí)所引起的明亮程度的感覺,它與被觀察物體的發(fā)光強(qiáng)度有關(guān),由于其強(qiáng)度不同,看起來可能亮一些或暗一些。色調(diào)是當(dāng)人眼看到一種或多種波長的光時(shí)所產(chǎn)生的彩色感覺,不同的波長產(chǎn)生不同的顏色感覺,如紅、橙、黃、綠、青、藍(lán)、紫等。色調(diào)是彩色的最重要的屬性,是彩色光在“質(zhì)”方面的特征。如某物體在白光下呈現(xiàn)綠色,是因?yàn)樗鼉H反射

32、了綠色光分量。飽和度是指顏色的純度,即摻入白色光的程度,飽和度的高低決定于彩色光中混入的白色光數(shù)量,白色光愈少,飽和度越高。飽和度是彩色光在“量”的方面的特征。人眼大概能識別128種不同的色調(diào)和130種不同的色澤(色飽和度級)。 2.2.3 數(shù)字圖像處理概述 數(shù)字圖像處理的英文名稱是”Digital Image Processing”。通常所說的數(shù)字處理是指用計(jì)算進(jìn)行的處理,因此也稱計(jì)算機(jī)圖像處理(Computer Image Processing)。總的來說,數(shù)字圖像處理包括以下幾項(xiàng)內(nèi)容: (1)點(diǎn)運(yùn)算 點(diǎn)運(yùn)算主要是針對圖像的象素進(jìn)行加、減、乘、除等運(yùn)算。圖像的點(diǎn)運(yùn)算可以有效的

33、改善圖像的直方圖分布,這對提高圖像的分辨率以及圖像的均衡都是非常有益的。 (2)幾何處理 幾何處理主要包括圖像的坐標(biāo)變換、圖像的移動、縮小、放大、旋轉(zhuǎn)、多個(gè)圖像的配準(zhǔn)以及圖像的扭曲校正等。幾何處理是最常見的圖像處理手段,幾乎任何圖像處理軟件都提供了最基本的圖像縮放功能。 (3)圖像增強(qiáng) 圖像增強(qiáng)的作用最主要是突出圖像中最重要的信息,同時(shí)減弱或除去不重要的信息。常用的方法有直方圖增強(qiáng)和偽彩色增強(qiáng)等。 (4)圖像復(fù)原 圖像復(fù)原的主要目的是去除干擾和模糊,從而恢復(fù)圖像的本來面目。例如去除噪聲復(fù)原處理。 (5)圖像形態(tài)學(xué)處理 圖像形態(tài)學(xué)是數(shù)學(xué)形態(tài)學(xué)的延伸,是一門獨(dú)立的研究學(xué)科。利用圖像

34、形態(tài)學(xué)技術(shù),可以實(shí)現(xiàn)圖像的腐蝕、細(xì)化和分割等效果。 (6)圖像編碼 圖像編碼研究屬于信息論中信源編碼的范疇,其主要宗旨是利用圖像信息的統(tǒng)計(jì)特性及人類的視覺特性對圖像進(jìn)行高效編碼,從而達(dá)到壓縮圖像的目的。 (7)圖像重建 圖像重建是一門新興的數(shù)字圖像處理技術(shù),主要是利用采集的數(shù)據(jù)來重建出圖像。其主要算法有代數(shù)法、迭代法、傅立葉反投影法和使用最廣泛的卷積反投影法等。 (8)模式識別 模式識別也是數(shù)字圖像處理的一個(gè)新的研究方向。當(dāng)今的模式識別方法通常有三種:統(tǒng)計(jì)識別法、句法結(jié)構(gòu)模式識別法和模糊識別法。 本文所討論的數(shù)字圖像縮放技術(shù)主要是圖像分辨率的變換,屬于數(shù)字圖像的幾何處理的范疇。

35、 2.2.4 數(shù)字圖像文件格式 1. 計(jì)算機(jī)圖像常用文件格式 1) PCX(Windows Paintbrush)格式??商幚?,4,8,16,24位等圖像數(shù)據(jù)。文件內(nèi)容包括:文件頭(128字節(jié)),圖像數(shù)據(jù)擴(kuò)展調(diào)色板數(shù)據(jù)。 2) BMP(Windows Bitmap)格式。有1,4,8,24位非壓縮圖像,8位RLE(Run-length Encoded )圖像。文件內(nèi)容包括:文件頭(一個(gè)BITMAP FILEHEADER數(shù)據(jù)結(jié)構(gòu)),位圖信息數(shù)據(jù)塊(位圖信息頭BITMAP INFOHEADER和一個(gè)顏色表)和圖像數(shù)據(jù)。 3) HDF(Hierarchical Data Format

36、)格式。有8位,24位光柵數(shù)據(jù)集。 4) JPEG(Joint Photographic Experts Group)格式,是一種成為聯(lián)合圖像專家組的圖像壓縮格式。 5) TIFF(Tagged Image File Format)格式。處理1,4,8,24位非壓縮圖像,1,4,8,24位packbit壓縮圖像,一位CCITT壓縮圖像等。文件內(nèi)容包括:文件頭,參數(shù)指針表與參數(shù)域,參數(shù)數(shù)據(jù)表和圖象數(shù)據(jù)四部分。 6) XWD(X Windows Dump)格式。1,8位Zpixmaps,XYbitmaps,1位XYpixmaps。 7) TGA格式。處理1,4,8,16,24位非壓縮圖像和

37、行程編碼(RLE)圖像。文件由5個(gè)固定長度字段和3個(gè)可變長度字段組成。 2. MATLAB圖像處理工具箱支持的四種基本圖像類型: 1) 索引圖像 索引圖像包括圖像矩陣與顏色圖數(shù)組,其中,顏色圖是按圖像中顏色值進(jìn)行排序后的數(shù)組。對于每個(gè)像素,圖像矩陣包含一個(gè)值,這個(gè)值就是顏色圖中的索引。顏色圖為m*3雙精度值矩陣,各行分別指定紅綠藍(lán)(RGB)單色值。Colormap=[R,G, B],R,G,B為值域?yàn)閇0,1]的實(shí)數(shù)值。 圖像矩陣與顏色圖的關(guān)系依賴于圖像矩陣是雙精度型還是uint8(無符號8位整型)類型。如果圖像矩陣為雙精度類型,第一點(diǎn)的值對應(yīng)于顏色圖的第一行,第二點(diǎn)對應(yīng)于顏色圖的第二

38、行,依次類推。如果圖像矩陣是uint8,有一個(gè)偏移量,第0點(diǎn)值對應(yīng)于顏色圖的第一行,第一點(diǎn)對應(yīng)于第二行,依次類推;uint8長用于圖形文件格式,它支持256色。 2) 灰度圖像 在MATLAB中,灰度圖像是保存在一個(gè)矩陣中的,矩陣中的每一個(gè)元素代表一個(gè)像素點(diǎn)。矩陣可以是雙精度類型,其值域?yàn)閇0,1];也可以為uint8類型,其數(shù)據(jù)范圍為[0,255]。矩陣的每個(gè)元素代表不同的亮度或灰度級。 第3章 傳統(tǒng)數(shù)字圖像縮放技術(shù) 3.1 數(shù)字圖像縮放技術(shù)概述 圖像處理技術(shù)是伴隨著人類文明的發(fā)展而逐漸形成的一門學(xué)科??脊艑W(xué)者李繼生在1996 年、Castl

39、eman 于1996年、崔屹在1997年、雷祥麟在2001年等等,在各自相關(guān)的文獻(xiàn)中指出,人類獲取外部世界的信息80%來源于視覺,圖像的出現(xiàn)和發(fā)展已有數(shù)千年歷史。最早的圖像是中國的象形文字和繪畫;1665年虎克(Robert Hooke)在其出版的《顯微鏡圖》(Micrographia)一書中,揭示了細(xì)胞的存在,圖像這種表示形式為醫(yī)學(xué)的進(jìn)步做出了重大貢獻(xiàn)。20世紀(jì)30年代出現(xiàn)的電視,對新聞傳播和文化娛樂起了很大作用。之后,隨著圖像數(shù)據(jù)大量涌現(xiàn),逐漸形成了“圖像處理”學(xué)科. 圖像處理是指對圖像進(jìn)行某種目的的修正。 如舊照片的修復(fù)、小圖片的放大,等。廣義上講,圖像處理分作圖像的模擬處理(如早期照

40、相店的手工修改照片)和圖像的數(shù)字處理; 后者通常稱作數(shù)字圖像處理,或計(jì)算機(jī)圖像處理, 或簡稱為圖像處理[Cas96]。 Castleman1996 年將數(shù)字圖像處理歸納為“隨著計(jì)算機(jī)技術(shù)的興起而產(chǎn)生的借助于計(jì)算機(jī)的圖像處理技術(shù)”。 數(shù)字圖像處理的主要工作是將圖像信號轉(zhuǎn)換成數(shù)字格式并利用計(jì)算機(jī)對其進(jìn)行處理與分析。崔屹1997年在其有關(guān)文獻(xiàn)中指出,最早的圖像處理是上世紀(jì)二十年代,紐約與倫敦間通過海底電纜傳輸?shù)臄?shù)字化新聞圖片,它使跨大西洋傳送一幅圖片的時(shí)間從一個(gè)多星期減少到少于三個(gè)小時(shí)。上世紀(jì)五十年代中期,在美國太空探索計(jì)劃的推動下,美國噴氣推進(jìn)實(shí)驗(yàn)室(Jet ropulsion Laborator

41、y)為了處理“徘徊者7 號”太空船送回的四千多張?jiān)虑蛘掌?,?yīng)用了計(jì)算機(jī)圖像處理技術(shù), 獲得了空前清晰的效果。上世紀(jì)七十年代開始,隨著以計(jì)算機(jī)和計(jì)算技術(shù)為核心的信息科學(xué)的發(fā)展,圖像處理和分析技術(shù)得到蓬勃的發(fā)展與應(yīng)用。特別是上世紀(jì)九十年代開始,計(jì)算機(jī)多媒體技術(shù)的發(fā)展對圖像處理產(chǎn)生了巨大的促進(jìn)和推動作用。近年來, 信息技術(shù)的蓬勃發(fā)展,降低了圖像處理所需的硬件成本,數(shù)字圖像技術(shù)已經(jīng)從工業(yè)領(lǐng)域、實(shí)驗(yàn)室走向商業(yè)領(lǐng)域、藝術(shù)領(lǐng)域及辦公室,甚至走向了人們的日常生活,數(shù)字圖像處理技術(shù)將愈來愈發(fā)揮重要作用。 3.2 傳統(tǒng)的數(shù)字圖像縮放技術(shù) 由于圖像像素的灰度值是離散的,因此一般的處理方法是對原來在整數(shù)點(diǎn)

42、坐標(biāo)上的像素值進(jìn)行插值生成連續(xù)的曲線(面),然后在插值曲線(面)上重新采樣以獲得放大或縮小圖像像素的灰度值。以一維空間像素的灰度插值為例,圖3.1所示的是將原圖的5個(gè)像素縮小為4個(gè)像素的過程:先根據(jù)~這五個(gè)像素的灰度值采用選定的插值算法生成插值曲線,再對該曲線進(jìn)行重采樣得到縮小后的四個(gè)像素~,從而實(shí)現(xiàn)圖像的縮放。下面簡要介紹目前常用的三種插值采樣方法。 圖3.1圖像縮放中的插值和重采樣 3.2.1 最近鄰插值(Nearest Neighbor Interpolation) 1.近鄰插值數(shù)學(xué)概述 插值核函數(shù)為: 其頻域變換為: 其核函數(shù)及對應(yīng)的傅立葉變換頻譜圖如圖3.

43、2為: 圖 3.2 近鄰插值核函數(shù)及其傅立葉變換頻譜圖 2.實(shí)現(xiàn)方法 將目的圖像的某個(gè)坐標(biāo)通過計(jì)算得到一個(gè)浮點(diǎn)坐標(biāo),對其進(jìn)行簡單的取整處理就得到一個(gè)對應(yīng)原照片圖像的整數(shù)坐標(biāo),目的照片圖像坐標(biāo)的像素值。具體算法為:設(shè)處理的目的圖像的坐標(biāo)為,圖像的縮放比例為m ,則對應(yīng)原圖像的浮點(diǎn)坐標(biāo)為( x/ m , y/ m) ,對該坐標(biāo)取整得到對應(yīng)原照片圖像的整數(shù)坐標(biāo),目的照片圖像在該坐標(biāo)的像素值。顯然該方法就是取該浮點(diǎn)坐標(biāo)最鄰近的左上角對應(yīng)的像素值。 3 算法評價(jià) 對于二維圖像。該法是“取待采樣點(diǎn)周圍4個(gè)相鄰像素點(diǎn)中距離最近的1個(gè)鄰點(diǎn)的灰度值作為該點(diǎn)的灰度值”。此算法雖然計(jì)算簡單,但由于僅用

44、對該采樣點(diǎn)影響最大的(即最近的)像素的灰度值作為該點(diǎn)的值,而沒有考慮其他相鄰像素的影響(相關(guān)性),因此重新采樣后的圖像灰度值有明顯的不連續(xù)性,像質(zhì)損失較大。 3.2.2 雙線性插值(Bilinear Interpolation) 1.線性插值數(shù)學(xué)概述 插值核函數(shù): 其頻域變換為: 其核函數(shù)及對應(yīng)的傅立葉變換頻譜圖如圖3.3所示: 圖 3.3雙線性插值核函數(shù)及其傅立葉變換頻譜圖 2.實(shí)現(xiàn)方法 雙線性內(nèi)插法通過線性插值的方式來得到目的圖像的像素值。我們通過近鄰取樣法知道,對于一個(gè)的像素,其坐標(biāo)通過反向變換可得到一個(gè)浮點(diǎn)坐標(biāo),我們可令其為( i + u, j + v)

45、 ,其中 i 和j 均為負(fù)整數(shù), u 和v 為[0,1]區(qū)間的浮點(diǎn)數(shù),則這個(gè)目的像素的值可由原圖像中坐標(biāo)為( i , j) , ( i+1,j) , (i ,j +1) , (i +1,j +1)所對應(yīng)的值的線性插值來決定,即= (1 - u) (1 - v) f ( i ,j) + (1 - u) vf ( i , j +1) + u(1 - v) f ( i +1, j) + uvf ( i +1,j +1)。其示意圖如圖3.4所示: 圖 3.4雙線性插值算法實(shí)現(xiàn)示意圖 3.算法評價(jià) 與最鄰近法相比。雙線性內(nèi)插法由于考慮了待采樣點(diǎn)周圍四個(gè)直接鄰點(diǎn)對待采樣點(diǎn)的影響,因此基本克服了前

46、者灰度不連續(xù)的缺點(diǎn),但其代價(jià)是計(jì)算量有所增大。但進(jìn)一步看,由于此方法僅考慮四個(gè)直接鄰點(diǎn)灰度值的影響,而未考慮到各鄰點(diǎn)間灰度值變化率的影響,因此具有低通濾波器的性質(zhì),使縮放后圖像的高頻分量受到損失,圖像的輪廓變得較模糊。用此方法縮放后的圖像與原圖像相比,仍然存在由于計(jì)算模型考慮不周而產(chǎn)生的圖像質(zhì)量退化與精度降低的問題。 3.2.3 雙三次插值(Bicubic Interpolation) 1.次插值的數(shù)學(xué)概述 插值核函數(shù): 其頻域變換為: 其核函數(shù)及對應(yīng)的傅立葉變換頻譜圖如圖3.5所示: 圖 3.5雙三次插值插值核函數(shù)及其傅立葉變換頻譜圖 2.實(shí)現(xiàn)方法 對雙線

47、性內(nèi)插法的改進(jìn),即不僅考慮到四個(gè)直接鄰點(diǎn)灰度值的影響,還考慮到各鄰點(diǎn)間灰度值變化率的影響,立方卷積法利用了待采樣點(diǎn)周圍更大鄰域內(nèi)像素的灰度值作三次插值(4*4=16個(gè)像素點(diǎn))。利用上述插值核函數(shù)提供的公式進(jìn)行插值。計(jì)算時(shí)取周圍的16個(gè)像素點(diǎn),其示意圖如圖3.6所示: 圖 3.6 雙三次插值算法實(shí)現(xiàn)示意圖 該像素的灰度值f(x,y)為: 式中各矩陣含義如下: 3.算法評價(jià) 雙線性內(nèi)插法相比,立方卷積法不僅考慮了直接鄰點(diǎn)的灰度值對待采樣點(diǎn) 的影響,還考慮了鄰點(diǎn)間灰度值變化率的影響,因此后者所求得的待采樣點(diǎn)灰度值更接近原(采樣)值。此方法用進(jìn)一步增大計(jì)算量來換取待采樣點(diǎn)精度的進(jìn)

48、一步提高,因此并不是最佳的插值算法。 第4章 當(dāng)今主流數(shù)字圖像縮放技術(shù)的算法 4.1帶系數(shù)自適應(yīng)插值算法及其改進(jìn) 4.1.1問題引入 在傳統(tǒng)的圖像插值算法中,雙線性插值與最鄰近法相比,由于考慮了待采樣點(diǎn)周圍四個(gè)直接鄰點(diǎn)對待采樣點(diǎn)的影響,因此基本克服了前者灰度不連續(xù)的缺點(diǎn),但其代價(jià)是計(jì)算量有所增大。但進(jìn)一步看,由于此方法僅考慮四個(gè)直接鄰點(diǎn)灰度值的影響,而未考慮到各鄰點(diǎn)間灰度值變化率的影響,因此具有低通濾波器的性質(zhì),使縮放后圖像的高頻分量受到損失,圖像的輪廓變得較模糊。用此方法縮放后的圖像與原圖像相比,仍然存在由于計(jì)算模型考慮不周而產(chǎn)生的圖像質(zhì)量退化與精度降低的問題。作為對雙線性內(nèi)插法的

49、改進(jìn),即“不僅考慮到四個(gè)直接鄰點(diǎn)灰度值的影響 ,還考慮到各鄰點(diǎn)間灰度值變化率的影響”,立方卷積法利用了待采樣點(diǎn)周圍更大鄰域內(nèi)像素的灰度值作三次插值。因此單從圖象處理質(zhì)量上考慮,雙三次插值是優(yōu)于其他兩種基本算法的,我們還可以從三次放插值的算法實(shí)現(xiàn)上仔細(xì)做數(shù)學(xué)上的推導(dǎo)變可以得出一個(gè)規(guī)律,從而實(shí)現(xiàn)基本算法的最佳插值方法。 4.1.2數(shù)學(xué)推導(dǎo)和算法實(shí)現(xiàn) 1.?dāng)?shù)學(xué)推導(dǎo) 雙三次插值算法的插值核函數(shù)為: (4.7) 插值后的像素灰度計(jì)算公式為: (4.8) 上式中: 我們分析式(4.7)和式(4.8)

50、可以發(fā)現(xiàn): (4.9) 令,則,。若令k=0,則式(3.8)的立方卷積法就退化為雙線性內(nèi)插法。因此, 可以把用 三次多項(xiàng)式插 值的立方卷積法看成 由兩部分組成。其中代表直接鄰點(diǎn)的灰度值對待采樣點(diǎn)的影響,而k則代表鄰點(diǎn)間灰度值的變化率對待采樣點(diǎn)的影響。與雙線性內(nèi)插法相比,立方卷積法不僅考慮了直接鄰點(diǎn)的灰度值對待采樣點(diǎn)的影響,還考慮了鄰點(diǎn)間灰度值變化率的影響,因此后者所求得的待采樣 點(diǎn)灰度值更接近原(采樣)值。此方法用進(jìn)一步增大計(jì)算量來換取待采樣點(diǎn)精度的進(jìn)一步提高,但這種方法中的兩個(gè)部分(即與k)的搭配是否最佳,值得進(jìn)一步研究。 2. 算法實(shí)現(xiàn) 從圖(4.3)可以看出在求待采樣

51、點(diǎn)的插值時(shí),最近鄰點(diǎn)法只考慮直接鄰點(diǎn)中距離最近點(diǎn)的影響,其權(quán)值為1;雙線性內(nèi)插法考慮了所有直接鄰點(diǎn)的影響,各點(diǎn)權(quán)值由距待采樣點(diǎn)的距離決定,距離近的權(quán)值大,距離遠(yuǎn)的權(quán)值??;而立方卷積法不僅考慮了所有直接鄰點(diǎn)的影響,還考慮了所有間接鄰點(diǎn)的影響,各點(diǎn)權(quán)值也由距待采樣點(diǎn)的距離決定。通過分析上述幾種插值算法可以看到,直接鄰點(diǎn)對待采樣點(diǎn)的影響是最大的,也是最主要的。同時(shí)從對立方卷積法的分析中可以看到,間接鄰點(diǎn)通過影響直接鄰點(diǎn) 的灰度值而影響待采樣點(diǎn)的灰度值,這一關(guān)系反映在鄰點(diǎn)間灰度值的變化率上,因此也是最佳插值算法中必須考慮的因素。在式(3.9)中代表直接鄰點(diǎn)的灰度值對待采樣點(diǎn)的影響,而k則代表鄰點(diǎn)間灰度

52、值的變化率對待采樣點(diǎn)的影響。前面幾種方法對這兩種影響的大小都沒有進(jìn)行優(yōu)化,因此適當(dāng)調(diào)整兩種影響的大小.可以找到一種最佳的插值算法,可以對式(3.9)進(jìn)行修正。 令修正值∈[0,1],將式(4.9)改寫為: (4.10) 圖(4.3)幾種插值法的比較 當(dāng)=0時(shí),式(4.10)代表的是雙線性內(nèi)插法;當(dāng)=1時(shí),式(4.10)代表的是雙三次插值法。越大鄰點(diǎn)間灰度值變化率的影響權(quán)值就越大;越小,直接鄰點(diǎn)灰度值的影響權(quán)值就越大。經(jīng)過計(jì)算與統(tǒng)計(jì)分析可以發(fā)現(xiàn),當(dāng) 取 0~1之間的值時(shí),內(nèi)插效果優(yōu)于立方卷積法,這說明立方卷積法中鄰點(diǎn)間灰度值變化率的權(quán)值過高,即應(yīng)取小于1的某個(gè)

53、值。對于不同的圖像,最佳的取值不同。如圖(4.3)所示,對不同的圖像在立方卷積法和雙線性內(nèi)插法的權(quán)值曲線間還有一個(gè)最佳的內(nèi)插曲線,用該曲線求出的權(quán)值來處理圖像效果比前兩者都好。 3. 改進(jìn)算法 由上面敘述可以知道,根據(jù)被處理圖像各像素點(diǎn)之間的灰度變化率適當(dāng)調(diào)整系數(shù),可以對圖像達(dá)到最佳的插值效果。但是,這種算法的缺點(diǎn)有兩個(gè):首先,這個(gè)是需要有人的互動在里面,系統(tǒng)不可能自己根據(jù)像素灰度的變化率做一個(gè)系數(shù)的自動調(diào)整;其次,對于特殊圖像比如有的部分像素灰度值變化快,有的變化慢,則該算法不可能做到兼顧全局。因此我們迫切的需要一個(gè)可以根據(jù)像素灰度值變化率自己做系數(shù)調(diào)整的改進(jìn)算法。該算法實(shí)現(xiàn)方式

54、如下: (1) 設(shè)置一個(gè)像素灰度值變化臨界值d;(該值一般在0.04-0.05之間) (2) 假設(shè)第點(diǎn)處的像素的灰度值為,假設(shè)圖像的讀取與存貯是從圖像的最上端從左至右按行依次進(jìn)行的所以下一個(gè)像素點(diǎn)為,其像素灰度值為。這兩個(gè)點(diǎn)的灰度差值為,則; (3) 如果,明這兩個(gè)點(diǎn)的像素的顏色變化不大,此時(shí)采用最近鄰插值;如果,說明這兩個(gè)點(diǎn)的像素的顏色變化較大,此時(shí)采用雙三次插值算法,用這種圖像插值算法,既保證了圖像變化后的質(zhì)量,又提高了運(yùn)算速度。 第5章 縮放算法處理結(jié)果及比較 5.1 概述 在第三章我們對數(shù)字圖像縮放的傳統(tǒng)算法與當(dāng)今主流

55、算法做了比較深入的探討。其中以有的傳統(tǒng)算法已經(jīng)是很成熟的算法,而且在MATLAB中分別對這傳統(tǒng)的插值算法都有相應(yīng)的函數(shù),在本章中將不再作細(xì)致的結(jié)果分析。另外對后面敘述的當(dāng)今主流的1種圖像縮放算法,只對前面幾種比較有現(xiàn)實(shí)意義的算法走一些有針對性的對比。 5.2 傳統(tǒng)圖像縮放算法處理結(jié)果 原圖 雙線性插值縮小 最近鄰插值縮小 圖5.1 這三種算法性能對比表一示: 最近臨插值 雙線性插值 雙三次插值 圖像質(zhì)量 失真較大 數(shù)據(jù)丟失 出現(xiàn)方格 輪廓模糊 精度降低 優(yōu)于前者 運(yùn) 算 量 簡單像素

56、平移 運(yùn)算量低 對周圍2*2像素 點(diǎn)做線性插值 計(jì)算量相對較 對周圍4*4像素點(diǎn) 做三次插值運(yùn)算, 運(yùn)算量較大 處理 速度 0.0700s 1.1320 s 2.1750s 表一:運(yùn)算結(jié)果對比 本表格中的程序運(yùn)算時(shí)間是指運(yùn)行所得,不具備縱向可比性。 圖5.2 箭頭的小球處理結(jié)果 取細(xì)節(jié)單調(diào),背景和物體之間區(qū)別明顯的帶箭頭的小球圖像,縮小比例0.3,從處理的結(jié)果來看,近鄰取樣法、雙線性內(nèi)插法及三次卷積法都使小球的箭頭中產(chǎn)生了斷點(diǎn)。而本文算法處理圖像清晰且不會產(chǎn)生斷點(diǎn)。所以在這種情況下本文法效果較好。 5.3帶系數(shù)自適應(yīng)插值算法及其改進(jìn)分析 由第

57、三章可以知道,該算法可以根據(jù)不同圖像的灰度值變化率取不同的插值系數(shù),從而達(dá)到最佳的插值效果。由于該算法效果變化細(xì)微我們可以用計(jì)算處理后圖像信噪比的辦法對比其優(yōu)點(diǎn),具體操作如下: 圖5.7經(jīng)典的lenna圖 鑒于計(jì)算的簡便本文以經(jīng)典的灰度圖lenna圖(lenna.bmp 256*256*24b)為例,別應(yīng)用雙線性插值法,雙三次插值法和最佳插值法,將原圖的尺寸從 256256小到128128像素,再放大到256256像素得到新圖,最后計(jì)算新圖相對原圖的信噪比(PSNR)。其結(jié)果如表二所示: 表二:插值結(jié)果的信噪比 PSNR 雙線性插值法 雙三次插值法 自適應(yīng)算法 =0.7

58、自適應(yīng)算法 =0.65 自適應(yīng)算法 =0.5 Lenna圖 32.8636 33.7040 34.3262 34.3297 34.2101 計(jì)算信噪比的公式為: 其中代表圖像像素?cái)?shù),,分別代表輸出圖像與輸入圖像在點(diǎn)的像素灰度值。 該算法的改進(jìn)算法主要是可以自己根據(jù)灰度值變化率采取采用何種算法進(jìn)行插值運(yùn)算,其主要優(yōu)勢在于運(yùn)算量上降低了,運(yùn)算時(shí)間縮短了,但是運(yùn)算效果顯然不及雙三次插值,當(dāng)然更比不上上述最佳插值算法,在圖像質(zhì)量要求相對較高,但硬件運(yùn)算速度不高的場合下非常適用。 總 結(jié) 通過這次

59、基于MATLAB的圖像處理的課程設(shè)計(jì),熟悉和掌握了MATLAB 程序設(shè)計(jì)方法、MATLAB GUI 程序設(shè)計(jì)和MATLAB圖像處理工具箱,了解了圖形用戶界面的制作的設(shè)計(jì)原則和一般步驟:簡單性、一致性、習(xí)常性、響應(yīng)要迅速、連續(xù)等原則,學(xué)會了運(yùn)用MATLAB工具箱對圖像進(jìn)行處理和分析。圖形用戶界面是包含圖形對象如窗口、圖標(biāo)、菜單和文本的用戶界面。現(xiàn)階段,圖形界面已在人機(jī)交互方式中占主導(dǎo)地位,這主要是由于它給用戶帶來了操作和控制的方便與靈活性。在設(shè)計(jì)一個(gè)高效的用戶界面時(shí),先選擇恰當(dāng)?shù)膱D形對象,然后將它們有邏輯地組織起來,使得用戶界面容易操作使用。 致謝 在整個(gè)畢業(yè)設(shè)計(jì)過程中,XX老師都提供了大

60、量的資料,并給予了細(xì)心的指導(dǎo),在理論分析、具體實(shí)現(xiàn)和論文組織等各方面都進(jìn)行了細(xì)心的指導(dǎo)和啟發(fā)。他廣博的知識,嚴(yán)謹(jǐn)?shù)淖黠L(fēng)和謙遜的態(tài)度使我受益非淺,在此深表感謝。 另外,我還要感謝XX老師,給我提供了大量的幫助,還有xx班的XX和XX同學(xué),是他們在百忙中閱讀我的程序,為我的程序排錯(cuò),并給了我很多建設(shè)性意見。我還要感謝大學(xué)四年中我所有的同學(xué)和朋友,感謝所有關(guān)心和幫助過我的人,感謝愛我的父母和家人。因?yàn)楸唤o予的真誠和愛心,我的生活充滿了笑聲和陽光。 參考文獻(xiàn) [1] 子良,《HDTV顯示器分辨率小議》,《技術(shù)縱橫》2005.6第6期:2-3 [2] 孫志中,袁慰平等,《數(shù)值分析》,東南大

61、學(xué)出版社 2004.9:115-144 [3] 李信真,車明剛等,《計(jì)算方法》,西安西北工業(yè)大學(xué)出版社 2000.8:92-114 [4] 章毓晉,《圖像處理與分析》,北京清華大學(xué)出版社 2004.7:11-20 [5] [日]田村秀行 著,《計(jì)算機(jī)圖像處理》,科學(xué)出版社 2004.6:10-18 [6] 閆敬文,《數(shù)字圖像處理技術(shù)與圖像圖形學(xué)基本教程》,科學(xué)出版社 2002.6:30-37 [7] 孫兆林,《MATLAB6.X數(shù)字圖像處理》,北京清華大學(xué)出版社2002.5:161-165 [8] 陳貴明,張明照等,《應(yīng)用MATLAB語言處理數(shù)字信號與數(shù)字圖像》,科學(xué)出版社 2000.1:234-246 [9] 張志涌,《精通MATLAB6.5》, 北京北航電子版,2002.12:120-150. [10] 武英,《南京曉莊學(xué)院院報(bào)》《將MATLAB用于數(shù)字圖像處理》2003.12第4期:1-4 [11] 尤玉虎 周孝寬《數(shù)字圖像最佳插枝算法研究》《中國空間科學(xué)技術(shù)》2005.6第2期:1-3 [12] 羅會信,曹艷力《一種高效的圖像插值算法》《計(jì)算機(jī)與現(xiàn)代化》2004.5第5期:1-2 林宗堅(jiān),江濤《多幅圖像融合提高分辨率的方法研究》《測繪科學(xué)》2005.2第1期:1-2

展開閱讀全文
溫馨提示:
1: 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
2: 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
3.本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
5. 裝配圖網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

相關(guān)資源

更多
正為您匹配相似的精品文檔
關(guān)于我們 - 網(wǎng)站聲明 - 網(wǎng)站地圖 - 資源地圖 - 友情鏈接 - 網(wǎng)站客服 - 聯(lián)系我們

copyright@ 2023-2025  zhuangpeitu.com 裝配圖網(wǎng)版權(quán)所有   聯(lián)系電話:18123376007

備案號:ICP2024067431-1 川公網(wǎng)安備51140202000466號


本站為文檔C2C交易模式,即用戶上傳的文檔直接被用戶下載,本站只是中間服務(wù)平臺,本站所有文檔下載所得的收益歸上傳人(含作者)所有。裝配圖網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對上載內(nèi)容本身不做任何修改或編輯。若文檔所含內(nèi)容侵犯了您的版權(quán)或隱私,請立即通知裝配圖網(wǎng),我們立即給予刪除!