機(jī)器視覺(jué)3final
《機(jī)器視覺(jué)3final》由會(huì)員分享,可在線閱讀,更多相關(guān)《機(jī)器視覺(jué)3final(53頁(yè)珍藏版)》請(qǐng)?jiān)谘b配圖網(wǎng)上搜索。
人類視覺(jué) 人眼所能看到的光譜范圍 只是電磁輻射波范圍的很小一部分 其波長(zhǎng)范圍從380納米到780納米 這段波長(zhǎng)稱為可見(jiàn)光譜 在可見(jiàn)光范圍內(nèi) 不同波長(zhǎng)的光給人以不同的色彩感覺(jué) 不同強(qiáng)度的光及不同強(qiáng)度分布的光刺激人眼 在人腦中將產(chǎn)生不同的光強(qiáng) 顏色 形狀等視覺(jué)信息 人的眼睛是一個(gè)前后直徑大約23毫米的近似球狀體 由眼球壁和眼球構(gòu)成 如圖 眼球壁的正前方 占整個(gè)眼球壁面積的1 6是一層彈性的透明組織 叫做角膜 角膜具有屈光功能 光線經(jīng)角膜發(fā)生屈折進(jìn)入眼內(nèi) 眼球壁外層的其余5 6是白色的不透明膜 叫做鞏膜 它主要起鞏固 保護(hù)眼球的作用 眼球壁的中層包括虹膜 睫狀體和脈絡(luò)膜 脈絡(luò)膜含有豐富的色素細(xì)胞 呈黑色 起著吸收外來(lái)散光的作用 消除光線在眼球內(nèi)部的亂反射 虹膜在角膜的后面 位于晶體的前面 虹膜中央的圓孔叫做瞳孔 虹膜可以使瞳孔擴(kuò)大和縮小 睫狀體位于虹膜后面 其內(nèi)部有睫狀肌 起調(diào)節(jié)晶體的作用 眼球壁內(nèi)層是視網(wǎng)膜 retina 和視神經(jīng)乳頭 視網(wǎng)膜是一種透明薄膜 是眼球的感光部分 視網(wǎng)膜由錐體細(xì)胞 conecell 和桿體細(xì)胞 rodcell 兩種感光細(xì)胞組成 其中 錐體細(xì)胞約有650萬(wàn)個(gè) 桿體細(xì)胞約有1億個(gè) 視網(wǎng)膜可分為以視軸為中心直徑約6毫米的中央?yún)^(qū)和周邊區(qū) 中央?yún)^(qū)有一直徑約2毫米 折合6度視角 呈黃色區(qū)域 稱為黃斑 黃斑中央有一小凹 叫做中央凹 fovea 面積約1平方毫米 人類視覺(jué)的中央凹沒(méi)有桿體細(xì)胞 只有錐體細(xì)胞 其密度高達(dá)每平方毫米150 000 離開(kāi)中央凹 錐體細(xì)胞急劇減少 而桿體細(xì)胞急劇增多 在離開(kāi)中央凹20度的地方 桿體細(xì)胞最多 中央凹的錐體細(xì)胞密度很高 是產(chǎn)生最清晰視覺(jué)的地方 桿體細(xì)胞主要是在黑暗的條件下起作用 同時(shí)還負(fù)責(zé)察覺(jué)物體的運(yùn)動(dòng) 因此 常將錐體細(xì)胞稱為明視覺(jué)細(xì)胞 將桿體細(xì)胞稱為暗視覺(jué)細(xì)胞 眼球內(nèi)包括晶體 房水及玻璃體 它們都是屈光介質(zhì) 晶體為一扁球形的彈性透明體 位于玻璃體與虹膜之間 睫狀體的收縮可改變晶體的屈光力 使外界的對(duì)象能在視網(wǎng)上形成清楚的影像 人眼的構(gòu)造 基本視覺(jué)信息包括 亮度 形狀 運(yùn)動(dòng) 顏色 深度知覺(jué)等亮度是最基本的視覺(jué)信息 因?yàn)闆](méi)有亮度就談不上什么形狀 運(yùn)動(dòng) 顏色等視知覺(jué) 亮度是一種外界輻射的物理量在我們視覺(jué)中反映出來(lái)的心理物理量 視覺(jué)信息處理過(guò)程 物體的形狀主要是由物體在視覺(jué)空間上的亮度分布 顏色分布或運(yùn)動(dòng)狀態(tài)不同而顯示出來(lái)的 雪地上一張白紙 荒野中潛伏的狼 都比較難以覺(jué)察 相反 雪地上一張彩紙 綠草地上等一朵紅花 荒野中奔跑的狼 都比較容易發(fā)現(xiàn) 這是由于物體形狀因亮度 顏色 運(yùn)動(dòng)等因素而突顯出來(lái) 易于被人眼分辨出來(lái) 視覺(jué)系統(tǒng)對(duì)運(yùn)動(dòng)目標(biāo)十分敏感 特別是低等動(dòng)物更是如此 如蛙類的視網(wǎng)膜對(duì)運(yùn)動(dòng)特別敏銳 而對(duì)靜止的目標(biāo)卻視而不見(jiàn) 顏色知覺(jué)是一種主觀感覺(jué) 目前只在感受器細(xì)胞水平和心理物理的宏觀水平上得到了較深入的研究 研究表明 猴和人的視網(wǎng)膜中 含有三種不同的錐體細(xì)胞 每一種錐體細(xì)胞對(duì)不同的光譜 其敏感性也是不同的 三種錐體細(xì)胞對(duì)光譜的敏感峰值分別在430納米 540納米和570納米 這三個(gè)峰值段正對(duì)應(yīng)著光譜中的紅 綠 藍(lán)區(qū)域 實(shí)驗(yàn)進(jìn)一步表明 當(dāng)三種顏色按一定比例同時(shí)刺激人眼時(shí) 會(huì)產(chǎn)生各種顏色感覺(jué) 其中有一種比例會(huì)使得顏色感覺(jué)完全消失 只有亮度感覺(jué) 這就是所謂的色覺(jué)三變量性 tri varianceofcolorvision 說(shuō)明顏色只取決于三個(gè)基本的輸入量 這也是色覺(jué)三基色原理的基礎(chǔ) 人類的視覺(jué)不僅要識(shí)別物體的形狀和顏色 而且要隨時(shí)地作用于物體 例如 伸手拿一本書 躲開(kāi)汽車或障礙物 把足球踢入球門等 這一切活動(dòng)都需要判斷我們與被作用物體的距離 立體知覺(jué)就是指這種判斷物體距離或深度的感覺(jué) 正常的雙眼視覺(jué)都可以提供高度的立體感 外界目標(biāo)在視網(wǎng)膜上的象是二維的 而且同一物體在左右眼的視網(wǎng)膜上的成像有著微小的差異 比如 用你的手輪流遮擋你的左 右眼 會(huì)發(fā)現(xiàn)同一個(gè)物體在左右眼中的位置是不同的 實(shí)際上 這種不同為立體視覺(jué)提供了最基本的信息 視差 disparity Julesz1960 首次使用隨機(jī)點(diǎn)立體圖對(duì)作為刺激研究了立體視知覺(jué) 如圖 這種刺激圖形排除了所有單眼視覺(jué)引入的第二視覺(jué)線索 而只保留了視差信息 受試者在觀察隨機(jī)立體圖對(duì)時(shí) 用左右眼分別觀看其中一個(gè)圖幾秒鐘 當(dāng)兩個(gè)圖融合后 便會(huì)感受到有一個(gè)方形平面從背景中突顯出來(lái) 除了雙眼視差提供深度信息外 還有許多單眼的信息可以產(chǎn)生深度信息的估計(jì) 如物體的重疊 透視 近大遠(yuǎn)小 近清晰遠(yuǎn)模糊 近亮遠(yuǎn)暗 明暗 紋理及運(yùn)動(dòng) 當(dāng)然這種深度估計(jì)在質(zhì)量和感覺(jué)上仍無(wú)法與視差立體知覺(jué)的深度相比 機(jī)器視覺(jué) 顏色感知 圖像的灰度值一般表示光強(qiáng) 光強(qiáng)是兩個(gè)空間變量的函數(shù) 實(shí)際上 光是由不同波段的光譜組成的 一幅圖像常常對(duì)應(yīng)一個(gè)波段或多個(gè)波段光譜樣本 因此 圖像灰度值是兩個(gè)空間變量和一個(gè)光譜變量的函數(shù) 我們稱這樣的圖像為多光譜圖像 multi spectralimage 其中的每一個(gè)波段稱為一個(gè)通道 比如 氣象衛(wèi)星獲取的云圖 其波段是紅外波段 扇形束 型超聲診斷儀輸出的圖像 其波段是超聲波段 場(chǎng)景或物體的顏色是由照射光源的光譜成分 光線在物體上反射和吸收的情況決定的 比如 一個(gè)藍(lán)色物體在日光下觀察呈現(xiàn)藍(lán)色 是由于這個(gè)物體將日光中的藍(lán)光反射出來(lái) 而吸收了光譜中的其它部分的光譜 而同樣的藍(lán)色物體 在紅色的光源照射下 則呈現(xiàn)紅紫色 對(duì)于機(jī)器視覺(jué)系統(tǒng) 彩色圖像還與成象系統(tǒng)敏感器的光譜響應(yīng)有關(guān) 可見(jiàn)光的波長(zhǎng)分布在380到780之間 人的顏色感覺(jué)是不同波長(zhǎng)的可見(jiàn)光刺激人的視覺(jué)器官的結(jié)果 在可見(jiàn)光的波段內(nèi) 隨著波長(zhǎng)的增長(zhǎng) 使人產(chǎn)生紫 藍(lán) 青 綠 黃 橙 紅等顏色的感覺(jué) 人的視網(wǎng)膜上有兩類細(xì)胞 桿體細(xì)胞和錐體細(xì)胞 桿體細(xì)胞靈敏度高 能感受微弱的光 錐體細(xì)胞靈敏度低 但能很好地區(qū)分顏色 為了解釋視覺(jué)對(duì)顏色的感知能力 美國(guó)物理學(xué)家T Young1801年提出三色假說(shuō) 后來(lái)由Helmholtz加以發(fā)展 形成著名的Young Helmholtz三色學(xué)說(shuō) 三色原理 假設(shè)有三種視覺(jué) 錐體 感受器 分別對(duì)紅 綠 藍(lán)三種顏色敏感 當(dāng)光線同時(shí)作用在這三種感受器上時(shí) 三個(gè)感受器產(chǎn)生的興奮程度不同 不同興奮程度的組合將產(chǎn)生不同的顏色感覺(jué) 三種感受器處于等強(qiáng)度興奮時(shí) 便產(chǎn)生白色的感覺(jué) 三色假說(shuō) 根據(jù) Wald1964 對(duì)人類色彩視覺(jué)的研究結(jié)果 三種錐體細(xì)胞的光譜吸收的峰值分別在430 540和570納米左右 這三個(gè)區(qū)間分別對(duì)應(yīng)紅 綠和藍(lán)波段 由于這個(gè)原因 這三種顏色被稱為人類視覺(jué)的三基色 譜上的大多數(shù)顏色都可以用紅 Red 綠 Green 藍(lán) Blue 三種單色加權(quán)混合產(chǎn)生 基于RGB三基色的顏色表示稱為RGB顏色模型 RGB顏色模型 RGB和CMY顏色模型 根據(jù)RGB三基色原理 各種顏色的光都可以由紅 綠和藍(lán)三種基色加權(quán)混合而成 如圖RGB直角坐標(biāo)定義的單位立方體來(lái)說(shuō)明 坐標(biāo)原點(diǎn) 0 0 0 表示黑色 坐標(biāo)點(diǎn) 1 1 1 表示白色 在坐標(biāo)軸上的三個(gè)頂點(diǎn)表示RGB三個(gè)基色 因此 彩色空間是三維的線性空間 任意一種具有一定亮度的顏色光都可用空間中的一個(gè)點(diǎn)或一個(gè)向量表示 因此我們可以選擇具有確定光通量的紅 綠 藍(lán)三基色作為這三維空間的基 這樣組成的表色系統(tǒng)稱為RGB表色系統(tǒng) 在RGB表色系統(tǒng)中 標(biāo)準(zhǔn)白光的RGB光通量按以下比例混合而成 通常把光通量為1流明的紅光 4 5907流明的綠光 0 0601流明的藍(lán)光作為三基色的 單位基色量 用 R G B 表示 因此 任何一種具有一定亮度的彩色光的光通量為 其中R G B為每種原基色的比例系數(shù) 例如 對(duì)某種藍(lán)綠色 可以用下式表示 上式表示彩色光的明亮程度 顯然 光的色度只取決于之間的比例關(guān)系 如果不考慮光的亮度 只對(duì)色度感興趣 則只要知道的相對(duì)值即可 因此可以令 r g b稱為色度坐標(biāo) 由于r g b 因此只有兩個(gè)色度坐標(biāo)是獨(dú)立的 這也說(shuō)明色度空間是二維的 可以用如下色度圖表示 標(biāo)準(zhǔn)白光位于 為了使用RGB三基色有效地描述或混合各種顏色 人們還根據(jù)RGB三基色模型提出了CMY顏色模型 XYZ顏色模型 YIQ顏色模型 HSV顏色模型 HLS顏色模型等 以適應(yīng)不同應(yīng)用的需求 顏色模型 從RGB顏色模型可知 在坐標(biāo)軸上的三個(gè)頂點(diǎn)表示RGB三個(gè)基色 各種顏色的光都可以由紅 綠和藍(lán)三種基色加權(quán)混合而成 另外三個(gè)頂點(diǎn) 青 Cyan 品紅 Magenta 黃 Yellow 和RGB一樣 也可構(gòu)成一組基色 稱為CMY顏色模型 各種顏色的光都可以由CMY三種基色加權(quán)混合而成 在實(shí)際應(yīng)用中 RGB顏色模型用于磷粉屏幕的顏色生成 是一個(gè)由黑到白的過(guò)程 稱為增色處理 CMY顏色模型主要用來(lái)描述繪圖和打印彩色輸出的顏色 因?yàn)檫@類彩色的形成是在白紙或其它印刷介質(zhì)上生成的 是一個(gè)由白到黑過(guò)程 稱之為減色過(guò)程 使用CMY的打印處理通常需要四個(gè)墨點(diǎn)的集合來(lái)產(chǎn)生顏色點(diǎn) CMY三基色各對(duì)應(yīng)一個(gè)墨點(diǎn) 黑色對(duì)應(yīng)第四個(gè)墨點(diǎn) 這是因?yàn)镃MY三基色混合僅能生成深灰色 所以黑色應(yīng)單獨(dú)作為一個(gè)墨點(diǎn) 這在某種程度上與RGB監(jiān)視器使用的三個(gè)磷粉點(diǎn)的集合是一樣的 顯然 RGB和CMY之間的關(guān)系如下 MCY單位立方體 CIE XYZ顏色模型 使用RGB模型生成顏色時(shí) 用于產(chǎn)生顏色的原基色比例系數(shù)出現(xiàn)負(fù)值 使用起來(lái)十分不便 同時(shí) 不同研究者所用的三基色和標(biāo)準(zhǔn)白色不同 使得研究結(jié)果很難比較 因此 1931年國(guó)際照明委員會(huì)CIE CommissionInternationaledelElairage theInternationalCommissiononIllumination 規(guī)定了一種新的顏色表示系統(tǒng) 定義為CIE XYZ顏色模型 XYZ顏色模型把彩色光表示為 其中 是XYZ顏色模型的基色量 為三色比例系數(shù) XYZ表色系統(tǒng)須滿足如下三個(gè)條件 三色比例系數(shù)皆大于零 Y的數(shù)值正好是彩色光的亮度 當(dāng)時(shí)仍然表示標(biāo)準(zhǔn)白光 根據(jù)以上條件 可以得到RGB顏色模型與XYZ顏色模型的關(guān)系式 對(duì)XYZ顏色模型的三基色規(guī)范化 得到如下色度坐標(biāo) NTSC YIQ表色模型 RGB工業(yè)監(jiān)視器要求一幅彩色圖像由分開(kāi)的RGB信號(hào)組成 而電視監(jiān)視器需要混合信號(hào)輸入 為此 美國(guó)國(guó)家電視系統(tǒng)委員會(huì) NationalTelevisionSystemCommittee NTSC 采用YIQ彩色模型 其主要的優(yōu)點(diǎn)是可以保證彩色電視和黑白電視的兼容 即可以用彩色收看黑白電視圖像 YIQ是以CIE的XYZ顏色模型為基礎(chǔ) 其參數(shù)Y與XYZ中的模型參數(shù)相同 是圖像的亮度信息 在沒(méi)有色度的情況下 Y也就對(duì)應(yīng)于黑白圖像 或者說(shuō) 黑白電視只接收Y信號(hào) 由于人眼對(duì)顏色的相對(duì)視見(jiàn)度不同 所以選擇三色的基色量為 因此亮度信號(hào)Y為規(guī)定如下色差信號(hào) 由此可見(jiàn) 在色度圖上 參數(shù)I包含有橙 青顏色信息 參數(shù)Q包含有綠 品紅顏色 I和Q混合可以提高顏色的色調(diào)和飽和度 將 10 9 和 10 10 結(jié)合起來(lái)得到Y(jié)IQ與RGB間的轉(zhuǎn)換關(guān)系為 這里的RGB是NTSC制式RGB Y 0 299R 0 587G 0 114BU 0 147R 0 289G 0 436BV 0 615R 0 515G 0 100BR Y 1 14VG Y 0 39U 0 58VB Y 2 03U YUV 顏色的視覺(jué)處理 從視覺(jué)的角度來(lái)講 顏色可分為彩色和非彩色兩大類 非彩色是指黑色 白色及其兩者之間深淺不同的灰色 稱為非彩色或無(wú)色系列 achromaticseries 彩色系列或有色系列 chromaticseries 是指除了白色系列以外的各種顏色 為了定量地描述顏色對(duì)人眼的視覺(jué)作用 可以選用亮度 brightness 色調(diào) hue 色飽和度 saturation 這三個(gè)與視覺(jué)特征有關(guān)的量來(lái)計(jì)算描述 這三個(gè)量稱為顏色的三個(gè)基本屬性 色調(diào)是由物體反射光線中占優(yōu)勢(shì)的波長(zhǎng)來(lái)決定的 不同的波長(zhǎng)產(chǎn)生不同的顏色感覺(jué) 如紅 橙 黃 綠 青 藍(lán) 紫等 色調(diào)是彩色的最重要的屬性 是決定顏色本質(zhì)的基本特性 顏色的飽和度是指一個(gè)顏色的鮮明程度 飽和度越高 顏色越深 如深紅 深綠 在物體反射光的組成中 白色光愈少 則其色飽和度愈大 在顏色中加上白色或灰色愈多 其飽和度就愈小 亮度是指刺激物的強(qiáng)度作用于感受器所發(fā)生的效應(yīng) 其大小是由物體反射系數(shù)來(lái)決定 反射系數(shù)越大 物體的亮度愈大 反之愈小 人眼大概能識(shí)別128不同的色調(diào)和130種不同的色澤 色飽和度級(jí) 根據(jù)不同的色調(diào) 還可以識(shí)別若干種明暗 比如對(duì)于黃色 可以分辨出23種明暗級(jí) 對(duì)于藍(lán)色 則可分辨出16種明暗級(jí) 因此 人眼可以識(shí)辨出大約種不同的顏色 對(duì)于機(jī)器視覺(jué)來(lái)說(shuō) 128不同的色調(diào)和8種不同的色飽和度級(jí) 16種明暗級(jí)基本上滿足應(yīng)用需求 色度表示彩色分量是獨(dú)立于光通量的 兩種彩色 比如深綠和淺綠 可能看起來(lái)不同 但實(shí)際上具有相同的波段相對(duì)分布 如果光譜分布按一個(gè)比例常數(shù)增減 彩色會(huì)變深或變淺 但光譜分布的形狀不變 色調(diào) 主波段 和色飽和度 主波段的相對(duì)量 也就不變 HSV顏色感知模型 我們來(lái)回顧一下圖10 5 感覺(jué)意義顯著的色度位于的舌形區(qū)域內(nèi) 從白光點(diǎn)畫一條線 經(jīng)過(guò)某一彩色點(diǎn) 再到色度圖邊界位置 我們可以認(rèn)為彩色的色度是由白光和純光譜色調(diào)相加混合而成 其中S為長(zhǎng)度與的比值 定義為色飽和度 控制白色和色調(diào)的相對(duì)比例 將色調(diào) 色飽和度和亮度編碼成RGB彩色值 不利于在機(jī)器視覺(jué)算法中使用 比如 識(shí)別不同顏色物體的簡(jiǎn)單方法是使用物體的色調(diào)特征 但是 這些色調(diào)在RGB空間位于何處 對(duì)應(yīng)于RGB空間不同區(qū)域的物體表面形狀是什么 將色調(diào)閾值應(yīng)用于圖像RGB空間的公式是什么 這些問(wèn)題在RGB空間中是很難回答的 但將RGB值轉(zhuǎn)化為色調(diào) 色飽和度和亮度時(shí) 問(wèn)題就變得十分簡(jiǎn)單了 按照色調(diào) Hue 色飽和度 Saturation 和明度值 Value 建立的HSV彩色模型就是其中的一種方法 有的書不用明度值 而用光強(qiáng) Intensity HSV也用HSI來(lái)代替 HSV彩色表示 HSV顏色三角形 一個(gè)圖像的RGB成分可以轉(zhuǎn)換為HSV彩色表示 假設(shè)RGB成分已經(jīng)被歸一化為r g b r g b的所有可能值形成的軌跡是RGB空間正象限的三角形 如上頁(yè)圖 設(shè)三角形上的點(diǎn)P表示rgb空間上的某一顏色的位置 p r g b 是到三角形上P點(diǎn)的向量 w是到表示白色的三角形中心的點(diǎn)的向量 pr是到全色飽和紅色對(duì)應(yīng)的三角形頂點(diǎn)的向量 色調(diào)H是向量pr w到向量p w的夾角 從三角形遠(yuǎn)離原點(diǎn)的一邊按逆時(shí)針?lè)较颦h(huán)繞三角形 這是右手法則 大拇指沿三角形法線指向遠(yuǎn)離原點(diǎn)的方向 色調(diào)的余弦值是到三角形中心的向量w的值為w 1 3 1 3 1 3 p w向量的幅值為 因?yàn)?因此 pr w的幅值是p w和pr w的點(diǎn)積是 從而可以得到從R G B值得到簡(jiǎn)化的計(jì)算色調(diào)方程 為了在0到360度的范圍內(nèi)得到色調(diào)值 有必要從360中減去H 當(dāng) 雖然這個(gè)推導(dǎo)是從歸一化RGB值開(kāi)始 但是方程可用于任何尺度的RGB值 這是因?yàn)榉肿雍头帜钢芯哂邢嗤某叨纫蜃?可以在計(jì)算中消除 色飽和度是指空間三角形到白色的距離相對(duì)于白色到具有相同色度的全色飽和色的距離而言的 全色飽色位于三角形的邊上 三角形中點(diǎn)經(jīng)過(guò)彩色點(diǎn)與三角形邊緣的交點(diǎn)為 則色飽和度是一個(gè)距離比值 色飽和度方程為 HLS顏色感知模型 彩色圖像獲取系統(tǒng)中的RGB圖像轉(zhuǎn)化為HSV表示 可以便于進(jìn)一步的處理 當(dāng)色飽和度值為零時(shí) 色調(diào)不需要定義 也就是指沿HSV立體圖的軸心線上的任何彩色 當(dāng)光強(qiáng)值V 0時(shí) 色飽和度值無(wú)需定義 使用RGB到HSV的變換來(lái)將彩色圖像轉(zhuǎn)化成適應(yīng)于機(jī)器視覺(jué)的形式 灰度算法可以在HSV表示的V分量上來(lái)完成 分割可以在H分量上完成 以便用不同的色調(diào)區(qū)分不同物體 但是 當(dāng)色飽和度值很低時(shí) 用色度來(lái)區(qū)分物體是不可靠的 所以必須修正分割算法以便將低色飽和度值的像素留下 等待進(jìn)一步處理 區(qū)域生長(zhǎng)算法可以利用色調(diào)閾值來(lái)形成核心區(qū)域 將低色飽和度值或是在閾值邊界外的未定義的像素點(diǎn)留下 通過(guò)分配像素來(lái)進(jìn)行區(qū)域增長(zhǎng)的算法沒(méi)有任何變化 更一般的算法是使用將色調(diào) 色飽和度和光強(qiáng)的閾值將HSV立體空間分成若干區(qū)域 這些閾值用HSV表示比成象系統(tǒng)提供的RGB表示更容易公式化和應(yīng)用 彩色不變性 室外光線的彩色成分變化非常大 但人卻能正確的感知場(chǎng)景中物體的顏色 并且在大部分情況下不依賴于環(huán)境照明的顏色 這種現(xiàn)象叫彩色不變性 colorconstancy 環(huán)境光的光譜分布描述了在每個(gè)波段上的能量 假定場(chǎng)景表面是不透明的 場(chǎng)景中的坐標(biāo)值就能用圖像平面中對(duì)應(yīng)點(diǎn)的坐標(biāo)來(lái)確定 在波段 上的光從表面點(diǎn) x y 處反射的部分是S x y 到達(dá)圖像上每一點(diǎn)的光是由照在場(chǎng)景表面的環(huán)境光的光譜分布和光在不同波段上的反射部分來(lái)確定 假設(shè)在每個(gè)圖像位置 x y 上有p個(gè)傳感器 每個(gè)傳感器有不同的光譜響應(yīng)函數(shù) 傳感器k的光譜響應(yīng)Rk 在 x y 處的每個(gè)傳感器采樣不同分布的光譜 對(duì)應(yīng)于圖像平面點(diǎn)的場(chǎng)景表面上一點(diǎn)的彩色 光譜反射 信息由該處p個(gè)傳感器編碼 得到p個(gè)編碼值 彩色不變性是傳感器響應(yīng)恢復(fù)場(chǎng)景表面光譜反射S x y 的問(wèn)題 而獨(dú)立于環(huán)境照明的光譜分布 原則上 彩色不變性問(wèn)題可以表示為有限維線性空間中的逆問(wèn)題 并可通過(guò)矩陣方法求解 假定表面反射是基函數(shù)的線性組合 基函數(shù)的數(shù)量是表面反射自由度的數(shù)目 假定基函數(shù)已知 僅用三個(gè)基函數(shù)的線性模型足以表示典型的表面反射 m個(gè)自由度的線性模型表示環(huán)境照明如下 假定基本光源 basiclight 的光譜分布已知 則只需三個(gè)或四個(gè)基本光源就可以建立不同氣候條件和不同時(shí)間的自然光模型 彩色確定問(wèn)題可以用矩陣形式表示 m個(gè)值組成列向量 個(gè)值組成列向量 將這些列向量代入方程10 22 得到圖像中每個(gè)像素的矩陣模型 照明矩陣是一個(gè)矩陣 第 i j 項(xiàng)的值是 如果環(huán)境照明已知 那么照明矩陣也已知 如果傳感器數(shù)目等于表面反射的自由度數(shù)目 即 那么可以求取照明矩陣的逆 以便得到圖像上每一點(diǎn)的表面光譜反射特性系數(shù) 該系數(shù)表征了場(chǎng)景相應(yīng)點(diǎn)的色彩 如果環(huán)境照明未知 則需要傳感器數(shù)目多于表面反射自由度數(shù)目才能求解此問(wèn)題 由于假設(shè)環(huán)境照明對(duì)場(chǎng)景中所有點(diǎn)都一樣 因此可以用多個(gè)場(chǎng)景點(diǎn)上的信息來(lái)計(jì)算環(huán)境照明 假定 從個(gè)不同的空間點(diǎn)上 可得到個(gè)不同的測(cè)量值 這里有個(gè)表面反射未知數(shù)和個(gè)環(huán)境光譜未知數(shù) 因此 必須在時(shí)取樣才能得到比未知數(shù)更多的數(shù)據(jù) 這一分析意味著如果有個(gè)敏感器 就可以在不知道環(huán)境光線的情況下求解彩色不變性問(wèn)題 矩陣將維的表面空間映射到維的敏感器空間 例如 當(dāng) 時(shí) 子空間就是三維空間中的一個(gè)平面 這意味著下面的確定表面反射性的兩步算法不依賴于環(huán)境照明 1 確定覆蓋傳感器空間數(shù)據(jù)點(diǎn)的平面 子空間 以恢復(fù)環(huán)境照明向量 2 從環(huán)境照明向量確定照明矩陣 再求的逆來(lái)得到表面反射向量- 1.請(qǐng)仔細(xì)閱讀文檔,確保文檔完整性,對(duì)于不預(yù)覽、不比對(duì)內(nèi)容而直接下載帶來(lái)的問(wèn)題本站不予受理。
- 2.下載的文檔,不會(huì)出現(xiàn)我們的網(wǎng)址水印。
- 3、該文檔所得收入(下載+內(nèi)容+預(yù)覽)歸上傳者、原創(chuàng)作者;如果您是本文檔原作者,請(qǐng)點(diǎn)此認(rèn)領(lǐng)!既往收益都?xì)w您。
下載文檔到電腦,查找使用更方便
30 積分
下載 |
- 配套講稿:
如PPT文件的首頁(yè)顯示word圖標(biāo),表示該P(yáng)PT已包含配套word講稿。雙擊word圖標(biāo)可打開(kāi)word文檔。
- 特殊限制:
部分文檔作品中含有的國(guó)旗、國(guó)徽等圖片,僅作為作品整體效果示例展示,禁止商用。設(shè)計(jì)者僅對(duì)作品中獨(dú)創(chuàng)性部分享有著作權(quán)。
- 關(guān) 鍵 詞:
- 機(jī)器 視覺(jué) final
鏈接地址:http://m.appdesigncorp.com/p-6991496.html