[ 画像圧縮・視覚特性 ] |
人間の注視点は画像評価・符号化に大きく影響するため、注視点の位置や頻度を特定することは視覚的な画像処理に必要である。 注視点特定を目的とする従来研究は、生理学や心理学による視覚特性に基づいて定義した特徴量を、画像情報からパターンマッチングする方法が主流である。 しかし、この方法による注視点は、実際に人間が画像を観測した際と異なることが多い。 そのため、正確な注視点特定には眼球運動測定実験の手間が画像毎に必要となる。 |
|
図1 注視点の重要性とその測定 |
本研究では、画像情報のみから正確な注視点特定を目的として、画像観測における眼球運動の予測手法を提案する。 そこで、写真や絵画などで用いられる構図の観点を用いた画像解析を、実際に人間が画像を観測した際の視線移動に基づいて確立する。 | |
図2 画像の構図と人間の視線の関係 |
コンピュータ上において、画像は小さな点(画素)の集合で表現される。 従来の画像符号化手法では画素に対して処理を行うものが主流だが、 本研究では画素が集まって形成する模様(パターン)が重要であると考え、 代表的なパターン(画像構成基本要素)を用いて画像を符号化する。
画像はそのパターンの特徴から、エッジ領域、フラット領域、グラデーション領域の3種類に分類することができる。 これらの領域の特徴を単純化したパターンを、画像構成基本要素とする。
図1. エッジ領域 基本要素 |
図2. フラット領域 基本要素 |
図3. グラデーション領域 基本要素 |
各領域を基本要素で置換することによって、画像の符号化を行う。
図4. エッジ領域 全体の7.02% |
図5. フラット領域 全体の24.24% |
図6. グラデーション領域 全体の62.91% |
図7. 符号化結果 画質:33.32[dB] 情報量:1.49[bpp] |
現在、画像の静止画圧縮方式としてJPEGが主流になっている。 近年新しく制定されたJPEG2000は、JPEGよりも高画質・高圧縮が可能であり、次世代の画像圧縮方式として期待されている。 しかし、JPEG2000には符号化方式であるWavelet変換に起因して画像内のエッジ付近に擬似輪郭(リンギング歪)が発生してしまう。
原画像 | リンギング歪 |
分割段階での画像のヒストグラムは、量子化前に比べ量子化後の方が量子化レベルの値に画素が集中する。集中した部分を0に近いほうからA,B,C・・・グループとする。Aグループには平面やランダムノイズが、BやCグループにはエッジ成分やリンギング歪が多量に含まれていると考えられる。
原画像 | ソーベルフィルタ抽出結果 | 本手法抽出結果 |
それぞれのグループに対し周囲の画素との関係も考慮しながらリンギング歪の特定を行ったところ、ある程度エッジ周辺の画素を捉える結果を得た。
本研究は、画像の幾何特性を利用したモデル化を実現することで、画像データの圧縮や、 自然な拡大・縮小など様々な処理に対応できるモデルを確立することを目的とする。 実現手法として画像の輝度値を高さとする画像曲面を関数表現可能な二次曲面で近似す ることを提案する。基礎検討として、二次曲面を分解して得られる曲線で画像の一次元 信号を近似し、提案手法の妥当性を確認する。
まず、画像1ラインの輝度値分布を小領域で区切ることにより、曲線の集合に分割するこ とができる。このような小領域における画像信号をニュートンの万有引力の法則に基づ いた2次式によって曲線近似し、画像を再構成する。
画像1ラインの輝度値分布 | 1ライン中の8画素 |
一般に画像信号は複雑で、2次曲線による近似が困難である。そこで、ラプラシ アンピラミッドに基づき、画像信号を周波数成分に分解する。分解された各 周波数成分の信号を曲線で近似することにより再構成画像の近似精度の向上を図っている。
低周波成分の近似 | 高周波成分の近似 |
PSNR 29.0[dB] | PSNR 35.4[dB] | |
原画像 | 直線近似 | 提案手法 |