[ 画像の特性と圧縮 ] |
画像圧縮の手法としてよく用いられるJPEGでは符号化方式(DCT変換)に依存するブロック歪と呼ばれるひずみが 生じるため、その欠点を解消したJPEG2000が提案され、普及し始めている。しかし、 JPEG2000にも符号化方式(Wavelet変換)に依存した歪が輪郭線(境界線)周辺に見られる。これをリンギング歪 という。
ブロック歪 | リンギング歪 |
原画像 | Wavelet変換後 |
リンギング歪を解析しやすくするための手段として、符号化後の再構成画像に対し符号化の際 に使用したフィルタを用いて再度分割し、帯域別に処理を 行う手法を提案する。再構成画像を各帯域に再分割することにより、エッジの方向 及び処理の範囲を制限することができるので、歪を解析しやすくなると考えている。
水平成分 | 垂直成分 | 対角成分 |
提案手法を用いて解析を行った結果、ランダムノイズを考慮して量子化前と再分割後の画像の差分を求めることによって取り出したリンギング歪の量は、量子化レベルに依存しないという結果を得た。
ベクトル量子化(VQ)の考え方に基づき、画像を小さなブロックに分割したときのベクトル形状が、 少数の単純なパターンの集合で置き換えることが可能であると考える。本研究では、 このパターンを基本要素と呼び、基本要素を用いた画像の符号化手法の確立を目的とする。
一般的にエッジとして考えられているものは以下に示す通り、水平・垂直・対角方向の8種類である。
これら以外の基本要素の有無を調査した結果、以下のようなベクトル形状が必要であることが判明した。
追加基本要素0 | 追加基本要素1 |
基本要素に追加基本要素を加え、ITE 標準画像「天気予報」の符号化を行った結果、 画像全体の約54%(全ベクトル4096 個中フラット1796 個,エッジ425 個)を17 種類のベクトルで置き換えることが可能であった。 本実験では、少数のベクトルで画像の約半分を構成しているにもかかわらず、符号化された画像は高画質を維持しているという結果が得られた。
フラット領域 全体の44% |
エッジ領域 全体の10% |
平面・エッジ置換え後 35.11[dB] |
本研究では、画像の輝度分布特性を利用し、新しい画像のモデルを構築 することを 目的とする。まず、画像は小ブロックの集合で構成されていると考え、各ブロックの 輝度分布パターンは有限個のパターン(基本要素と呼ぶ)に分けられると仮定し、これ を用いて画像を再構成するモデル化手法を提案する。
まず、第一の基本要素を特定するため、画像を4×4に分割し、その濃淡値群を16次元の ベクトルとみなし、ベクトル量子化に用いられるLBGアルゴリズムを用いて作成された コードベクトルの統計調査を行った。 すなわち、ここで述べているベクトルとは、輝度分布パターンのことを示している。
256個のコードベクトル間の誤差を比較し、類似ベクトルをグループ化した。その結果、 25種類に分類され、最も類似数が多かったベクトルには256個中25個が集まった。 利用頻度を比較すると、25種類中17種が高頻度だったことから、実験で得られた類似 ベクトルは画像に重要なベクトルの集合であると考えられる。 最も類似数が多かったベクトルの平均ベクトルはほぼ平面であるので、第一の基本要 素は平面と言う結論を得た。
類似度調査 | 最多類似数ベクトルの平均 |
第1基本要素が平面であるという結論から、類似ベクトルを平面を置き換え、画質との 関係を調査した。原画像に対し、ベクトル256個のコードブックによるベクトル量子化 を行なったところ、PSNRは29.34[dB]であった。ここで、25個の類似ベクトルを平面と 置き換えたが、PSNRは29.29[dB]と、画質劣化はほとんど見られず、画像の約6割の小 ブロックを平面で置き換えることができた。 このことから基本要素に基づいた画像圧縮の可能性が示された。
PSNR 29.34[dB] | PSNR 29.29[dB] | |
原画像 | ベクトル量子化後 | 平面置換後 |
本研究では、グレースケールの自然静止画像におけるオブジェクト単位の分割・ 抽出に重点を置き、Watershed 法の洪水原理に基づいた処理を空間領域分割の手 法に用いる。このとき、過分割傾向による領域面積の縮小を防ぎ、分割領域の連 結をオブジェクトとして形成する手法について検討した。
Lena | Watershed法による領域分割 (過分割状態) |
提案手法では、
入力画像 | 従来のWatershed法 分割領域数:913 |
領域分割&basin統合 分割領域数:65 |
分割領域の併合 分割領域数:20 |