イベント / EVENT

平成25年度 第6回 Q&A

第6回 2013年11月26日(火)

どこでもビジュアルコミュニケーション~ 逆境を克服する画像処理 ~
チョン ジーン (国立情報学研究所 コンテンツ科学研究系 准教授)

講演当日に頂いたご質問への回答(全11件)

※回答が可能な質問のみ掲載しています。

ノイズか否かはどう判別するのでしょうか。

観察した信号の値とsignal priorと異なる場合、ノイズと判断します。

GTによるノイズ除去で、ノイズ成分とテクスチャ成分をどう区別するのでしょうか?
同様に、奥行き画像のノイズ除去で、ゴツゴツした岩石の表面のような奥行き画像でのノイズ除去の効果はどのようになりますか?

観察した信号の値とsignal priorと異なる場合、ノイズと判断します。奥行き画像のsignal priorはpiecewise smoothと言えますが、普通の画像の場合はより難しいです。

単純なエッジ成分は、GTが有効、複雑なテクスチャはDCTが有効で、その堺はどの程度の複雑さになりますか?

グラフによってピクセルとの間の関連性を少しでも表現できたら、DCTより効果ができると思います。

「きれいになった」とか「ノイズが除去できた」というのは、どの様にして計るのですか?資料中では、dBで表わされていますが、どのようにして求めてあるのですか?

画像処理の世界では、よくPeak Signal-to-Noise Ratio (PSNR)で画像の品質を評価します。PSNR = 10 log (MAX^2 / MSE)

資料P.34にある「損失したブロックの顕著性が低い可能性が高い」のはなぜですか?損失しやすいブロックとしにくいブロックがあるのでしょうか?

まず一つの画像の中では、高い顕著性を持つエリアは割と小さい。その上に、画像や動画をネット上で伝送する時、unequal error protection (UEP)を用いて、高い顕著性を持つエリアはchannel codingによって守られて、パケットロスは大体低い顕著性のエリアに発生すると考えられます。

人間の顔の位置がわかるカメラがあります。人の顔は、顕著性が高いと思います。形状と顕著性の関係は、心理学的な話だと思いますが、そういった内容をとり込む研究はありますか?

あります。顕著性マップを計算し方はbottom-upとtop-down二つ種類に分けられます。講座で説明したのが、bottom-upの計算し方。人間は顔に注目する傾向ある説はtop-downの計算し方。どちらも有力な顕著性マップの計算し方と考えられます。

自由視点は、あとどのくらいでテレビで実用化するでしょうか。(画像修正との関連)
データサイズはどれくらいでしょうか?どれくらい圧縮する必要がありますか?
GT or DCTが得意というケースはありますでしょうか。

画像処理から考えたら、自由視点は近い将来にできる技術だと考えられます。しかし、ネットワーク幅領域の限界を先に解決する必要があります。GTやDCTも圧縮に貢献できる技術ですが、ネットワークの問題も大事な研究課題だと考えられます。

本日のタイトルに「逆境を克服する・・・」とありますが、逆境とは何でしょうか。

逆境という意味は、例え画像が撮影環境やネットワークによって劣化されても、画像処理の技術で頑張って補うことができると主張したいことです。

どうしてこの研究をしたいと思って始めたのでしょうか。
研究の動機やモチベーションを教えてください。
(現実世界の見え方とは、だいぶ違ってテレビゲームっぽいというか、現実世界なのに、別物のような感覚になり、きもち悪いというか・・・それってうれしいの?と私は感じたので・・・)

人間と人間のコミュニケーションの大きな一部はビジュアルであります。移動しなくても、離れている人たちが同じ部屋で座っている感覚でコミュニケーションできたら、コミュニケーションツールとして大きな貢献になると思います。アメリカのNational Academy of Engineeringでも、「enhance vitrual reality」が21世紀のグランドチャレンジとして選ばれました。

スパース表現の係数が「殆ど」0とは、どの程度までのことと定義されていますか?

圧縮の場合は、量子化のquantization parameterの半分以下であれば、スパースと定められています。ノイズ除去の場合は、係数が完全に0になる必要があります。

Intuituionの「スパース表現できる信号=ノイズを除いた信号」のノイズで認識できなくなるしきい値は、人によって程度差があるとおもいますが、犬などの他の動物や猿や魚では、ノイズのしきい値は異なるのでしょうか?(I HAVE A PEN だったら補間の程度が人によって異なるように・・)

この場合は、人間が観察するかどうかと関係ないと思います。スパース表現は実際の信号の表現し方と前提していうものですので、前提が正しかったら、画像のノイズ除去ができるはずです。

shimin 2013-qa_6 page2530

注目コンテンツ / SPECIAL