イベント / EVENT
平成25年度 第6回 Q&A
第6回 2013年11月26日(火)
どこでもビジュアルコミュニケーション~ 逆境を克服する画像処理 ~
チョン ジーン (国立情報学研究所 コンテンツ科学研究系 准教授)
講演当日に頂いたご質問への回答(全11件)
※回答が可能な質問のみ掲載しています。
ノイズか否かはどう判別するのでしょうか。
観察した信号の値とsignal priorと異なる場合、ノイズと判断します。
GTによるノイズ除去で、ノイズ成分とテクスチャ成分をどう区別するのでしょうか?
同様に、奥行き画像のノイズ除去で、ゴツゴツした岩石の表面のような奥行き画像でのノイズ除去の効果はどのようになりますか?
観察した信号の値とsignal priorと異なる場合、ノイズと判断します。奥行き画像のsignal priorはpiecewise smoothと言えますが、普通の画像の場合はより難しいです。
単純なエッジ成分は、GTが有効、複雑なテクスチャはDCTが有効で、その堺はどの程度の複雑さになりますか?
グラフによってピクセルとの間の関連性を少しでも表現できたら、DCTより効果ができると思います。
「きれいになった」とか「ノイズが除去できた」というのは、どの様にして計るのですか?資料中では、dBで表わされていますが、どのようにして求めてあるのですか?
画像処理の世界では、よくPeak Signal-to-Noise Ratio (PSNR)で画像の品質を評価します。PSNR = 10 log (MAX^2 / MSE)
資料P.34にある「損失したブロックの顕著性が低い可能性が高い」のはなぜですか?損失しやすいブロックとしにくいブロックがあるのでしょうか?
まず一つの画像の中では、高い顕著性を持つエリアは割と小さい。その上に、画像や動画をネット上で伝送する時、unequal error protection (UEP)を用いて、高い顕著性を持つエリアはchannel codingによって守られて、パケットロスは大体低い顕著性のエリアに発生すると考えられます。
人間の顔の位置がわかるカメラがあります。人の顔は、顕著性が高いと思います。形状と顕著性の関係は、心理学的な話だと思いますが、そういった内容をとり込む研究はありますか?
あります。顕著性マップを計算し方はbottom-upとtop-down二つ種類に分けられます。講座で説明したのが、bottom-upの計算し方。人間は顔に注目する傾向ある説はtop-downの計算し方。どちらも有力な顕著性マップの計算し方と考えられます。
自由視点は、あとどのくらいでテレビで実用化するでしょうか。(画像修正との関連)
データサイズはどれくらいでしょうか?どれくらい圧縮する必要がありますか?
GT or DCTが得意というケースはありますでしょうか。
画像処理から考えたら、自由視点は近い将来にできる技術だと考えられます。しかし、ネットワーク幅領域の限界を先に解決する必要があります。GTやDCTも圧縮に貢献できる技術ですが、ネットワークの問題も大事な研究課題だと考えられます。
本日のタイトルに「逆境を克服する・・・」とありますが、逆境とは何でしょうか。
逆境という意味は、例え画像が撮影環境やネットワークによって劣化されても、画像処理の技術で頑張って補うことができると主張したいことです。
どうしてこの研究をしたいと思って始めたのでしょうか。
研究の動機やモチベーションを教えてください。
(現実世界の見え方とは、だいぶ違ってテレビゲームっぽいというか、現実世界なのに、別物のような感覚になり、きもち悪いというか・・・それってうれしいの?と私は感じたので・・・)
人間と人間のコミュニケーションの大きな一部はビジュアルであります。移動しなくても、離れている人たちが同じ部屋で座っている感覚でコミュニケーションできたら、コミュニケーションツールとして大きな貢献になると思います。アメリカのNational Academy of Engineeringでも、「enhance vitrual reality」が21世紀のグランドチャレンジとして選ばれました。
スパース表現の係数が「殆ど」0とは、どの程度までのことと定義されていますか?
圧縮の場合は、量子化のquantization parameterの半分以下であれば、スパースと定められています。ノイズ除去の場合は、係数が完全に0になる必要があります。
Intuituionの「スパース表現できる信号=ノイズを除いた信号」のノイズで認識できなくなるしきい値は、人によって程度差があるとおもいますが、犬などの他の動物や猿や魚では、ノイズのしきい値は異なるのでしょうか?(I HAVE A PEN だったら補間の程度が人によって異なるように・・)
この場合は、人間が観察するかどうかと関係ないと思います。スパース表現は実際の信号の表現し方と前提していうものですので、前提が正しかったら、画像のノイズ除去ができるはずです。
「情報学最前線」 平成28年度 特別会 Q&A 平成28年度 第6回 Q&A 平成28年度 第5回 Q&A 平成28年度 第4回 Q&A 平成28年度 第3回 Q&A 平成28年度 第2回 Q&A 平成28年度 第1回 Q&A 平成27年度
「情報学最前線」 平成27年度 第6回 Q&A 平成27年度 第4回 Q&A 平成27年度 第3回 Q&A 平成27年度 第2回 Q&A 平成27年度 第1回 Q&A 平成26年度
「未来を紡ぐ情報学」 平成26年度 第8回 Q&A 平成26年度 第7回 Q&A 平成26年度 第6回 Q&A 平成26年度 第5回 Q&A 平成26年度 第4回 Q&A 平成26年度 第2回 Q&A 平成26年度 第1回 Q&A 平成25年度
「未来を紡ぐ情報学」 平成25年度 第8回 Q&A 平成25年度 第7回 Q&A 平成25年度 第6回 Q&A 平成25年度 第5回 Q&A 平成25年度 第4回 Q&A 平成25年度 第3回 Q&A 平成25年度 第2回 Q&A 平成25年度 第1回 Q&A 平成24年度
「人と社会をつなぐ情報学」 平成24年度 第8回 Q&A 平成24年度 第7回 Q&A 平成24年度 第3回 Q&A 平成24年度 第1回 Q&A 平成23年度 平成23年度 第8回 Q&A 平成23年度 第7回 Q&A 平成23年度 第6回 Q&A 平成23年度 第5回 Q&A 平成23年度 第4回 Q&A 平成23年度 第3回 Q&A 平成23年度 第2回 Q&A 平成23年度 第1回 Q&A 平成22年度 平成22年度 第8回 Q&A 平成22年度 第7回 Q&A 平成22年度 第6回 Q&A 平成22年度 第5回 Q&A 平成22年度 第4回 Q&A 平成22年度 第3回 Q&A 平成22年度 第2回 Q&A 平成22年度 第1回 Q&A 平成21年度 平成21年度 第8回 Q&A 平成21年度 第7回 Q&A 平成21年度 第6回 Q&A 平成21年度 第5回 Q&A 平成21年度 第4回 Q&A 平成21年度 第3回 Q&A 平成21年度 第2回 Q&A 平成21年度 第1回 Q&A 平成20年度 平成20年度 第8回 Q&A 平成20年度 第7回 Q&A 平成20年度 第6回 Q&A 平成20年度 第5回 Q&A 平成20年度 第4回 Q&A 平成20年度 第3回 Q&A 平成20年度 第2回 Q&A 平成20年度 第1回 Q&A 平成19年度 平成19年度 第8回 Q&A 平成19年度 第7回 Q&A 平成19年度 第5回 Q&A 平成19年度 第2回 Q&A 平成19年度 第1回 Q&A 平成18年度 平成18年度 第8回 Q&A 平成18年度 第7回 Q&A 平成18年度 第5回 Q&A 平成18年度 第3回 Q&A 平成17年度 平成16年度 平成15年度 市民講座アーカイブ
注目コンテンツ / SPECIAL
2024年度 要覧 SINETStream 事例紹介:トレーラー型動物施設 [徳島大学 バイオイノベーション研究所] ウェブサイト「軽井沢土曜懇話会アーカイブス」を公開 情報研シリーズ これからの「ソフトウェアづくり」との向き合い方 学術研究プラットフォーム紹介動画 教育機関DXシンポ 高等教育機関におけるセキュリティポリシー 情報・システム研究機構におけるLGBTQを尊重する基本理念 オープンサイエンスのためのデータ管理基盤ハンドブック 教育機関DXシンポ
アーカイブス コンピュータサイエンスパーク