脳の視覚系の計算理論

霊長類の視覚系は驚くべき能力を持っていますが、それはどのような計算原理で実現されているのでしょうか?その疑問を理論サイドから探求する研究を進めています。機械学習やベイズ統計などの枠組みを用いながら、視覚計算についての数理モデルを、統計学的な観点から立てることを特徴としています。また、高次視覚野の物体や顔の視覚表象や、フィードバック計算による文脈依存的な視覚処理など、高次の認知処理に近い視覚計算を取り上げています。構築したモデルを用い、視覚生理学で明らかになっている実験事実を説明しながら、脳における視覚情報処理の本質を考察するとともに、その成果を人工知能技術へ役立てることも目指しています。

研究テーマ
1. 二次視覚野 (V2) のモデル
V2は、視覚系の第二ステージとされる視覚領野ですが、その理解は一次視覚野 (V1) に比べて大きく遅れています。本研究では、V2の計算方式を探るため、V1の受容野特性を良く説明できるスパース符号化原理が、V2でも続いているという仮説を立て、「階層的スパース符号化モデル」を構築しました。このモデルを、自然画像パッチで学習した結果、マカクザルのV2で知られている3種類のチューニング特性が良く説明でき、また「角」に反応するニューロンの重要性が示唆されました [1]。

[1] Hosoya H, Hyvärinen A. A Hierarchical Statistical Model of Natural Images Explains Tuning Properties in V2. Journal of Neuroscience. 2015;35:10412–28.

2. 顔ニューロンのモデル
高次視覚野には、顔に特化したニューロンが密集して存在しています。本研究では、その符号化方式を探るため、「混合スパース符号化モデル」を提案しています。このモデルでは、自然な顔画像の特徴表現を持つモジュールと、自然物体画像の特徴表現を持つモジュールを仮定し、両者の間の競合計算を考えました。その結果、マカクザル高次視覚野のmiddle patchと呼ばれる顔領野における反応特性が数多く再現され、またパーツベース表現とホリスティック表現が一つのシステムの中でどのように共存しうるかが示唆されました。

[2] Hosoya H, Hyvärinen A. A mixture of sparse coding models explaining properties of face neurons related to holistic and parts-based processing. bioRxiv, 2016. doi: http://dx.doi.org/10.1101/086637.

メンバー
・細谷 晴夫
・Rajani Raman
・Aapo Hyvärinen (UCL/U-Helsinki)