ATR 脳情報研究所
 
  ホーム 研究テーマ メンバー 研究成果 ソフトウエア CREST
 

 

研究成果

English / Japanese


論文


2007

Callan, E. D., Tsytsarwv, V., Hanakawa, T., Callan, M. A., Katsuhatra M., Fukuyama, H., Turner, R. (in press). Song and speech: Brain regions involved with preception and covert production. NeuroImage.

Elfwing, S., Doya, K., Christensen, H. I. (2007). Evolutionary development of hierarchical learning structures. IEEE Transactions on Evolutionary Computations, 11(2), 249-264.[PDF]

Imamizu, H., Sugimoto, N., Osu, R., Tsutsui, K., Sugiyama, K., Wada, Y., Kawato, M. (in press). Explicit contextual information selectively contributes to predictive switching of internal models. Experimental Brain Research.

Ogasawara, H., Doi, T., Doya, K., Kawato, M. (2007). Nitric oxide regulates input specificity of long-term depression and context dependence of cerebellar learning. PLoS Computational Biology, 3(1), e179.[PDF]

Schweighofer,N., Tanaka, S. C., Doya, K. (2007). Serotonin and the evaluation of future rewards: Theory, experiments, and possible neural mechanisms. Annals of the New York Academy of Sciences, 14, 289-300.[PDF]

Tanaka, K., Khiroung, L., Santamaria, F., Doi, T., Ogasawara, H., Ellis-Davies, C.R., G., Kawato, M., Augustine, J. G. (2007). Ca2+ requirements for cerebellar long-term synaptic depression: role for a postsynaptic leaky integrator. Neuron, 54, 787-800.[PDF]

Wong, K., F., K., Galka, A., Yamashita, O., Ozaki, T. (2007). Modelling non-stationary variance in EEG time series by state space GARCH model. Computers in Biology and Medicine, 36, Issue12, 1327-1335.

2006

Bando, T., Shibata, T., Doya, K., Ishii, S. (2006). Switching particle filters for efficient visual tracking. Robotics and Autonomous Systems, 54, 873-884.[PDF]

Bapi, R. S., Miyapuram, K. P., Graydon, F. X., Doya, K. (2006). fMRI investigation of cortical and subcortical networks in the learning of abstract and effector-specific representations of motor sequences. Neuroimage. 32, 714-727. (Neuroimage Editor’s Choice Award, 2006).[PDF]

Daw, N. D. Doya, K. (2006). The computational neurobiology of learning and reward. Current Opinion in Neurobiology, 16, 199-204.[PDF]

Haruno, M., Kawato, M. (2006). Heterarchical reinforcement-learning model for integration of multiple cortico-striatal loops; fMRI examination in stimulus-action-reward association learning. Neural Networks, 19(8), 1242-1254.

Kawawaki, D., Shibata, T., Goda, N., Doya, K., Kawato, M. (2006). Anterior and superior lateral occipito-temporal cortex responsible for target motion prediction during overt and covert visual pursuit. Neuroscience Research. 54, 112-123.[PDF]
2006 Neuroscience Research Excellent Paper Award

Matsubara, T., Morimoto, J., Nakanishi, J., Sato, M., Doya, K. (2006). Learning CPG-based biped locomotion with a policy gradient method. Robotics and Autonomous Systems, 54,911-920.

Morimoto, J., Doya, K. (in press). Reinforcement learning state estimator. Neural Computation.

Ogasawara, H., Doi, T., Doya, K., Kawato, M. (2006). Nitric oxide regulates input specificity of long-term depression and context dependence of cerebellar learning. PLoS Computational Biology, 3(1), e179. [PDF]

Schweighofer, N., Shishida, K., Cheol, H. E., Okamoto, Y., Tanaka, S., Yamawaki, S., Doya, K. (2006). Humans can adopt optimal discounting strategy under real-time constraints. PLoS Computational Biology, 2(11), e152, 1349-1356. [PDF]

Tanaka, S. C., Samejima, K., Okada, G., Ueda, K., Okamoto, Y., Yamawaki, S., Doya, K. (2006). Brain mechanism of reward prediction under predictable and unpredictable environmental dynamics. Neural Networks. 19, 1233-1241.


杉本徳和, 鮫島和行, 銅谷賢治, 川人光男 (2006). MOSAICモデルにより環境を抽象化する階層型強化学習. 電子情報通信学会論文誌, J89-D(7), 1577-1587.

銅谷賢治, 石井信 (2006). 学習ダイナミクスの制御と脳の物質機構. システム/制御/情報, 50, 303-308.





2005


Callan, M. A., Callan, E. D., Masaki, S. (2005). When meaningless symbols become letters: Neural activity change in learning new phonograms. NeuroImage, 28, 553-562.[PDF]

Capi, G., Doya, K. (2005). Evolution of neural architecture fitting environmental dynamics. Adaptive Behavior, 13 (1), 53-66.[PDF]

Capi, G., Doya, K. (2005). Evolution of recurrent neural controllers using an extended parallel genetic algorithm. Robotics and Autonomous Systems, 52, 148-159. [PDF]

Doi, T., Kuroda, S., Michikawa, T., Kawato, M. (2005). Inositol 1,4,5-trisphosphate-dependent Ca2+ threshold dynamics detect spike timing in cerebellar Purkinje cells. Journal of Neuroscience, 25 (4), 950-961. [PDF]

Doya, K., Uchibe, E. (2005). The Cyber Rodent project: Exploration of adaptive mechanisms for self-preservation and self-reproduction. Adaptive Behavior, 13 (2), 149-160.

Morimoto, J., Doya, K. (2005). Robust reinforcement learning. Neural Computation, 17, 335-359.

Samejima, K., Ueda, Y., Doya, K., Kimura, M. (2005). Representation of action-specific reward value in the striatum. Science, 310, 1337-1340.

Shibata, T., Tabata, H., Schaal, S., Kawato, M. (2005). A model of smooth pursuit in primates based on learning the target dynamics. Neural Networks, 18 (3), 213-224. [PDF]

Yamagishi, N., Goda, N., Callan, E. D., Anderson, J. S., Kawato, M. (2005). Attentional shifts towards an expected visual target alter the level of alpha-band oscillatory activity in the human calcarine cortex. Cognitive Brain Research, 25, 799-809.

Yamashita, O., Sadato, N., Okada, T., Ozaki, T. (2005). Evaluationg frequency-wise directed connectivity of BOLD signals applying relative power contribution with the linear multivariate time series models. NeuroImage, 25, 478-490. [PDF]

石井信, 銅谷賢治 (2005). 強化学習−理論と応用−. 電子情報通信学会誌, 88, 804-810.

鮫島和行, 杉本徳和 (2005). モジュール強化学習と意図. 人工知能学会誌 特集記事「意図研究のスペクトル」, 20(4), 441-448.

銅谷賢治 (2005-2006). 計算神経科学への招待: 脳の学習機構の理解を目指して, 第1回〜14回. 数理科学.

松原崇充, 森本淳, 中西淳, 佐藤雅昭, 銅谷賢治 (2005). 方策こう配法を用いた動的行動則の獲得:2足歩行運動への適用 電子情報通信学会論文誌, J88-D-II, 1, 53-65.

吉本潤一郎, 銅谷賢治, 石井信 (2005). 強化学習の基礎理論と応用. 計測と制御, 44(5), 313-318.



Back to the top


2004

Haruno, M., Kuroda, T., Doya, K., Toyama, K., Kimura, M., Samejima, K., Imamizu, H., Kawato, M. (2004). A neural correlate of reinforcement-based behavioral learning in caudate nucleus: An fMRI study of a stochastic decision task. Journal of Neuroscience, 24 (7), 1660-1665. [PDF]

Miyamoto, H., Morimoto, J., Doya, K., Kawato, M. (2004). Reinforcement learning with via-point representation. Neural Networks, 17, 299-305. [PDF]

Samejima K., Doya K., Ueda K., Kimura M. (2004). Estimating internal variables and parameters of a learning agent by a particle filter. Advances in Neural Information Processing Systems16, 1335-1342, MIT Press. [PDF]

Tanaka S., Doya K., Okada G., Ueda K., Okamoto Y., Yamawaki S. Different cortico-basal ganglia loops specialize in reward prediction on different time scales. Advances in Neural Information Processing Systems16, 701-708, MIT Press. [PDF]

Sato, M., Yoshioka, T., Kajiwara, S., Toyama, K., Goda, N., Doya, K., Kawato, M. (2004). Hierarchical bayesian estimation for MEG inverse problem. NeuroImage, 23, 806-826. [PDF]

Schweighofer, N., Doya, K., Kuroda, S. (2004). Cerebellar aminergic neuromodulation: Towards a functional understanding. Brain Research Reviews, 44, 103-116. [PDF]

Schweighofer, N., Doya, K., Fukai, H., Vianney, J., Furukawa, T., Kawato, M. (2004). Chaos may enhance information transmission in the inferior olive. Proceedings of the National Academy of Sciences, USA, 101 (13), 4655-4660. [PDF]

Tanaka, S. C., Doya, K., Okada, G., Ueda, K., Okamoto, Y., Yamawaki, S. (2004). Prediction of immediate and future rewards differentially recruits cortico-basal ganglia loops. Nature Neuroscience, 7 (8), 887-893. [doi:10.1038/nn1279] [PDF] [PDF-S]

内部英治, 銅谷賢治 (2004). 複数報酬のもとでの階層強化学習. 日本ロボット学会誌, 22(1), 120-129.

杉本徳和, 鮫島和行, 銅谷賢治, 川人光男 (2004). 複数の状態予測と報酬予測モデルによる強化学習と行動目標の推定. 電子情報通信学会論文誌, J87-D-?(2), 683-694.

中村泰, 佐藤雅昭, 石井信 (2004). 神経振動子ネットワークを用いたリズム運動に対する強化学習法. 電子情報通信学会論文誌, J87-D-?(3), 893-902.

Back to the top

2003

Samejima K., Doya K., Kawato M. (2003). Inter-module credit assignment in modular reinforcement learning. Neural Networks, 16, 985- 994. [PDF]

Schweighofer N., Doya K. (2003). Meta-learning of reinforcement learning. Neural Networks, 16, 5-9. [PDF]

吉本潤一郎, 石井信, 佐藤雅昭 (2003). 連続力学システムの自動制御のためのオンラインEM強化学習法. システム制御情報学会論文誌, 16(5), 209-217. [PDF]

吉本潤一郎, 石井信, 佐藤雅昭 (2003). 変分法的ベイズ推定法に基づく正規化ガウス関数ネットワークと階層的モデル選択法. 計測自動制御学会論文集, 39(5), 503-512. [PDF]



2002

Doya, K. (2002). Metalearning and neuromodulation. Neural Networks, 15, 495-506. [PDF]

Doya, K., Dayan,P, Hasselmo M. E. (2002). Computational models of neuromodulation. Neural Networks , 15, 475-477.

Doya, K., Samejima, K., Katagiri, K., Kawato, M. (2002). Multiple model-based reinforcement learning. Neural Computation, 14(6), 1347-1369. [PDF]

大羽成征, 石井信, 佐藤雅昭 (2002). 変分法的ベイズ推定による混合主成分分析. 電子情報通信学会論文誌, J85-D-II(6), 1055-1065.

川人光男, 銅谷賢治, 春野雅彦 (2002). ヒト知性の脳科学はどこまで可能か. 科学, 72(9), 878-918.

鮫島和行, 銅谷賢治, 川人光男 (2002). モジュール競合による運動パターンのシンボル化と見まね学習. 電子情報通信学会論文誌, J85-D-?(1), 90-100. [PDF]

銅谷賢治 (2002). 強化学習とメタ学習の脳内機構―大脳基底核と神経修飾物質系―. 日本神経回路学会誌, 9(1), 36-40.

銅谷賢治 (2002). 強化学習の計算論. 医学のあゆみ, 202(3), 175-179.

銅谷賢治 (2002). 行動学習系のメタパラメタ制御と神経修飾物質. 別冊・数理科学「脳情報数理科学の発展」, 31-36.

銅谷賢治 (2002). つくってみないとわかった気になれない立場から. 科学, 72(9), 919-920.


Back to the top



2001


Doya K., Kimura H., Miyamura A. (2001). Motor control: Neural models and system theory. International Journal of Applied Mathematics and Computer Science, 11, 101-128. [PDF]

Doya, K., Kimura, H., Kawato, M. (2001). Neural mechanisms of learning and control. IEEE Control Systems Magazine, 21(4), 42-54.

Kuroda, S., Yamamoto, K., Miyamoto, H., Doya, K., Kawato, M. (2001). Statistical characteristics of climbing fiber spikes necessary for efficient cerebellar learning. Biological Cybernetics, 84(3), 183-192. [PDF]

Morimoto, J., Doya, K. (2001). Acquisition of stand-up behavior by a real robot using hierarchical reinforcement learning. Robotics and Autonomous Systems, 36, 37-51.

Morimoto, J., Doya, K. (2001). Robust reinforcement learning. V.Tresp et al.(eds.) Advances in Neural Information Processing Systems 13. MIT Press, 1061-1067. [PDF]

Nakahara, H., Doya, K., Hikosaka, O. (2001). Parallel cortico-basal ganglia mechanisms for acquisition and execution of visuo-motor sequences - A computational approach. Journal of Cognitive Neuroscience, 13(5), 626-647. [PDF]

Sato, M. (2001). On-line model selection based on the variational Bayes. Neural Computation, 13(7), 1649-1681.

Schweighofer N., Doya K., Lay F. (2001). Unsupervised learning of granule cell sparse codes enhances cerebellar adaptive control. Neuroscience, 103, 35-50. [PDF]

Yoshimoto, J., Ishii, S., Sato, M. (2001). Application of reinforcement learning based on on-line EM algorithm to balancing of acrobot. Systems and Computers in Japan, 32(5), 12-20.

小池康晴, 銅谷賢治 (2001). マルチステップ状態予測を用いた強化学習によるドライバーモデル. 電子情報通信学会論文誌, J84-D-?(2), 370-379.

川人光男, 銅谷賢治, 春野雅彦 (2001). ヒト知性の計算神経科学,第5回その1:モザイクの拡張とコミュニケーション. 科学, 71(2), 197-204.

川人光男, 銅谷賢治, 春野雅彦 (2001). ヒト知性の計算神経科学,第5回その2:モザイクの拡張とコミュニケーション. 科学, 71(6), 839-843.

川人光男, 銅谷賢治, 春野雅彦 (2001). ヒト知性の計算神経科学,第6回:ヒト知性に計算理論はどこまで迫られるか. 科学, 71(18), 1617-1696.

鮫島和行, 片桐憲一, 銅谷賢治, 川人光男 (2001). 複数の予測モデルを用いた強化学習による非線形制御. 電子情報通信学会論文誌, J84-D-?(9), 2092-2106. [PDF]

鮫島和行, 銅谷賢治, 川人光男 (2001). 強化学習MOSAIC : 予測性によるシンボル化と見まね学習. 日本ロボット学会誌, 19(5), 551-556. [PDF]

鮫島和行, 銅谷賢治 (2001). 強化学習と大脳基底核. バイオメカニズム学会誌, 25(4), 167-171. [PDF]

銅谷賢治, 森本淳, 鮫島和行 (2001). 強化学習と最適制御. システム/情報/制御, 45(4), 30-40.

銅谷賢治 (2001). 脳の計算理論へのトライアスロン的アプローチ. 日本神経回路学会誌, 8(1), 26-27.

森本淳, 銅谷賢治 (2001). 階層型強化学習を用いた3リンク2関節ロボットによる起立運動の獲得. 日本ロボット学会誌, 19(5), 574-579.

Back to the top

2000

Bapi R.S., Doya K., Harner A.M. (2000). Evidence for effector independent and dependent representations and their differential time course of acquisition during motor sequence learning. Experimental Brain Research, 132, 149-62.

Doya, K. (2000). Metalearning, neuromodulation, and emotion. G. Hatanao, et al. (eds) Affective Minds, Elsevier Science, B.V., 101-104. [PDF]

Doya, K. (2000). Complementary roles of basal ganglia and cerebellum in learning and motor control. Current Opinion in Neurobiology, 10(6), 732-739. [PDF]

Doya K. (2000). Reinforcement learning in continuous time and space. Neural Computation, 12, 219-245. [PDF]

Doya, K. (2000). A possible role of serotonin in regulating the time scale of reward prediction. Serotonin: From the Molecule to the Clinic, 89.

石井信, 佐藤雅昭 (2000). 統計的手法に基づく強化学習と制御ルールの獲得. 計測と制御, 39(12), .

川人光男, 銅谷賢治, 春野雅彦 (2000). ヒト知性の計算神経科学,第1回:言語に迫るための条件. 科学, 70(5), 381-387.

川人光男, 銅谷賢治, 春野雅彦 (2000). ヒト知性の計算神経科学,第2回:小脳が獲得する内部モデル. 科学, 70(7), 598-606.

川人光男, 銅谷賢治, 春野雅彦 (2000). ヒト知性の計算神経科学,第4回:多重順逆対モデル(モザイク) - その情報処理と可能性. 科学, 70(11), 1009-1017.

銅谷賢治 (2000). 行動学習系のメタパラメタ制御と神経修飾物質. 数理科学, 38-6(444), 19-24.

中原裕之, 銅谷賢治, 彦坂興秀 (2000). 大脳皮質基底核系機能の計算理論. 脳21, 3(3), 305-310.

吉本潤一郎, 石井信, 佐藤雅昭 (2000). オンラインEMアルゴリズムによる強化学習法のacrobot制御への応用. 電子情報通信学会論文誌, J83-D-II(3), 1024-1033. [PDF]

銅谷賢治, 川人光男, 春野雅彦 (2000). ヒト知性の計算神経科学,第3回:小脳,大脳基底核,大脳皮質の機能分化と統合. 科学, 70(9), 740-749.

銅谷賢治 (2000). ロボットと脳科学. 学術月報, 53(9), 24-28.


Back to the top



1999

Doya K. (1999). What are the computations of the cerebellum, the basal ganglia, and the cerebral cortex. Neural Networks, 12, 961-974. [PDF]

Doya K., Sejnowski T.J. (1999). A computational model of avian song learning. Gazzaniga MS, The New Cognitive Neurosciences, MIT Press, 469-482.

Hikosaka O., Nakahara H., Rand M.K., Sakai K., Lu X., Nakamura K., Miyachi S., Doya K. (1999). Parallel neural networks for learning sequential procedures. Trends in Neurosciences, 22, 464-471. [PDF]

Morimoto J., Doya K. (1999). Hierarchical reinforcement learning for motion learning: learning "stand-up" trajectories. Advanced Robotics, 13, 267-268.

Schweighofer N., Doya K., Kawato M. (1999). Electrophysiological properties of inferior olive neurons: A compartmental model. Journal of Neurophysiology, 82, 804-817.
[PDF]


Back to the top


書籍/レポート


2007

内田肇, 宮脇陽一, 山下宙人, 佐藤雅昭, 田邊宏樹, 定藤規弘, 神谷之康 (2007). 多重解像度局所画像復号器の組み合わせによる視覚像の再構成 . 電子情報通信学会技術研究報告, 106(588), 79-84.

川人光男, 小笠原英明 (2007). シナプス可塑性と安定性の分子機構. 実験医学7月号(羊土社), 25(11), 1656-1662.

西條辰義, 田中沙織, 春野雅彦 (2007). 実験からみえる“人間モデル”. 経済セミナー増刊 「ゲーム理論プラス」 , 28-36.


田中沙織 (2007). ASCONE*2006 石井先生講義録 「不確実環境における意思決定のモデル」. 日本神経回路学会誌, 14(2), 141-147.

春野雅彦, 川人光男 (2007). 脳科学との関連一段と. 日本経済新聞, 17.




2006

内部英治, 銅谷賢治 (2006). 複数の報酬によって与えられる拘束のもとでの強化学習. 電子情報通信学会技術研究報告, 106(102), 1-6.

上岡拓未, 内部英治, 銅谷賢治 (2006). 複数の価値関数を用いた多目的強化学習. 電子情報通信学会技術研究報告, 105(658), 127-132.



2005

Bissmarck, F., Nakahara, H., Doya, K., Hikosaka, O. (2005). Responding to modalities with different latencies. Advances in Neural Information Processing Systems, MIT Press. [PDF]

Bissmarck, F., Franklin, D., Doya, K. (2005). Selective saccades in sequential hand movements. IEICE Technical Report, 105(34), 1-5.

Fujiwara, Y., Sato, M., Yamashita, O., Yoshioka, T., Kawawaki, D., Shibata, T., Doya, K., Toyama, K., Kawato, M. (2005). A method for removal of eye movement artifacts from MEG - Simultaneous current source estimation of eyes and cortical activities from MEG and EOG data. IEICE Technical Report, 43-48

杉本徳和, 銅谷賢治, 川人光男 (2005). マルチエージェント環境における共通なシンボルの生成. 電子情報通信学会技術研究報告, 105(341), 45-50.

藤原祐介, 佐藤雅明, 山下宙人, 吉岡琢, 川脇大, 柴田智広, 銅谷賢治, 外山敬介 (2005). 眼球と大脳皮質の同時電流源推定によるMEG眼球アーチファクト除去. 電子情報通信学会技術研究報告, 104(759), 31-36.



2004

Bissmarck, F., Nakahara, H., Doya, K., Hikosaka, O. (2004). Efficient learning of real-time motor skills by parallel policies. IEICE Technical Report, 104(140), 23-28.

Doya K. (2004). Creating robot’s brain. in Keihanna Sociointelligenesis Group, ed., Wonders of Intelligence - Challenges of Cognitive
Developmental Robotics. pp. 111-131. Blue Backs, Kodansha.(けいはんな社会的知能発生学研究会編,知能の謎,ブルーバックス,講談社)

Samejima K., Doya K., Ueda K., Kimura M. (2004). Estimating internal variables and parameters of a learning agent by a particle filter. Advances in Neural Information Processing Systems16, 1335-1342, MIT Press. [PDF]

Tanaka S., Doya K., Okada G., Ueda K., Okamoto Y., Yamawaki S. (2004). Different cortico-basal ganglia loops specialize in reward prediction on different time scales. Advances in Neural Information Processing Systems16, 701-708, MIT Press. [PDF]

Wolpert, M. D., Doya, K, Kawato, M. (2004). A unifying computational framework for motor control and social interaction. In Frith C, Wolpert DM (Eds.) The Neuroscience of Social Interaction. Oxford University Press, Oxford, UK, 305-322.

川脇大, 柴田智広, 郷田直一, 銅谷賢治, 川人光男 (2004). ヒト大脳皮質における円滑性追跡眼球運動のための視標運動予測に関する領域の機能的同定. 電子情報通信学会技術研究報告, 103(733), 7-12.

銅谷賢治 (2004). カオスが学習のための情報伝達を促進するー下オリーブ核の電気シナプス回路の役割. JST NEWS, 2(8), 14. [PDF]


松原崇充, 森本淳, 中西淳, 佐藤雅昭, 銅谷賢治 (2004). 方策勾配法を用いた動的行動則の獲得:2足歩行運動への適用. 電子情報通信学会技術研究報告, 103(601), 53-58.


Back to the top

2003

Bissmarck, F., Nakahara, H., Doya, K., Hikosaka, O. (2003). Parallel network mechanisms for motor sequence acquisition in real time. IEICE Technical Report, 102(731), 113-118.

内部英治, 銅谷賢治 (2003). 重点サンプリングを用いた複数強化学習器の同時学習. 電子情報通信学会技術研究報告, 102(731), 179-184.

大羽成征, 佐藤雅昭, 石井信 (2003). ベイズ的主成分分析のハイパーパラメータについて. 電子情報通信学会技術研究報告, 102(729), 197-202.

佐藤雅昭, 吉岡琢, 梶原茂樹, 外山敬介 (2003). MEG電源推定とベイズ推定事前分布. 電子情報通信学会技術研究報告, 102(729), 89-94.

鮫島和行, 銅谷賢治, 上田康雅, 木村實 (2003). 大脳基底核-強化学習モデルによる線条体神経細胞活動の記録と予測. 電子情報通信学会技術研究報告, 103(152), 11-16. [PDF]

鮫島和行, 上田泰雅, 銅谷賢治, 木村實 (2003). 行動決定系列からの学習系の内部状態/パラメータ系列の推定. 電子情報通信学会技術研究報告, 102(731), 119-124. [PDF]

杉本徳和, 鮫島和行, 銅谷賢治, 川人光男 (2003). ダイナミクスの線形性に基づいて状態空間を分割する階層型強化学習. 電子情報通信学会技術研究報告, 103(153), 25-30.

杉本徳和, 銅谷賢治, 川人光男 (2003). 教示者の行動目標を推定する見まね学習. 電子情報通信学会技術研究報告, 103(390), 61-66.

田中沙織, 銅谷賢治, 岡田剛, 上田一貴, 岡本泰昌, 山脇成人 (2003). 空間的情報を含むマルコフ決定課題を用いた長期と短期の報酬予測に伴う脳活動のfMRI測定. 電子情報通信学会技術研究報告, 103(92), 1-6.


銅谷賢治 (2003). サイバーローデントー自己保存し自己複製するロボットー. ATR Journal , 49, 12-13.

松山和裕, 鮫島和行, 銅谷賢治 (2003). 淡蒼球内節/黒質網様部の強化学習による確率的行動選択. 電子情報通信学会技術研究報告, 103(490), 43-48.

森本淳, 銅谷賢治, Atkeson, C. (2003). 観測軌道を基にした運動の最適化 起立運動、歩行運動への適用. 電子情報通信学会技術研究報告.


Back to the top

2002

Doya, K. (2002). Recurrent neural networks: Supervised Learning. Arbib M, The Handbook of Brain Theory and Neural Networs, Second Edition. [PDF]

大羽成征, 佐藤雅昭, 石井信 (2002). 混合主成分分析モデルによる欠測データ予測. 電子情報通信学会技術研究報告, 101(736), 181-186.

佐藤雅昭 (2002). 変分ベイズ法によるMEG電源推定. 電子情報通信学会技術研究報告, 101(736), 167-174.

杉本徳和, 鮫島和行, 銅谷賢治, 川人光男 (2002). 複数の状態予測と報酬予測モデルによる強化学習と行動目標の推定. 電子情報通信学会技術研究報告, NC2001-118, 87-94.

田中沙織, 銅谷賢治, 岡田剛, 上田一貴, 岡本泰昌, 山脇成人 (2002). 長期と短期の報酬予測に伴う脳活動のfMRI測定. 電子情報通信学会技術研究報告, (NC2002-16)37-42.

銅谷賢治, 伊藤浩之, 藤井宏, 塚田稔 (2002). 脳の情報表現. 朝倉書店.

銅谷賢治 (2002). 神経情報科学サマースクール2002概況. 日本神経回路学会誌, 9(4), 279-280.

中村泰, 佐藤雅昭, 石井信 (2002). 神経振動子ネットワークを用いた強化学習法による歩行運動の獲得. 電子情報通信学会技術研究報告.

古川哲也, 上田修功, 樋口さとみ, 銅谷賢治, 川人光男 (2002). 拡張結合混合モデルを用いた脳活動解析. 電子情報通信学会技術研究報告, NC2001-96, 111-118.

松本有央, 岡田真人, 銅谷賢治, 川人光男 (2002). 局所回路間の振動位相変化による相互作用の制御. 電子情報通信学会技術研究報告, 101(735), 45-52.

Back to the top


2001

石井信, 佐藤雅昭 (2001). オンライン変分法ベイズ学習による関数近似. 電子情報通信学会技術研究報告, NC2000-90, 37-44.

古川哲也, 佐藤雅昭, 銅谷賢治 (2001). 変分ベイズ法を用いた相互情報量の推定. 電子情報通信学会技術研究報告, 101(94), NC2001-4,19-24.

松本有央, 岡田真人, 銅谷賢治, 菅生康子, 山根茂, 河野憲二 (2001). サル側頭葉顔細胞のVB法 による混合正規分布解析. 電子情報通信学会技術研究報告, 100(686), NC2000-115,93-100.

Back to the top


2000


Doya, K., Katagiri, K., Wolpert, D. M., Kawato, M. (2000). Recognition and imitation of movement paterns by a multiple predictor-controller architecture. IEICE Technical Report, TL2000(11), 33-40.

Doya, K., Samejima, K., Katagiri, K., Kawato, M. (2000). Multiple model-based reinforcement learning. Kawato Dynamic Brain Project Technical Report, KDB-TR-08, 1-20. [PDF]

Kuroda S., Yamamoto K., Miyamoto H., Doya K., Kawato M. (2000). Statistical characteristics of climbing fiber spikes necessary for efficient cerebellar learning. Kawato Dynamic Brain Project.

Morimoto, J., Doya, K. (2000). Robust reinforcement learning. IEICE Technical Report, NC2000-49, 59-66.

大羽成征, 石井信, 佐藤雅昭 (2000). VB法による混合主成分分析. 電子情報通信学会技術研究報告, NC2000-25,9-16.

佐藤雅昭 (2000). オンラインベイズ学習によるモデル選択と動的環境への適応. 電子情報通信学会技術研究報告, NC99-130,97-104.

鮫島和行, 銅谷賢治, 川人光男 (2000). 複数モデルベース強化学習におけるモジュール間の評価割り付け. 電子情報通信学会技術研究報告, NC2000-49, 51-58.

鮫島和行, 銅谷賢治, 川人光男 (2000). 局所線形モデルに基づく状態分割を用いた階層強化学習. 電子情報通信学会ニューロコンピューティング研究会, NC99-115,173-180.

銅谷賢治 (2000). 神経情報科学サマースクール NISS 2000 報告. 日本神経回路学会誌, 7(4), 123-124.

銅谷賢治 (2000). 学習のしかたを学習する―メタ学習と神経修飾物質―. ATR Journal, 41, 10-11.

銅谷賢治 (2000). 脳と心のメカニズムワークショップに参加して. 脳の世紀ニュース, 7(19,20), 13-15.

中原裕之, 銅谷賢治, 彦坂興秀 (2000). 順序動作の学習の脳内ネットワーク. 脳の科学,星和書店, 22(10), 1075-1085.

星野力, 銅谷賢治 (2000). 生物における階層系列学習に関する考察. 電子情報通信学会ニューロコンピューティング研究会, NC99-108177-124.

松本有央, 岡田真人, 木本智幸, 銅谷賢治, 菅生康子, 山根茂, 河野憲二 (2000). サル側頭葉の顔細胞の集団ダイナミクス−MDS による解析と連想記憶回路によるモデル化−. 電子情報通信学会ニューロコンピューティング研究会, NC99-159,69-76.

 

Back to the top

会議発表


2007

Uchibe, E., Doya, K. (2007). Constrained reinforcement learning from intrinsic and extrinsic rewards. 6th EEE International Conference on Development and Learning (ICDL2007).[PDF]

杉本徳和, 春野雅彦, 銅谷賢治, 川人光男 (2007). 複数の報酬関数を持つ環境のためのMOSAICモデル. 生理学研究所研究会 第1回 Motor Control研究会.


春野雅彦 (2007). 力出力とスティッフネス制御に関わる脳部位. 生理学研究所研究会 第1回 Motor Control研究会.

春野雅彦 (2007). 社会的状況における意思決定のメカニズム. 生理学研究所研究会 認知神経科学の先端注意と意思決定の脳内メカニズム.

山口明彦, 杉本徳和, 川人光男 (2007). 回避行動の再利用メカニズムを持つ強化学習手法の提案と多関節ロボットへの応用. 第25回日本ロボット学会学術講演会, 321.





2006

Callan, E. D., Yamashita, O., Tajima, K., Kawato, M. (2006). Classification of single-trial phonetic identification performance using pre-stimulus EEG activity. The organization for human brain mapping, 12th annual meeting (HBM06).

Callan, E. D. (2006). Classification of single-trial prestimulus task-related brain activity using independent component analysis. 脳と心のメカニズム 第6回 冬のワークショップ.

Doya, K. (2006). Reinforcement Learning and the Basal Ganglia. 2006 Japan-Germany Symposium on Computational Neuroscience.

Doya, K. (2006). Short- and long-term reward prediction in cortico-basal ganglia loops . Computational and systems neuroscience 2006 (Cosyne 2006) Workshops.

Doya, K. (2006). Learning model-based analysis of neuoimaging data. Fifth East Asian Biophysics Symposium & Forty-Fourth Annual Meeting of the Biophysical Society of Japan (EABS & BSJ 2006), 46(2), S146.

Haruno, M., Gowrishankar, G., Kawato, M. (2006). Different neural correlates of stimulus-action-dependent and stimulus-dependent reward predictions revealed by fMRI. 第29回日本神経科学大会, 55(Supplement 1), .

Haruno, M., Gowrishankar, G., Kawato, M. (2006). Differential neural correlates of force control and muscle co-contraction control revealed by fMRI with on-line EMG feedback. Society for Neuroscience 36th Annual Meeting (Neuroscience 2006).

Hubbard, A., Callan, E. D., Dapretto, M. (2006). How the brain sees what we say: A functional MRI study of speech and beat gesture. The organization for human brain mapping, 12th annual meeting (HBM06).

Hubbard, A., Callan, E. D., Dapretto, M. (2006). How the brain sees what we say: A functional MRI study of speech and beat gesture. Joint conference of American association of applied linguistics with Canadian association of applied linguistics.

Miyapuram, K.P., Bapi, R. S., Doya, K. (2006). Chunking patterns reflect effector-dependent representation of motor sequence. The 28th Annual Conference of the Cognitive Science Society, 1835-1837.

Miyapuram, K.P., Bapi, R. S., Pammi, V. S. C. , Doya, K. (2006). Hierarchical chunking during learning of visuomotor sequences. IEEE World Congress on Computational Intelligence .

Miyapuram, K.P., Bapi, R. S., Pammi, V. S. C. , Doya, K. (2004). Chunking phenomenon in complex sequential skill learning in humans. The 11th International Conference on Neural Information Processing (ICONIP 2004), 294-299.

Ogasawara, H., Doi, T., Doya, K., Kawato, M. (2006). 一酸化窒素により文脈依存的小脳学習が実現される--シミュレーション研究による仮説. 総合医科学研究セミナー#44.

春野雅彦, Gowrishankar, G, Kawato, M. (2006). Differential neural correlates of force control and muscle co-contraction cotrol revealed by fMRI with on-line EMG feedback. 脳と心のメカニズム 第7回 夏のワークショップ, 印刷物なし.

田中沙織, 銅谷賢治 (2006). 目先の得か?将来の得か?理性と衝動性の脳内メカニズム. 脳を活かす研究会「脳を読む」分科会.

山下宙人 (2006). スパース判別器による半自動特徴抽出を用いたデコーディング法. 脳と心のメカニズム 第6回 冬のワークショップ.





2005

Bando, T., Shibata, T., Doya, K., Ishii, S. (2005). Hard / soft switching particle filters for efficient real-time visual tracking. International Symposium on Artificial Life and Robotics 2005.

Callan, E. D. (2005). Internal models differentially implicated in audiovisual perception of nonnative vowel contrasts. Auditory-Visual Speech Processing 2005 (AVSP 2005), 53-54.

Callan, E. D. (2005). Perceptual identification of difficult second-language phonetic contrasts selectively activates brain regions involved with auditory-articualtory and orosensory mapping. Acoustical Society of Japan 2005 Autumn Meeting, 883-884.

Doi, T., Kuroda, S., Michikawa, T., Doya, K., Kawato, M. (2005). Simulation of input selectivity in molecular signaling networks for cerebellar LTD. 平成17年度 特定領域研究「統合脳」夏のワークショップ.

Doi, T., Kuroda, S., Michikawa, S., Doya, K., Kawato, M. (2005). Spontaneous activity of parallel fibers autoregulates the amount of AMPA receptors to elicit cerebellar LTD for supervised learning. Society for Neuroscience 35th Annual Meeting.

Doya K. (2005). Encoding of future rewards in the striatum. Cold Spring Harbor Workshop on Neural Information and Coding, Mangalore, India.

Doya K. (2005). Reward prediction in the striatum and its modulation by serotonin. Seminar at Sloan-Swartz Center for Theoretical Neurobiology, Brandeis University. Waltham, USA.

Doya, K., Tanaka, S., Samejima, K. (2005). Analysis of learning-related brain activity by model-based state estimation. 第 82 回日本生理学大会, 37.

Doya, K. (2005). Prediction of future rewards in the striatum and its modulation by serotonin. 「脳と心のメカニズム」第6回 夏のワークショップ.

Doya, K. (2005). Mechanisms and origins of reward-based behaviors: Neurobiological and robotic approaches . Brain-Inspired Information Technology2005 (BrainIT2005).

Fujiwara, Y., Sato, M., Yamashita, O., Yoshioka, T., Kawawaki, D., Shibata, T., Doya, K., Toyama, K. (2005). Hierarchical bayesian estimation for removal of eye movement artifacts from MEG data.「脳と心のメカニズム」第6回 夏のワークショップ.


Hitomi, K., Shibata, T., Nakamura,Y., Ishi, S. (2005). Reinforcement learning of stable trajectory for quasi-passive-dynamic walking. IJCAI Workshop on Modeling Natural Action Selection, 229-234.

Matsubara, T., Morimoto, J., Nakanishi, J., Sato, M., Doya, K. (2005). Learning sensory feedback to CPG with policy gradient for biped locomotion. IEEE International Conference on Robotics and Automation (ICRA2005).

Morimura, T., Doya, K. (2005). Utilizing the natural gradient in temporal difference reinforcement learning with eligibility traces. 2nd International Symposium on Information Geometry and its Application, 256-263.

Samejima, K., Ueda, Y., Doya, K., Kimura, M. (2005). Action-specific value representation in the striatum and the reinforcement learning model of basal ganglia. 第 82 回日本生理学会大会, 62.

Samejima, K., Ueda, Y., Doya, K., Kimura, M. (2005). A reinforcement learning model predicts monkey's choice and dorsal striatal activities. Society for Neuroscience 35th Annual Meeting

Schweighofer,N., Shishida, K., Okamoto, Y., Tanaka, S., Yamawaki, S., Doya, K. (2005). Reward value is exponentially discounted at short - time scales and modulated by serotonin in humans. Society for Neuroscience 35th Annual Meeting.

Suzuki, H., Schweighofer, N., Hirata, Y., Fujiwara, K., Katori, Y., Shimokawa, H., Aihara, K., Kawato, M. (2005). Can electrical coupling induce chaos in inferior olive neurons? Experimental evidence. Society for Neuroscience 35th Annual Meeting.

Tanaka, S., Shishida, K., Schweighofer, N., Okamoto, Y., Yamawaki, S., Doya, K. (2005). Serotonin affects temporal credit assignment in delayedstimulus-outcome association learning. Society for Neuroscience 35th Annual Meeting.

Ueda, Y., Samejima, K., Doya, K., Kimura, M. (2005). Distinct groups of striate neurons encode action value, action choice, and reinforcement during free - choice task. Society for Neuroscience 35th Annual Meeting.

Uchibe, E., Doya, K. (2005). Reinforcement learning with multiple heterogeneous modules. The4th International Conference on Development and Learning (ICDL4).

Yamashita, O., Sato, M., Yoshioka, T. (2005). MEG/fMRI spatio-temporal source localization method. 平成17年度生理研研究会「神経科学の道具としての機能的MRI研究会」.

伊藤真, 銅谷賢治 (2005). 強化学習理論に基づいたラット行動選択の解析. 「脳と心のメカニズム」第6回 夏のワークショップ.

小笠原英明, 土居智和, 銅谷賢治, 川人光男 (2005). 文脈情報が一酸化窒素を介し学習が成立すべき内部モデルモジュールを選択する. 「脳と心のメカニズム」第6回 夏のワークショップ.

佐藤雅昭 (2005). 非侵襲脳活動推定とブレイン・ネットワーク・インターフェース. 第20回日本生体磁気学会, 18(1), 20.

佐藤雅昭, 吉岡琢, 梶原茂樹, 外山敬介 (2005). 変分ベイズによるMEGデータ解析. 第8回 情報論的学習理論ワークショップ (IBIS 2005) , 255-261.

鮫島和行 (2005). 強化学習-大脳基底核の計算論的モデル . 第20回 日本大脳基底核研究会, 10-20.

鮫島和行 (2005). 計算論と実験検証の統合による皮質・基底核ループにおける実時間機構. 文部科学省特定領域研究「統合脳」第一領域 班会議, 39.

鮫島和行, 上田康雅, 銅谷賢治, 木村實 (2005). Encoding action-specific reward value in the striatum. 第28回日本神経科学大会, 52, S208.

杉本徳和, 鮫島和行, 銅谷賢治, 川人光男 (2005). MOSAICモデルにより環境を抽象化する階層型強化学習.「脳と心のメカニズム」第6回 夏のワークショップ.

関野祐子, 伊藤真, 銅谷賢治, 白尾智明 (2005). 上乳頭体神経核イボテン酸破壊はオープンフィールドに置かれたラットの海馬CA2領域におけるFosタンパク発現細胞増加を抑制する. 第28回日本神経科学大会, 52, S23.

天正新二郎, 前川聡, 吉本潤一郎, 柴田智広, 石井信 (2005). マルチエージェント環境におけるコミュニケーションの段階的創発. 電子情報通信学会「人工知能と知識処理」情報処理学会「知能と複雑系」合同研究会.

土居智和, 黒田真也, 道川貴章, 銅谷賢治, 川人光男 (2005). 小脳長期抑圧の入力選択性が自発発火頻度依存で調節される. 日本神経回路学会第15回全国大会(JNNS2005), 144-145.

銅谷賢治, Schweighofer,N., 田中沙織, 旭修司, 志々田 一宏, 岡本泰昌, 山脇成人 (2005). 短期と長期の報酬予測に関わる大脳皮質ー基底核回路のセロトニンによる修飾. 第28回日本神経科学大会, 52, S12.

銅谷賢治 (2005). 「学習する脳の不思議」〜「脳をつくる」ことで脳を理解する〜. 楽しむ科学教室 第17回講演.

孫野道征, 吉本潤一郎, 銅谷賢治 (2005). 混合カルマンフィルタによるCyber Rodentの自己位置同定法. 日本神経回路学会第15回全国大会(JNNS2005).

山脇成人, 岡本泰昌, 岡田剛, 上田一貴, 田中沙織, 銅谷賢治 (2005). うつ病のストレス予測機能障害に関する脳機能画像解析. 第28回日本神経科学大会, 52, S23.

吉本潤一郎(, 孫野道征, 銅谷賢治 (2005). Self-localization of Cyber Rodent based on RBF network and Mixture Kalman Filters . 「脳と心のメカニズム」第6回 夏のワークショップ.


Back to the top




2004

Bando, T., Shibata, T., Doya, K., Ishii, S. (2004). Switching particle filters for efficient real-time visual tracking. International Conference on Pattern Recognition 2004. [PDF]

Bissmarck, F., Nakahara, H., Doya, K., Hikosaka, O. (2004). Learning and control of real-time procedural movement. 31st NIPS International Symposium, Multidisciplinary Approaches to Sensorimotor Integration, Old Questions Meet New Concepts.

Doya, K. (2004). How the basal ganglia realize reinforcement learning. Tamagawa−COE International Symposium on Attention and Decision, 70.

Doya K. (2004). Molecular and network mechanisms of reinforcement learning. Annual Meeting of Japanese Physiology Society. Sapporo, Japan.


Doya, K. (2004). Prediction of rewards at different time scales in the basal ganglia. Computational and Neural Systems,California Institute of Technology.

Doya, K. (2004). Cyber rodents: Exploration of adaptive mechanisms for self-preservation and self-reproduction. Neurorobotic models in Neuroscience and Neuroinformatics.

Doya, K. (2004). Metalearning and neuromodulation. 2004 Telluride Workshop on Neuromorphic Engineering.

Doya, K. (2004). Metalearning, neuromodulation and emotion. Laboratory talk (Salk institute).

Doya, K. (2004). Metalearning, neuromodulation and emotion. Laboratory talk (Sony CSL Paris).

Doya K. (2004). Parallel networks for reward prediction at different time scales. The Mechanism of Brain and Mind Workshop. Yuzawa, Japan.

Doya K. (2004). Designing the reward system. 14th Annual Meeting, Japanese Neural Network Society.Kyoto, Japan.

Doya K. (2004). Reward prediction in the striatum and its modulation by serotonin. NIPS 2004 Workshop on Reinforcement Learning and the Brain: Beyond the Dopamine System. Whistler, Canada.

Doya, K. (2004). Competition and cooperation of multiple learning modules. 31st NIPS International Symposium, Multidisciplinary Approaches to Sensorimotor Integration, Old Questions Meet New Concepts.

Elfwing S., Uchibe E., Doya K., Christensen H. I. (2004). Multi-Agent Reinforcement Learning: Using Macro Actions to Learn a Mating Task. IEEE/RSJ International Conference on Intelligent Robots and Systems, Sendai, Japan.

Haruno, M., Kuroda, T., Doya, K., Toyama, K., Kimura, M., Samejima, K., Imamizu, H., Kawato, M. (2004). Computationall-model-based imaging studies of decision learning. Tamagawa-COE International Symposium on Attention and Decision.

Ito M., Doya K., Shirao T., Sekino Y. (2004). Ibotenic acid lesions of the supramammillary nucleus decreased c-Fos expression in the hippocampus of rats exploring in an open field. Annual Meeting of Japanese Physiology Society, Sapporo, Japan.

Ito, M., Doya, K., Shirao, T., Sekino, Y. (2004). Fos imaging reveals that the supramammillary nucleus enhances hippocampal activity of rats placed in a novel open field. Society for Neuroscience 34th Annual Meeting, 96.

Kawato, M., Doya, K., Wolpert, D. (2004). MOAIC; Experimental supports and cognitive implications. International Workshop on "Neural, Computational and Cognitive Mecamisms of Mentalizing.

Kawawaki, D., Shibata, T., Goda, N., Doya, K., Kawato, M. (2004). Anterior and superior lateral occipito-temporal cortex responsible for target motion prediction during overt and covert visual pursuit. Society for Neuroscience 34th Annual Meeting, 64.

Klein, M., Kamp, H., Palm, G., Doya, K. (2004). Expressing and understanding desires in language games. Ninth International Conference on the Simulation and Synthesis of Living Systems (ALIFE9), 170-175.

Klein, M., Doya, K. (2004). Learning to predict the effects of complex utterances. Ninth Neural Computation and Psychology Workshop, modelling language, cognition and action, 41.

Klein, M., Doya, K. (2004). How the brain expresses and understands intentions. 1st International Workshop: "Exploring Social Brain", 21st Century COE Program.

Mori T., Nakamura,Y., Sato, M., Ishii, S. (2004). Reinforcement learning for CPG-driven biped robot. The Nineteenth National Conference on Artificial Intelligence(AAAI2004).

Morimura T., Matsuyama K., Hayashi T., Samejima K., Doya K. (2004). Validation of decision making models by sequential Monte Carlo method applied to human decision data. The Mechanism of Brain and Mind Workshop, Yuzawa, Japan.

Sato, M., Yoshioka, T., Kajiwara, S., Toyama, K., Goda, N., Doya, K., Kawato, M. (2004). Hierarchical variational Bayesian method for MEG. BIOMAG2004, 609.

Schweighofer,N., Tanaka, S., Asahi, S., Okamoto, Y., Doya, K., Yamawaki, S. (2004). An fMRI study of the delay discounting of reward after tryptophan depletion and loading. 1: decision-making. Society for Neuroscience 34th Annual Meeting, 97.

Shibata, T., Suhara, Y., Oga, T., Ueki, Y., Mima, T., Ishii, S. (2004). Application of multivariate autoregressive modeling for analyzing the interaction between EEG and EMG in humans. International Congress Series, 1270C(3), 249-253.


Sugimoto, N, Doya, K., Kawato, M. (2004). Cooperation by estimating other's internal state. Ninth Neural Computation and Psychology Workshop, modelling language, cognition and action.

Tanaka, S., Schweighofer,N., Asahi, S., Okamoto, Y., Yamawaki, S., Doya, K. (2004). An fMRI study of the delay discounting of reward after tryptophan depletion and loading. 2: reward expectation. Society for Neuroscience 34th Annual Meeting, 98.

Uchibe, E., Doya, K. (2004). Competitive-cooperative-concurrent reinforcement learning with importance sampling. The Eighth International Conference on the Simulation of Adaptive Behavior, 287-296.

Uchibe, E., Capi, G., Elfwing, S., Eriksson, A., Suzuyama, H, Doya, K. (2004). Cyber rodent project. Symposium: Towards Artificial Rodents.

Uchibe E., Doya K. (2004). Selection from multiple reward functions for cooperative-competitive-concurrent reinforcement learning. Towards Artificial Rodents. Laboratoire d'Informatique de Paris 6. Paris, France.

Yoshioka, T., Sato, M., Kajiwara, S., Toyama, K., Goda, N., Doya, K., Kawato, M. (2004). An analysis of MEG data by hierarchical variational Bayesian method. BIOMAG2004, 611.

伊藤真, 銅谷賢治, 白尾智明, 関野祐子 (2004). オープンフィールド探索時のラットにおける海馬c-Fos発現に対する上乳頭体核イボテン酸破壊の効果. 第81回日本生理学会大会, 172.

佐藤雅昭 (2004). 非侵襲脳活動計測(fMRIとMEG)情報の統合とその応用. 第19回 生体・生理工学シンポジウム BPES2004, 25-28.

鮫島和行, 上田康雄, 銅谷賢治, 木村實 (2004). 大脳基底核線条体は行動ごとの報酬予測をコードする. 脳と心のメカニズム第五回夏のワークショップ「意志決定:心の物質基盤」.

鮫島和行, 上田康雅, 銅谷賢治, 木村實 (2004). 線条体投射細胞の行動ごとの報酬予測に応じた発火活動. 脳3領域合同終了シンポジウム, 40.

柴田智広 (2004). A Model of Smooth Pursuit Eye Movements: Learning and Prediction Realized by Subregions in MST. 脳と心のメカニズム第5回冬のワークショップ.

杉本徳和, 銅谷賢治, 川人光男 (2004). 教示者の行動目標を推定する見まね学習. 脳と心のメカニズム第4回冬のワークショップ.

須原優一 , 柴田智広, 大賀辰秀 , 植木美乃, 美馬達哉 , 石井信 (2004). 自己回帰モデルを用いた脳波・筋電信号の相互作用解析と臨床応用. 第43回日本エム・イー学会 .

田中沙織, Schweighofer,N., 旭修司, 岡本泰昌, 山脇成人, 銅谷賢治 (2004). Serotoni regulates delay discounting of reward in the striatum. 脳と心のメカニズム第五回夏のワークショップ「意志決定:心の物質基盤」.

田中沙織, Schweighofer,N., 旭修司, 岡本泰昌, 山脇成人, 銅谷賢治 (2004). セロトニンが線条体において報酬予測の時間スケールを制御する. 日本神経回路学会 第14回全国大会, 156-157.

土居智和, 黒田真也, 道川貴章, 川人光男 (2004). IP3依存のCa2+閾値ダイナミクスが小脳プルキンエ細胞においてシナプス可塑性に関わるスパイクタイミングを検出する. 第77回日本生化学会大会, 76(8), 126.254.

銅谷賢治 (2004). 強化学習の脳回路と物質メカニズム. 第81回日本生理学会大会, 63.

銅谷賢治 (2004). 脳はなぜノイジーなのか?. JST異分野研究者交流促進事業フォーラム, 57.

銅谷賢治 (2004). 強化学習の回路と物質のダイナミクス. 日本物理学会第59回年次大会, 59(3), 86.

銅谷賢治 (2004). 強化学習の計算理論と脳内機構. ソニー ライフ・ダイナミクス研究所内研究会 .

銅谷賢治 (2004). 沖縄にかける夢:学習するロボットから生物と心の理解へ. 沖縄科学技術大学院大学県民フォーラム.

銅谷賢治 (2004). 行動系のメタ学習とコミュニケーション機構の解明. 脳3領域合同終了シンポジウム, 15.

銅谷賢治 (2004). 報酬系のデザイン. 日本神経回路学会 第14回全国大会, 12-13.

銅谷賢治 (2004). 将来の報酬予測と他者の状態推定. 第7回情報学シンポジウム, 17-20.

林卓治, 鮫島和行, 銅谷賢治 (2004). 強化学習における最適な割引率とは?. 脳と心のメカニズム第五回夏のワークショップ「意志決定:心の物質基盤」.

松原崇充, 森本淳, 中西淳, 佐藤雅昭, 銅谷賢治 (2004). 2足歩行運動のための動的行動則の獲得 日本機械学会 ロボティクス・メカトロニクス講演会 Robomec'04.

森村哲郎, 松山和裕, 林卓治, 鮫島和行, 銅谷賢治 (2004). 人の行動データの系列モンテカルロ法解析による意思決定モデルの検証. 脳と心のメカニズム第五回夏のワークショップ「意志決定:心の物質基盤」.

山下宙人, 定藤規弘, 尾崎統 (2004). Evaluating frequency-wise directed connectivity of BOLD signals. 脳と心のメカニズム第5回冬のワークショップ.

吉岡琢, 佐藤雅昭, 梶原茂樹, 外山敬介 (2004). 変分ベイズ法によるMEG順モデル選択. 日本神経回路学会第14回全国大会, 16-17.

吉岡琢, 佐藤雅昭, 梶原茂樹, 外山敬介 (2004). 統計的基準によるMEG順モデル選択. 第5回脳磁場ニューロイメージング大会, 11.


Back to the top



2003

Capi G., Doya K. (2003). Evolving recurrent neural controllers for sequential tasks - a parallel implementation. Congress on Evolutionary Computation, 1, 514-519.

Capi G., Uchibe E., Doya K. (2003). Selection of neural architecture and the environment complexity. Dynamic Systems Approach for Embodiment and Sociality From Ecological Psychology to Robotics, 6, 311-317. Advanced Knowledge International.

Daniel M Wolpert, D. M., Doya, K., Kawato, M. (2003). A unifying computational framework for motor control and social interaction.. Philosophical Transactions of the Royal Society, 358, 593-602.

Doya K. (2003). A computational theory of neuromodulation. International Symposium "New Horizons in Molecular Sciences and Systems: An Integrated Approach, " 50.

Doya K. (2003). Enjoy now or strive for future: Neural mechanisms of reward prediction at different time scales. Summer Program 2003 Progarm and Abstracts, 36.

Doya K. (2003). Cyber Rodents: Self-preserving, self-reproducing robotic colony. ATR Up to Date, Summer 2003, 12-13.

Doya K., Sugimoto N., Wolpert D.M., Kawato M. (2003). Selecting optimal behaviors based on contexts. International Symposium on Emergent Mechanisms of Communication, Awaji, 19-23. [PDF]

Elfwing S., Uchibe E., Doya K. (2003). An evolutionary approach to automatic construction of the structure in hierarchical reinforcement learning. Genetic and Evolutionary Computation - GECCO 2003 Proceedings, Part 1, Chicago, IL, Springer, GECCO 2003, LNCS 2723, 507-509. [PDF]

Eriksson A., Capi G., Doya K. (2003). Evolution of meta-parameters in reinforcement learning algorithm. IEEE/RSJ IROS. [PDF]

Oba, S., Sato, M., Ishii, S. (2003) Prior Hyperparameters in Bayesian PCA. ICANN/ICONIP 2003, 123-131.

Samejima K., Ueda Y., Doya K., Kimura M. (2003). Activity of striate projection neurons encodes action-selective reward expectations. Society for Neuroscience 33rd Annual Meeting, 78.

Tanaka S., Doya K., Okada G., Ueda K., Okamoto Y., Yamawaki S. (2003). Prediction of immediate and future rewards differentially recruits cortico-basal ganglia loops. Society for Neuroscience 33rd Annual Meeting, 58.

Ueda Y., Samejima K., Doya K., Kimura M. (2003). Reward value dependent striate neuron activity of monkey performing trial and error behavioral decision task. Neuroscience Research, Vol. 46 Suppl. 1 S1-S220, S50.

Wolpert D.M., Doya K., Kawato M. (2003). A unifying computational framework for motor control and social interaction. Philosophical Transactions of the Royal Society, 358, 593-602.

Yoshimoto, J., Ishii, S., Sato, M. (2003) System identification based on on-line variational Bayes method and its application to reinforcement learning, Artificial Neural Networks and Neural Information Processing ICANN/ICONIP 2003, Lecture Notes in Computer Science 2714, 123-131, Springer Verlag. [PDF]

石井信, 大羽成征, 佐藤雅昭 (2003). ベイズ的主成分分析の事前分布ハイパラメータにいついて. 日本神経回路学会第13回全国大会, 202-203.

伊藤真, 銅谷賢治, 白尾智明, 関野祐子 (2003). Fos免疫染色による新規環境下ラットの海馬・上乳頭体核神経活動解析. 脳と心のメカニズム第4回夏のワークショップ「意識と統括機能」.

伊藤真, 銅谷賢治, 白尾智明, 関野祐子 (2003). 上乳頭体核による海馬神経活動の調節. 海馬と高次脳機能学会.

川脇大, 柴田智広, 郷田直一, 銅谷賢治, 川人光男 (2003). ヒトのFEF野およびMST野における円滑性追跡眼球運動の視標運動予測に関するfMRI研究. 第18回生体・生理工学シンポジウム, 03Y007, 97-98.

川脇大, 柴田智広, 郷田直一, 銅谷賢治, 川人光男 (2003). 円滑性追跡眼球運動モデルにもとづいた視標運動予測に関するfMRI解析. 脳と心のメカニズム第4回夏のワークショップ「意識と統括機能」.

佐藤雅昭, 吉岡琢, 梶原茂樹, 外山敬介 (2003). MEG電源の階層ベイズ推定. 第18回日本生体磁気学会大会, 16(1), 148-149.

佐藤雅昭, 吉本潤一郎, 石井信 (2003). 変分ベイズ推定法に基づくオンラインシステム同定法と部分観測強化学習法. 日本神経回路学会 第13回全国大会, 64-65.

佐藤雅昭, 吉岡琢, 梶原茂樹, 外山敬介, 郷田直一, 銅谷賢治, 川人光男 (2003). MEG 電源の階層変分ベイズ推定. 生理学研究所研究会 第4回「脳磁場ニューロイメージング」, 23.

佐藤雅昭 (2003). オンライン・ベイズ学習について. シンポジウム「学習理論の数学的構造」, 19-47.

鮫島和行, 上田康雅, 銅谷賢治, 木村實 (2003). 報酬予測確率に依存するサル線条体細胞活動とその強化学習モデル. 脳と心のメカニズム第3回冬のワークショップ.

鮫島和行, 上田康雅, 銅谷賢治, 木村實 (2003). 報酬に基づく行動決定課題における行動前後の線条体神経活動. 脳と心のメカニズム第4回夏のワークショップ「意識と統括機能」.

柴田智広, 田端宏充, 銅谷賢治, 川人光男 (2003). ヒト円滑性追跡眼球運動における視標ダイナミクスの学習. 脳と心のメカニズム第3回冬のワークショップ.

田中沙織, 銅谷賢治, 岡田剛, 上田一貴, 岡本泰昌, 山脇成人 (2003). 異なる時間スケールの報酬予測には異なる皮質−基底核ループが関わる. 第4回脳と心のメカニズム夏のワークショップ「意識と統括機能」.

銅谷賢治 (2003). 社会で育つ知能と心. 社会で育つ知能と心 ロボットと脳科学からのアプローチ.

銅谷賢治 (2003). ロボットと脳の報酬系. JSTワークショップ「生命科学における制御―サイバネティクスの新展開」.

銅谷賢治 (2003). 脳の局所回路の計算機構. 神経情報科学サマースクール2003, 3-9.

銅谷賢治 (2003). 脳のモジュール構造とスキル学習. 日本工学アカデミー「ものづくりにおけるスキルとその技術化」作業部会.

銅谷賢治 (2003). メタ学習機構としての情動コミュニケーション. 科研費「動的インタラクションによるコミュニケー ション創発機構の構成と解明」ワークショップ.

銅谷賢治 (2003). 強化学習の脳内機構. 東京大学工学部 計数工学科特別講義.

銅谷賢治 (2003). 行動学習の脳機構. 知能機械情報学先端研究セミナー.

中村泰, 佐藤雅昭, 石井信 (2003). 神経振動子ネットワークを用いた強化学習法による2足歩行運動の獲得. 日本神経回路学会第13回全国大会, 74-75.

坂東誉司, 柴田智広, 銅谷賢治, 石井信 (2003). 動的な再サンプリング法の切り替えによるロバスト視覚追跡. 日本ロボット学会第21回学術講演会, 1K25.

吉岡琢, 佐藤雅昭, 梶原茂樹, 外山敬介 (2003). ベイズ推定によるMEG電源推定. 日本神経回路学会第13回全国大会, 120-121.

吉本潤一郎, 石井信, 吉田和子, 佐藤雅昭 (2003). オンライン変分ベイズ法による部分観測環境の同定と強化学習への応用. 脳と心のメカニズム第3回冬のワークショップ.

Back to the top

2002

Asahi, S., Okamoto, Y., Okada, G., Morinobu, S., Yamawaki, S., Doya, K. (2002). Relationship between brain activation during GO/NOGO task and impulsiveness: A fMRI study 32nd Annual Meeting, Society for Neuroscience.

Capi G., Uchibe E., Doya K. (2002). Selection of neural architecture and the environment complexity. The 3rd Inernational Symposium on Human and Artificial Intelligence Systems: Dynamic Systems Approach for Embodiment and Socialit, Fukui, Japan, 231-237. [PDF]

Nakamura,Y., Sato, M., Ishii,S. (2002). Reinforcement Learning for Biped Robot. 2nd International Symposium on Adaptive Motion of Animals and Machines (AMAM2003), 36.

Okada, G.,Okamoto,Y., Ueda, K., Morinobu, S., Yamawaki, S.,, Doya, K.(2002). Selection between small, immediate rewards and large, delayed rewards in prediction of future reward: A functional magnetic resonance imaging study. 8th International Conference on Functional Mapping of the Human Brain, 968.

Oba,S., Sato,M., Takemasa,I., Monden,M., Matsubara,K., Ishii,S. (2002). Missing value estimation using mixture of PCAs. ICANN 2002, 492-497.

Sato, M., Nakamura,Y., Ishii,S. (2002). Reinforcement Learning for Biped Locomotion. ICANN 2002, 777-782.

Sato, M., Oba,S. (2002). Incremental Sparse Kernel Machine. ICANN 2002, 700-706.

Schweighofer, N., Doya, K. (2002). A biologically plausible computational model of meta-learning in reinforcement learning, Society for Neuroscience 32nd Annual Meeting.

Tanaka, S., Doya, K., Okada, G., Ueda, Y., Okamoto, Y., Yamawaki, S. (2002). Functional MRI study of short-term and long-term prediction of reward. 8th International Conference on Functional Mapping of the Human Brain, 1062.

Ueda, Y., Samejima, K., Doya, K., Kimura, M. (2002). Reward value-dependent striate neuron activity of monkey performing trial-and-error behavioral decision task. Society for Neuroscience 32nd Annual Meeting.

Yoshimoto, J., Ishii, S., Sato, M. (2002) Hierarchical model selection for NGnet based on variational method. International Conference on Artificial Neural Networks 2002 (ICANN 2002) , Lecture Notes in Computer Science 2415, 661-666, Springer Verlag. [PDF]

内部英治, 銅谷賢治 (2002). 複数の報酬関数を用いた強化学習の提案. 脳と心のメカニズム 第2回冬のワークショップ.

内部英治, 銅谷賢治 (2002). 複数報酬のもとでの階層強化学習. 第7回ロボティクス・シンポジア, 149-154.

岡田剛, 岡本泰昌, 上田一貴, 山下英尚, 森信繁, 山脇成人, 横田則夫, 銅谷賢治 (2002). 将来の報酬予測に基づく意思決定に関する脳機能画像研究. 第21回躁うつ病の薬理・生化学的研究懇話会.

岡田剛, 岡本泰昌, 上田一貴, 山下英尚, 森信繁, 山脇成人, 横田則夫, 銅谷賢治 (2002). 将来の報酬予測と意志決定に関する研究. 脳と心のメカニズム 第2回冬のワークショップ.

佐藤雅昭, 古川哲也 (2002). データに隠された構造を探る -ベイズ学習法とその神経活動データ解析への応用-. 平成13年度ATR研究発表会.

鮫島和行, 上田康雅, 銅谷賢治, 木村實 (2002). 行動選択に及ぼす動機付けと過去の行動の文脈/運動/報酬の履歴. 第25回 日本神経科学大会, (?-F-247)221.

鮫島和行 (2002). 大脳基底核の細胞発火と行動 . 神経情報科学サマースクールNISS2002, 83-85.

鮫島和行, 銅谷賢治 (2002). ドーパミン細胞モデル:TD誤差はどう計算されるか?. 脳と心のメカニズム 第2回冬のワークショップ.

鮫島和行, 銅谷賢治 (2002). Integrate-and-fire neuron model を用いた黒質ドーパミン細胞のTD誤差計算モデル. 日本神経回路学会第12回全国大会, p2-18, 231-234.

鮫島和行, 銅谷賢治 (2002). Sequential Monte Carlo 法を用いた学習系の内部変数とパラメタの同時推定. 脳と心のメカニズム第3回夏のワークショップ「知能発達のメカニズム」.

鮫島和行 (2002). 脳の計算論としての強化学習. 電子情報通信学会 総合大会.

柴田智広, 田端宏充, 銅谷賢治, 川人光男 (2002). 視標の非周期運動ダイナミクスに対する人間の円滑性追跡眼球運動と学習. 脳と心のメカニズム第3回夏のワークショップ「知能発達のメカニズム」.

杉本徳和, 鮫島和行, 銅谷賢治, 川人光男 (2002). 複数の状態予測と報酬予測モデルによる強化学習と行動目標の推定. 日本神経回路学会第12回全国大会, p3-12, 335-338.

田中沙織, 銅谷賢治 (2002). 短期と長期の報酬予測に伴う脳活動のfMRI測定と強化学習に基づく回帰解析. 日本神経回路学会第12回全国大会, p1-3, 57-60.

田中沙織, 吉岡琢, 鮫島和行, 佐藤雅昭, 銅谷賢治 (2002). 統計学習理論に基づく神経データ解析ー脳の学習課程を予測するー. 平成14年度ATR研究発表会.

田中沙織, 銅谷賢治, 岡田剛, 上田一貴, 岡本泰昌, 山脇成人 (2002). 長期と短期の報酬予測に伴う脳活動のfMRI測定. 脳と心のメカニズム 第2回冬のワークショップ.

田端宏充, 柴田智広, 田口進也 , 川人光男 (2002). 霊長類の滑らかな眼球運動の並列制御経路モデル . 日本神経回路学会第12回全国大会(JNNSとっとり).

銅谷賢治 (2002). 自分で学習するロボットの「脳」と「心」. 世界脳週間:高校生と教師のための公開講座「脳と心の科学はおもしろい!」.
銅谷賢治 (2002). 脳の情報表現ーポピュレーションコーディングの最近の話題からー. 神経情報科学サマースクールNISS2002, 22-24.

銅谷賢治 (2002). ロボットの報酬系―学習と進化を支えるメカニズム. 計測自動制御学会システム・情報部門学術講演会(SICE SSI-2002), 1-4.

銅谷賢治 (2002). 聴覚の計算論には何が必要か?. 日本音響学会聴覚研究会.

銅谷賢治 (2002). 脳の学習の回路と物質のメカニズム. 計測自動制御学会関西支部シンポジウム, 15-18.

銅谷賢治 (2002). ロボットの歩行学習. 共同利用研究会 直立二足歩行の起源再考:ロコモーションを考える.

銅谷賢治 (2002). Cyber rodent project. けいはんな社会的知能発生学研究会.

銅谷賢治 (2002). 神経情報科学におけるMATLAB. MATLAB ユーザ会, 3-12.

銅谷賢治 (2002). 神経修飾物質系のメタ学習仮説. 脳と心のメカニズム第2回冬のワークショップ.

銅谷賢治 (2002). 自律学習ロボットから脳と心へのアプローチ  - 強化学習の理論に基づく脳の神経回路と物質系の機能モデル-. 平成13年度ATR研究発表会.

銅谷賢治 (2002). メタ学習の計算理論と脳内機構. CREST「脳を創る」第3回公開シンポジウム, 4-5, 29.

銅谷賢治 (2002). 行動系のメタ学習とコミュニケーション機構の解明. CREST「脳を創る」第3回公開シンポジウム, 4-5.

銅谷賢治 (2002). 計算神経科学における強化学習「神経修飾物質系のメタ学習仮説」. 人工知能学会第16回全国大会, CD-ROM(2A1-4), .

銅谷賢治 (2002). 系列運動の複数の座標系による表現:皮質―基底核並列ループの役割. 第25回日本神経科学会,認知座標の変換過程シンポジウム, (S9-2)108.

中村泰, 佐藤雅昭, 石井信 (2002). 強化学習による2足歩行の獲得. 脳と心のメカニズム第3回夏のワークショップ「知能発達のメカニズム」.

森本淳, 銅谷賢治 (2002). 強化学習を用いた状態観測器の構築. 日本神経回路学会第12回全国大会.

山脇成人, 岡本泰昌, 山下英尚, 岡田剛, 上田一貴, 旭修司, 上領直子, 世木田幹 (2002). 将来の報酬予測に基づく意志決定に関する脳機能局在の検討. CREST「脳を創る」第3回公開シンポジウムプログラム, 30.

吉本潤一郎, 石井信, 佐藤雅昭 (2002). 変分法的ベイズ推定法に基づくNGnetの階層的モデル選択法. 日本神経回路学会 第12回全国大会(JNNS2002とっとり) , p1-10, 85-88.

Back to the top

2001

Bapi, R. S., Doya, K. (2001). Multiple forward model architecture for sequence Processing. R. Sun and C. L. Giles (eds) Sequence Learning, Springer, 309-320.

Doya K. (2001). Metalearning and neuromodulation. CREST Workshop on Metalearning and Neuromodulation, Seika, Kyoto, 6.

Doya, K. (2001). Robotic neuroscience: A synthetic approach to the brain. Neuroscience Research Supplement, 24(1), S16.

Doya, K. (2001). Regulatory roles of serotonin and norepinephrine in reinforcement learning. 9th International Catecholamine Symposium, 36,S19-4.

Doya, K. (2001). Specialization of cerebellum, basal ganglia, and cerebral cortex in supervised, reinforcement, and unsupervised learning. Stockholm Workshop on Computational Neuroscience, 13.

Doya, K., Kimura, H., Kawato, M. (2001). Neural mechanisms of learning and control. IEEE Control Systems Magazine, 21(4), 42-54.

Doya K., Kimura H., Miyamura A. (2001). Motor control: Neural models and system theory. International Journal of Applied Mathematics and Computer Science, 11, 101-128.

Doya K., Okada G., Ueda K., Okamoto Y., Yamawaki S. (2001). Prediction of short- and long-term reward: A functional MRI study with a Markov decision problem. Society for Neuroscience 31th Annual Meeting, San Diego, USA.

Doya K., Samejima K., Katagiri K., Kawato M. (2001). Task decomposition and imitation by MOSAIC architecture. HFSP Arundel Meeting / Wolpert Group, Arundel, Canada.

Haruno M., Kuroda T., Doya K., Toyama K., Kimura M., Samejima K., Imamizu H., Kawato M. (2001). fMRI study of human brain activity during reinforcement learning. Society for Neuroscience 31th Annual Meeting, San Diego, USA.

Matsumoto, N., Okada, M., Doya, K., Sugase, Y., Yamane, S., Kawano, K (2001). Dynamics of the face-responsive neurons in the temporal cortex. Neuroscience Research Supplement, 24(1), S73.

Miyapuram K.P., Bapi R.S., Samejima K., Doya K. (2001). fMRI investigation of the learning of visuo-motor sequences. Society for Neuroscience 31th Annual Meeting, San Diego, USA

Okada G., Okamoto Y., Ueda K., Yamashita H., Kagaya A., Morinobu S., Yamawaki S., Doya K. (2001). Localization of brain activity in prediction of future reward using fMRI and MEG. Society for Neuroscience 31th Annual Meeting, San Diego, USA.

Tabata H., Shibata T., Taguchi S., Doya K., Kawato M. (2001). A simulation study on smooth pursuit and ocular following responses based on an MST neural-field model. Society for Neuroscience 31th Annual Meeting, San Diego, USA.

大羽成征, 石井信, 佐藤雅昭 (2001). ガウス過程法のオンライン学習. 電子情報通信学会技術研究報告.

鮫島和行, 銅谷賢治, 川人光男 (2001). モジュール強化学習におけるモジュール間の責任割り付け. 日本神経回路学会第11回全国大会.

田口進也, 田端宏充, 柴田智広, 銅谷賢治, 川人光男 (2001). 眼球運動における小脳の感覚運動変換. 日本神経回路学会第11回全国大会, 229-230.

田端宏充, 柴田智広, 田口進也, 銅谷賢治, 河野憲二, 川人光男 (2001). 円滑性追跡眼球運動の視標予測のためのMST野神経場モデル. 日本神経回路学会第11回全国大会.

銅谷賢治 (2001). 学習するロボットと脳のモデル. AC Net 例会.

銅谷賢治 (2001). Self-regulation of the reward prediction horizon in reinforcement learning. 脳と心のメカニズム第1回冬のワークショップ.

銅谷賢治 (2001). 大脳基底核の強化学習モデルと,小脳,大脳皮質との機能統合. 第78回日本生理学会大会, 158.

銅谷賢治, 川口英夫, 石井信 (2001). 変化する脳:進化/発達/学習/修飾 . 神経情報科学サマースクールNISS2001.

銅谷賢治 (2001). 学習系のパラメタ制御と神経修飾物質系. 第14回北海道ニューロトランスミッターと疾患研究会.

中村泰, 石井信, 佐藤雅昭 (2001). 神経振動子ネットワークを用いた強化学習による歩行運動の獲得. 電子情報通信学会技術研究報告.

古川哲也, 深井英和, ニコラ シュワイゴファー, 佐藤雅昭, 銅谷賢治, 川人光男 (2001). 下オリーブ核細胞モデルの相互情報量解析. 日本神経回路学会第11回全国大会.

松本有央, 岡田真人, 銅谷賢治, 菅生康子, 山根茂, 河野憲二 (2001). サル側頭葉顔細胞集団の混合正規分布解析によるクラスタリング. Neuro2001(第24回日本神経科学・第44回日本神経化学 合同大会), 357.

Back to the top

2000

Bapi, R. S., Graydon, F. X.,Doya, K. (2000). Time course of learning of motor sequence representation. Society for Neuroscience 30th Annual Meeting, 26, 707.

Doya, K. (2000). Metalearning, neuromodulation and emotion. Humanoid Challenge, JST Inter-field Exchange Forum, 87-88.

Doya, K. (2000). Possible roles of neuromodulators in the regulation of learning processes. Society for Neuroscience 30th Annual Meeting, 26, 2103.

Kimura, H., Doya, K. (2000). Motor control: Neural models and system theory. 14th International Symposium on Mathematical Theory and Networks and Systems, 232.
Morimoto, J., Doya, K. (2000). Acquisition of stand-up behavior by a real robot using hierarchical reinforcement learning. 17th International Conference on Machine Learning, 1(1), 623-630.

Morimoto, J., Doya, K. (2000). Robust reinforcement learning. Neural Information Processing Systems 2000, 77.

Nagayuki Y., Ishii S., Doya K. (2000). Multi-agent reinforcement learning: an approach based on the other agent's internal model. Fourth International Conference on Multi-Agent Systems, 215-221.

Nagayuki Y., Ishii S., Ito M., Shimohara K., Doya K. (2000). A multi-agent reinforcement learning method with the estimation of the other agent's actions. Fifth International Symposium on Artifical Life and Robotics, 1, 255-259. [PDF]

Ohba, S., Ishii, S., Sato, M. (2000). Variational Bayes method for Mixture of Principal Component Analyzers. 7th International Conference on Neural Information Processing (ICONIP-2000), 2, 1416-1421.

Samejima, K., Ueda, Y., Kimura, M., Doya, K., Schweighofer, N. (2000). Information coding of the striatal neurons during seqential movement. Society for Neuroscience 30th Annual Meeting, 26, 681.

Sato, M. (2000). On-line Bayesian Learning and Model Selection. 7th International Conference on Neural Information Processing, 1, 470-475.

Sato, M. (2000). Convergence of On-line EM Algorithm. 7th International Conference on Neural Information Processing, 1, 476-481.


石井信, 銅谷賢治 (2000). 強化学習におけるメタパラメータとエージェントの個性. 日本心理学会第64回大会ワークショップ.

石井信, 佐藤雅昭 (2000). 学習のハイパーパラメータ. 文部省特定領域研究「高次脳機能のシステム的理解」第4回冬のワークショップ.

石井信, 佐藤雅昭 (2000). 予測と推定の計算理論的基礎. 日本神経回路学会主催 神経情報科学サマースクール, 14-26.

大羽成征, 石井信, 佐藤雅昭 (2000). VB法による混合主成分分析. 第23回日本神経科学大会・第10回日本神経回路学会大会合同大会, (P-316)143.

銅谷賢治 (2000). 行動の学習と制御のモデル. 文部省特定領域研究「高次脳機能のシステム的理解」公開シンポジウム.

銅谷賢治 (2000). 脳における予測と文脈生成. 日本神経回路学会主催 神経情報科学サマースクール, 4.

銅谷賢治 (2000). 脳科学のためのロボット―脳は創ってみないとわからない. 第23回日本神経科学大会・第10回日本神経回路学会大会合同大会, 291.

銅谷賢治 (2000). 内部モデル,報酬予測と見まねの計算理論. 脳と心のメカニズムワークショップ.

銅谷賢治 (2000). メタ学習と神経修飾物質. JST異分野研究者交流ワークショップ:グランド・チャレンジ「ヒューマノイド・サイエンス」.

長行康男, 石井信, 伊藤実, 下原勝憲, 銅谷賢治 (2000). 他エージェントの行動予測を利用したマルチエージェント強化学習法. 2000年電子情報通信学会総合大会, 1, 111.

松本有央, 岡田真人, 銅谷賢治, 菅生康子, 山根茂, 河野憲二 (2000). サル側頭葉における顔細胞の集団のダイナミクス. 第23回日本神経科学大会・第10回日本神経回路学会大会合同大会, (P-115)110.

森本淳, 銅谷賢治 (2000). 階層型強化学習を用いた実ロボットにおける起立運動の獲得. 第5回ロボティクスシンポジア, 397-402.

吉本潤一郎, 石井信, 佐藤雅昭 (2000). オンラインEM強化学習法を用いた連続システムの自動制御. 電子情報通信学会人工知能と知識処理研究会, AI2000(5), 29-36.

 

Back to the top

1999

Bapi R.S., Doya K. (1999). MFM: Multiple forward model architecture for sequence processing. IJCAI'99 Workshop on Sequence Learning, Stockholm, Sweden.

Bapi R.S., Doya K., Harner A.M. (1999). Visual and motor representations for sequence learning. Japan Science and Technology Corporation.

Doya K. (1999). Multiple representation and algorithms for sequence learning. 2nd International Conference on Cognitive Science, Tokyo, 17-19. [PDF]

Doya K. (1999). Metalearning, neuromodulation and emotion. 13th Toyota Conference on Affective Minds, Mikkabi, Japan, 46-47. [PDF]

Koike Y., Doya K. (1999). Multi state estimation reinforcement learning for driving model. IEEE International Conference on System, Man and Cybernetics, Tokyo, V, 504-509.

Okada M., Toya K., Kimoto T., Doya K. (1999). Retrieval dynamics of associative memory model can explain temporal dynamics of face-responsive neurons in the IT cortex. Society for Neuroscience 29th Annual Meeting, Miami Beach, Florida, USA.

銅谷賢治 (1999). 複数の空間表現とアルゴリズムによる運動学習の脳回路. 視覚と空間認知への総合的アプローチ公開シンポジウム.

Back to the top

 


ホーム 研究テーマ メンバー 研究成果 ソフトウエア CREST