Applying the Policy Gradient Method to Behavior Learning in Multiagent Systems: The Pursuit Problem

Seiji Ishihara, Harukazu Igarashi

研究成果: Article査読

6 被引用数 (Scopus)
本文言語English
ページ(範囲)101-109
ジャーナルSystems and Computers in Japan
37
出版ステータスPublished - 2006 6 12

引用スタイル