「平均」からはじめる基礎と応用 --
曽我部東馬 /著   -- オーム社 -- 2019.5 -- 21cm -- 202p

資料詳細

タイトル 強化学習アルゴリズム入門
副書名 「平均」からはじめる基礎と応用
著者名等 曽我部東馬 /著  
出版 オーム社 2019.5
大きさ等 21cm 202p
分類 007.13
件名 機械学習 , アルゴリズム
注記 文献あり 索引あり
著者紹介 理学博士(物理学専攻)。マックス・プランク研究所(独)博士研究員、ケンブリッジ大学(英)研究員を経て、2009年帰国、株式会社グリッドの設立に携わり、取締役最高技術責任者を務める。2016年3月電気通信大学准教授、東京大学先端科学技術研究センター客員研究員(兼務)、現在に至る。(本データはこの書籍が刊行された当時に掲載されていたものです)
要旨 強化学習の難解な理論を平均を入口としてやさしく解説。原理→数式→プログラムの流れで全体像を直感的に把握できます。
目次 第1章 平均で学ぶ強化学習の基本概念(平均と期待値;平均と価値 ほか);第2章 各アルゴリズムの特徴と応用(強化学習における方策π(a|S);動的計画法 ほか);第3章 関数近似手法(関数近似の基本概念;関数近似モデルを用いたV(St)の表現 ほか);第4章 深層強化学習の原理と手法(TD‐Q学習法におけるNNによる行動価値関数の回帰;DQNによる行動状態価値関数の近似 ほか)
ISBN(13)、ISBN 978-4-274-22371-6   4-274-22371-X
書誌番号 1113692873
URL https://opac.lib.city.yokohama.lg.jp/winj/opac/switch-detail.do?bibid=1113692873

所蔵

所蔵は 2 件です。現在の予約件数は 0 件です。

所蔵館 所蔵場所 別置 請求記号 資料区分 状態 取扱 資料コード
中央 4階自然科学 Map 情報科学 007.1 一般書 利用可 - 2064692049 iLisvirtual
港南 公開 Map 007.1 一般書 利用可 - 2065039314 iLisvirtual