第2版 --
Richard S.Sutton /共著, Andrew G.Barto /共著, 奥村エルネスト純 /監訳, 鈴木雅大 /監訳, 松尾豊 /監訳, 三上貞芳 /監訳, 山川宏 /監訳, 今井翔太 /共訳, 川尻亮真 /共訳, 菊池悠太 /共訳, 鮫島和行 /共訳, 陣内佑 /共訳, 髙橋将文 /共訳, 谷口尚平 /共訳, 藤田康博 /共訳, 前田新一 /共訳, 松嶋達也 /共訳   -- 森北出版 -- 2022.10 -- 25cm -- 469p

資料詳細

タイトル 強化学習
版情報 第2版
著者名等 Richard S.Sutton /共著, Andrew G.Barto /共著, 奥村エルネスト純 /監訳, 鈴木雅大 /監訳, 松尾豊 /監訳, 三上貞芳 /監訳, 山川宏 /監訳, 今井翔太 /共訳, 川尻亮真 /共訳, 菊池悠太 /共訳, 鮫島和行 /共訳, 陣内佑 /共訳, 髙橋将文 /共訳, 谷口尚平 /共訳, 藤田康博 /共訳, 前田新一 /共訳, 松嶋達也 /共訳  
出版 森北出版 2022.10
大きさ等 25cm 469p
分類 007.13
件名 人工知能 , アルゴリズム
注記 原タイトル:REINFORCEMENT LEARNING 原著第2版の翻訳
注記 文献あり 索引あり
要旨 発展的手法、心理学・神経科学との関係、AlphaGoなどの新しい話題を大幅増補。
目次 第1部 テーブル形式の解法(多腕バンディット問題;有限マルコフ決定過程;動的計画法 ほか);第2部 近似による解法(近似を用いた方策オン型予測;関数近似を用いた方策オン型制御;近似を用いた方策オフ型手法 ほか);第3部 さらに深く(心理学;神経科学;応用と事例紹介 ほか)
ISBN(13)、ISBN 978-4-627-82662-5   4-627-82662-1
書誌番号 1122006755
URL https://opac.lib.city.yokohama.lg.jp/winj/opac/switch-detail.do?bibid=1122006755

所蔵

所蔵は 2 件です。現在の予約件数は 0 件です。

所蔵館 所蔵場所 別置 請求記号 資料区分 状態 取扱 資料コード
中央 4階自然科学 Map 情報科学 007.1 一般書 利用可 - 2073273679 iLisvirtual
戸塚 公開 Map 情報科学 007.1 一般書 利用可 - 2073273687 iLisvirtual