拡大・縮小

行間の拡大

色の変更

画像色の反転

ミニパレット

リセット

本文の声

画像読上げ

テキスト拡大表示

ふりがな

ローマ字

使い方

資料詳細

【図書】 強化学習

第２版 --
Ｒｉｃｈａｒｄ　Ｓ．Ｓｕｔｔｏｎ／共著, Ａｎｄｒｅｗ　Ｇ．Ｂａｒｔｏ／共著, 奥村エルネスト純／監訳, 鈴木雅大／監訳, 松尾豊／監訳, 三上貞芳／監訳, 山川宏／監訳, 今井翔太／共訳, 川尻亮真／共訳, 菊池悠太／共訳, 鮫島和行／共訳, 陣内佑／共訳, 髙橋将文／共訳, 谷口尚平／共訳, 藤田康博／共訳, 前田新一／共訳, 松嶋達也／共訳 -- 森北出版 -- ２０２２．１０ -- ２５ｃｍ -- ４６９ｐ

資料詳細

タイトル	強化学習
版情報	第２版
著者名等	Ｒｉｃｈａｒｄ　Ｓ．Ｓｕｔｔｏｎ／共著, Ａｎｄｒｅｗ　Ｇ．Ｂａｒｔｏ／共著, 奥村エルネスト純／監訳, 鈴木雅大／監訳, 松尾豊／監訳, 三上貞芳／監訳, 山川宏／監訳, 今井翔太／共訳, 川尻亮真／共訳, 菊池悠太／共訳, 鮫島和行／共訳, 陣内佑／共訳, 髙橋将文／共訳, 谷口尚平／共訳, 藤田康博／共訳, 前田新一／共訳, 松嶋達也／共訳
出版	森北出版２０２２．１０
大きさ等	２５ｃｍ４６９ｐ
分類	007.13
件名	人工知能 , アルゴリズム
注記	原タイトル：ＲＥＩＮＦＯＲＣＥＭＥＮＴ　ＬＥＡＲＮＩＮＧ　原著第２版の翻訳
注記	文献あり　索引あり
要旨	発展的手法、心理学・神経科学との関係、ＡｌｐｈａＧｏなどの新しい話題を大幅増補。
目次	第１部　テーブル形式の解法（多腕バンディット問題；有限マルコフ決定過程；動的計画法　ほか）；第２部　近似による解法（近似を用いた方策オン型予測；関数近似を用いた方策オン型制御；近似を用いた方策オフ型手法　ほか）；第３部　さらに深く（心理学；神経科学；応用と事例紹介　ほか）
ISBN(13)、ISBN	978-4-627-82662-5　　 4-627-82662-1
書誌番号	1122006755
URL	https://opac.lib.city.yokohama.lg.jp/winj/opac/switch-detail.do?bibid=1122006755

ページの先頭へ

所蔵

所蔵は 2 件です。現在の予約件数は 0 件です。

所蔵館	所蔵場所	別置	請求記号	資料区分	状態	取扱	資料コード
中央	４階自然科学 Map	情報科学	007.1	一般書	利用可	-	2073273679
戸塚	公開 Map	情報科学	007.1	一般書	利用可	-	2073273687

ページの先頭へ