Pythonで学ぶアルゴリズムの動作原理 --
中井悦司 /著   -- 技術評論社 -- 2020.7 -- 21cm -- 283p

資料詳細

タイトル ITエンジニアのための強化学習理論入門
副書名 Pythonで学ぶアルゴリズムの動作原理
著者名等 中井悦司 /著  
出版 技術評論社 2020.7
大きさ等 21cm 283p
分類 007.13
件名 機械学習 , アルゴリズム , プログラミング(コンピュータ)
注記 欧文タイトル:Reinforcement Learning for Software Engineers
注記 文献あり 索引あり
著者紹介 1971年4月大阪生まれ。ノーベル物理学賞を本気で夢見て、理論物理学の研究に没頭する学生時代、大学受験教育に情熱を傾ける予備校講師の頃、そして、外資系ベンダーでLinuxエンジニアを生業にするに至るまで、妙な縁が続いて、常にUnix/Linuxサーバーと人生を共にする。現在は、米系IT企業のSolutions Architectとして活動。最近は、機械学習をはじめとするデータ活用技術の基礎を世に広めるために、講演活動のほか、雑誌記事や書籍の執筆にも注力。主な著書は、『[改訂新版]プロのためのLinuxシステム構築・運用技術』(技術評論社)など。(本データはこの書籍が刊行された当時に掲載されていたものです)
要旨 強化学習の基礎となるアルゴリズムを体系的に学ぶ。
目次 1 強化学習のゴールと課題(強化学習の考え方;実行環境のセットアップ;バンディットアルゴリズム(基本編);バンディットアルゴリズム(応用編));2 環境モデルを用いた強化学習の枠組み(マルコフ決定過程による環境のモデル化;エージェントの行動ポリシーと状態価値関数;動的計画法による状態価値関数の決定);3 行動ポリシーの改善アルゴリズム(ポリシー反復法;価値反復法;より実践的な実装例);4 サンプリングデータを用いた学習法(モンテカルロ法;TD(Temporal‐Difference)法);5 ニューラルネットワークによる関数近似(ニューラルネットワークによる状態価値関数の計算;ニューラルネットワークを用いたQ‐Learning)
ISBN(13)、ISBN 978-4-297-11515-9   4-297-11515-8
書誌番号 1113798364
URL https://opac.lib.city.yokohama.lg.jp/winj/opac/switch-detail.do?bibid=1113798364

所蔵

所蔵は 5 件です。現在の予約件数は 0 件です。

所蔵館 所蔵場所 別置 請求記号 資料区分 状態 取扱 資料コード
中央 4階自然科学 Map 情報科学 007.1 一般書 利用可 - 2066519379 iLisvirtual
神奈川 公開 Map 情報科学 007.1 一般書 利用可 - 2066557319 iLisvirtual
公開 Map 007.1 一般書 利用可 - 2066567012 iLisvirtual
都筑 公開 情報科学 007.1 一般書 貸出中 - 2066555731 iLisvirtual
戸塚 公開 Map 情報科学 007.1 一般書 利用可 - 2069054865 iLisvirtual