強化学習(第2版)

紙版 電子版

R. Sutton (原著)

A. Barto (原著)

株式会社エウレカ 奥村 エルネスト 純 (監訳)

東京大学特任助教 博(工) 鈴木雅大 (監訳)

東京大学教授 博(工) 松尾豊 (監訳)

はこだて未来大学教授 工博 三上貞芳 (監訳)

全脳アーキテクチャ・イニシアティブ代表 工博 山川宏 (監訳)

東京大学 今井翔太 (共訳)

株式会社Preferred Networks 川尻亮真 (共訳)

株式会社Preferred Networks 菊池悠太 (共訳)

玉川大学教授 博(工) 鮫島和行 (共訳)

株式会社Lily MedTech 陣内佑 (共訳)

株式会社DeepX 髙橋将文 (共訳)

東京大学 谷口尚平 (共訳)

株式会社Preferred Networks 藤田康博 (共訳)

株式会社Preferred Networks 博(理) 前田新一 (共訳)

東京大学 松嶋達也 (共訳)

参考価格 ¥ 6,600 ※各販売ストアにてご確認ください
ページ496
発行年月2022.10
内容
目次
ダウンロード
正誤表
不朽の名著、待望の改訂版!

強化学習発展の立役者自らが書き下ろした書。「強化学習の考え方とアルゴリズムを明確に簡潔に説明する」という第1版の特長はそのままに、第2版では、発展的手法や心理学・神経科学との関係の紹介が大幅に加筆されています。
第I部では、テーブル形式の範囲でできるだけ多くの強化学習を扱い、核となる考え方を単純な設定で進めます。第II部では、そうした考え方を関数近似に拡張します。第III部では、心理学・神経科学との関係、AlphaGoなどのケーススタディ、将来展望について述べています。
ますます重要性を増す強化学習について、基礎から応用までを学べる一冊です。

[原著]Reinforcement Learning, Second Edition: An Introduction (The MIT Press, 2018)

***

「第1版は、強化学習の学習者には必読の教科書となっています。刊行から20年の時間が経ち、AlphaGoなどの新しい技術も出てきました。こうした新しい話題をカバーしながら、基礎からしっかりと説明がされているのが、この改訂版です。……強化学習の分野もまだまだこれから大きく発展していくと考えられますが、本書は、現時点で、この分野を学ぶための最もわかりやすく整理された教科書だと思います。」
――東京大学教授・松尾 豊(監訳者序文より)
第1章 序

第I部 テーブル形式の解法
第2章 多腕バンディット問題
第3章 有限マルコフ決定過程
第4章 動的計画法
第5章 モンテカルロ法
第6章 TD学習
第7章 nステップ・ブートストラップ法
第8章 テーブル形式手法におけるプランニングと学習

第II部 近似による解法
第9章 近似を用いた方策オン型予測
第10章 関数近似を用いた方策オン型制御
第11章 近似を用いた方策オフ型手法
第12章 適格度トレース
第13章 方策勾配法

第III部 さらに深く
第14章 心理学
第15章 神経科学
第16章 応用と事例紹介
第17章 強化学習のこれから

ダウンロードコンテンツはありません

書籍検索

978 - 4 - 627 -   - x (5桁の数字を入力)
  年       月