これからの強化学習

紙版 電子版

グーグル株式会社 博(理) 牧野 貴樹 (編著)

筑波大学助教 博(工) 澁谷 長史 (編著)

横浜国立大学講師 博(工) 白川 真一 (編著)

大阪大学教授 工博 浅田 稔 (共著)

産業技術総合研究所 麻生 英樹 (共著)

千葉大学教授 博士(工学) 荒井 幸代 (共著)

京都工芸繊維大学准教授 博(工) 飯間 等 (共著)

沖縄科学技術大学院大学 博(情報科学) 伊藤 真 (共著)

広島大学教授 博(工) 大倉 和博 (共著)

京都工芸繊維大学教授 学術博士 黒江 康明 (共著)

情報通信研究機構 博(工) 杉本 徳和 (共著)

日本IBM東京基礎研究所 博(工) 坪井 祐太 (共著)

沖縄科学技術大学院大学教授 博(工) 銅谷 賢治 (共著)

株式会社Preferred Networks 博(理) 前田新一 (共著)

中部大学准教授 博(工) 松井 藤五郎 (共著)

電気通信大学教授 工博 南 泰浩 (共著)

独立行政法人大学改革支援・学位授与機構准教授 博(工) 宮崎 和光 (共著)

NTTコミュニケーション科学基礎研究所 目黒 豊美 (共著)

日本IBM東京基礎研究所 博(工) 森村 哲郎 (共著)

ATR脳情報研究所 博(工) 森本 淳 (共著)

富山大学准教授 博(工) 保田俊行 (共著)

奈良先端科学技術大学院大学准教授 博(工) 吉本 潤一郎 (共著)

参考価格 ¥ 4,620 ※各販売ストアにてご確認ください
ページ320
発行年月2017.07
内容
目次
ダウンロード
正誤表
◆強化学習は「ポストビッグデータ」の技術である!
人工知能,金融工学,ロボット制御,言語処理,生産現場やサービスの最適化,あらゆる分野に応用が広がる強化学習.十分なデータが与えられることが前提とされる他の機械学習法と異なり,「足りないデータを集めながら最適化すること」に力点を置く強化学習は,ビッグデータの先を行くための重要な技術となることが期待されます.

◆強化学習の「いま」を知り,「これから」を切り拓くための1冊.
本書では,この分野を代表する執筆陣が集い,強化学習の基礎・発展・応用を多面的に解説します.
・基礎:強化学習の動作原理と基本アルゴリズムを,初学者でも分かるように導入.
・発展:より複雑な問題に対処し,高度な研究に進むための,さまざまな発展的手法を解説.
・応用:マルチロボットシステムの制御,対話処理,医療データ分析,囲碁の対局など広範な応用例・研究事例を通して,強化学習の活用法を紹介.人間の行動や脳の動作を説明するモデルとしての理論・実験も解説.

――強化学習の基礎を学びたい方,発展的手法に触れたい方,応用可能性を一望したい方に最適な1冊!
第1章 強化学習の基礎的理論
強化学習とは/強化学習の構成要素/価値反復に基づくアルゴリズム/方策勾配に基づくアルゴリズム/部分観測マルコフ決定過程と強化学習

第2章 強化学習の発展的理論
統計学習の観点から見たTD学習/強化学習アルゴリズムの理論性能解析とベイズ統計による強化学習のモデル化/逆強化学習/試行錯誤回数の低減を指向した手法:経験強化型学習XoL/群強化学習法/リスク考慮型強化学習/複利型強化学習

第3章 強化学習の工学応用
高次元・実環境における強化学習/連続的な状態・行動空間への拡張:マルチロボットシステムへの適用/対話処理における強化学習/マルチエージェント系の報酬設計/自然言語処理における逆強化学習・模倣学習の適用/医療臨床データ分析への応用/深層学習を用いたQ関数の学習:Atariと囲碁への応用

第4章 知能のモデルとしての強化学習
脳の意思決定機構と強化学習/内発的動機付けによるエージェントの学習と発達

ダウンロードコンテンツはありません

書籍検索

978 - 4 - 627 -   - x (5桁の数字を入力)
  年       月