強化学習
- 電子あり

内容紹介
理論は裏切らない
・強化学習で必要になる数理を広くカバーした。
・一貫したていねいな解説なので、じっくり読める。付録・参考文献も充実!
・ベルマン方程式、TD学習、方策勾配、POMDP、深層強化学習をより深く!
【おもな内容】
第1章 準備
1.1 強化学習とは
1.2 マルコフ決定過程と逐次的意思決定問題
1.3 方策
1.4 逐次的意思決定問題の定式化
第2章 プランニング
2.1 準備
2.2 動的計画法
2.3 動的計画法による解法
2.4 線形計画法による解法
第3章 探索と活用のトレードオフ
3.1 概要
3.2 探索と活用のトレードオフ
3.3 方策モデル
第4章 モデルフリー型の強化学習
4.1 データにもとづく意思決定
4.2 価値関数の推定
4.3 方策と行動価値関数の学習
4.4 収束性
4.5 アクター・クリティック法
第5章 モデルベース型の強化学習
5.1 問題設定の整理
5.2 環境推定
5.3 ブラックボックス生成モデルに対するプランニング
5.4 オンラインのモデルベース型強化学習
第6章 関数近似を用いた強化学習
6.1 概要
6.2 価値関数の関数近似
6.3 方策の関数近似
第7章 部分観測マルコフ決定過程
7.1 部分観測マルコフ決定過程(POMDP)の基礎
7.2 POMDP のプランニング
7.3 POMDP の学習
第8章 最近の話題
8.1 分布強化学習
8.2 深層強化学習
付録A 補足
A.1 証明
A.2 ノルム
A.3 線形計画法
A.4 自然勾配法の補足
目次
- 準備
- プランニング
- 探索と活用のトレードオフ
- モデルフリー型の強化学習
- モデルベース型の強化学習
- 関数近似を用いた強化学習
- 部分観測マルコフ決定過程
- 最近の話題
製品情報
製品名 | 強化学習 |
---|---|
著者名 | 著:森村 哲郎 |
発売日 | 2019年05月23日 |
価格 | 定価 : 本体3,000円(税別) |
ISBN | 978-4-06-515591-2 |
判型 | A5 |
ページ数 | 320ページ |
シリーズ | 機械学習プロフェッショナルシリーズ |
関連シリーズ
-
劣モジュラ最適化と機械学習
-
スパース性に基づく機械学習
-
生命情報処理における機械学習
-
データ解析におけるプライバシー保護
-
機械学習のための連続最適化
-
関係データ学習
-
オンライン予測
-
深層学習による自然言語処理
-
統計的因果探索
-
ガウス過程と機械学習
-
音声認識
-
異常検知と変化検知
-
画像認識
-
ヒューマンコンピュテーションとクラウドソーシング
-
変分ベイズ学習
-
ノンパラメトリックベイズ 点過程と統計的機械学習の数理
-
グラフィカルモデル
-
バンディット問題の理論とアルゴリズム
-
ウェブデータの機械学習
-
機械学習のための確率と統計
-
深層学習
-
オンライン学習
-
トピックモデル
-
統計的学習理論
-
サポートベクトルマシン
-
確率的最適化
おすすめの本
-
電子あり
Q&Aで学ぶ やさしい微生物学
-
電子あり
ゼロから学ぶディジタル論理回路
-
電子あり
ベイズ深層学習
-
電子あり
カラー図解Excel「超」効率化マニュアル 面倒な入力作業を楽にする
-
電子あり
誰が殺した? 日本国憲法!
-
電子あり
絶対わかる電気化学
-
電子あり
デジタル・ワビサビのすすめ 「大人の文化」を取り戻せ
-
電子あり
機械学習スタートアップシリーズ これならわかる深層学習入門
-
電子あり
大人のための3日間楽器演奏入門
-
イラストで学ぶ 音声認識
-
電子あり
ウェブでの<伝わる>文章の書き方
-
電子あり
ラズパイ4対応 カラー図解 最新 Raspberry Piで学ぶ電子工作 作る、動かす、しくみがわかる!