ご使用のブラウザでは、Cookieの設定が無効になっています。
すべての機能を利用するには、ブラウザの設定から当サイトドメインのCookieを有効にしてください。

  • 強化学習
  • 強化学習

  • 強化学習
  • 強化学習

強化学習

  • シリーズ名
    機械学習プロフェッショナルシリーズ
  • ページ数
    305p
  • ISBN
    978-4-06-515591-2
  • 発売日
    2019年05月

閉じる

例)1234567

[住所の変更]

宅配受取り
店舗受取り(送料無料
セブン-イレブン
その他の店舗

閉じる

[対象店舗]
お急ぎ店舗受取り(324円

数量:

3,000 (税込:3,240

メーカーに在庫確認

現在、商品はございません。
ご注文後、メーカーより商品をお取り寄せします。
詳しくはよくある質問をご確認ください。
シェアする
Facebook
Twitter
メール

閉じる

ログイン後、改めてメールの送信をお願いします。 ログイン

商品の説明

  • 強化学習で必要になる数理を広くカバーした。一貫したていねいな解説なので、じっくり読める。参考文献・付録も充実!

商品詳細情報

フォーマット 単行本
サイズ 21cm
対象年齢 一般
発売日について 商品によっては、セブンネットショッピングの倉庫に搬入される日を発売予定日と表記させていただく場合がございますので、
出版社やメーカーが公表している発売日とは異なる場合がございます。
初版の取り扱いについて 初版・重版・刷りの出荷は指定ができません。
また、初版にのみにお付けしている特典(初回特典、初回仕様特典)がある商品は、
商品ページに特典の表記が掲載されている場合でも無くなり次第、終了となりますのでご了承ください。
予約注文のお客様へ クレジットカードをご利用の場合、有効期限のご確認をお願いいたします。
商品出荷の時点でクレジットカードの有効期限が過ぎているまたは、ご利用限度額に達していた等の場合、
カード会社の承認がおりず、キャンセルとなりますのでご注意ください。
※商品によっては、クレジットカードでの決済ができない場合がございます。

商品のおすすめ

理論は裏切らない
・強化学習で必要になる数理を広くカバーした。
・一貫したていねいな解説なので、じっくり読める。付録・参考文献も充実!
・ベルマン方程式、TD学習、方策勾配、POMDP、深層強化学習をより深く!

【おもな内容】
第1章 準備
1.1 強化学習とは
1.2 マルコフ決定過程と逐次的意思決定問題
1.3 方策
1.4 逐次的意思決定問題の定式化

第2章 プランニング
2.1 準備 
2.2 動的計画法
2.3 動的計画法による解法
2.4 線形計画法による解法

第3章 探索と活用のトレードオフ
3.1 概要
3.2 探索と活用のトレードオフ
3.3 方策モデル

第4章 モデルフリー型の強化学習
4.1 データにもとづく意思決定
4.2 価値関数の推定
4.3 方策と行動価値関数の学習
4.4 収束性
4.5 アクター・クリティック法

第5章 モデルベース型の強化学習
5.1 問題設定の整理
5.2 環境推定
5.3 ブラックボックス生成モデルに対するプランニング
5.4 オンラインのモデルベース型強化学習

第6章 関数近似を用いた強化学習
6.1 概要
6.2 価値関数の関数近似
6.3 方策の関数近似

第7章 部分観測マルコフ決定過程
7.1 部分観測マルコフ決定過程(POMDP)の基礎
7.2 POMDP のプランニング
7.3 POMDP の学習

第8章 最近の話題
8.1 分布強化学習
8.2 深層強化学習

付録A 補足
A.1 証明
A.2 ノルム
A.3 線形計画法
A.4 自然勾配法の補足(「近刊情報」より)

ページの先頭へ

閉じる

閉じる

エラーが発生しました。

読み込み中