ご使用のブラウザでは、Cookieの設定が無効になっています。
すべての機能を利用するには、ブラウザの設定から当サイトドメインのCookieを有効にしてください。

  • 速習強化学習 基礎理論とアルゴリズム

  • 速習強化学習 基礎理論とアルゴリズム

速習強化学習 基礎理論とアルゴリズム

  • ページ数
    132p
  • ISBN
    978-4-320-12422-6
  • 発売日
    2017年09月

閉じる

例)1234567

[住所の変更]

宅配受取り
店舗受取り(送料無料
セブン-イレブン
その他の店舗

閉じる

[対象店舗]
お急ぎ店舗受取り(324円

【お知らせ】2017年11月17日より店舗受取り(送料無料)の条件が変更になりました。
詳しくはこちら

数量:

3,000 (税込:3,240

メーカーに在庫確認

シェアする
Facebook
Twitter
Google+
メール

閉じる

ログイン後、改めてメールの送信をお願いします。 ログイン

商品の説明

  • GoogleのAlphaGoによるプロ棋士打破は,人工知能がヒトを超えた学習を行った歴史的出来事として認識された。強化学習はここで重要な役割を果たしてているだけでなく,自動運転やロボット制御などの重要な分野への応用も知られ,いま世間の強い関心を集めている。その一方,日本語で強化学習を体系的に学べる教科書は多くはなく,代表的な教科書であるSutton and Barto (1998)とその訳書も出版から20年が経とうとしている。
    本書はトップ会議のチュートリアルで利用されたり,2010年の出版以降わずか数年で500弱の引用がされたりという事実からも窺えるように,入門書として広く読まれている良書である。本書の内容は動的計画法などの基本的かつ重要なアルゴリズムに始まり,比較的新しい手法も体系的に網羅しつつもコンパクトに自己完結している。原著の出版から7年あまり経つが,近年の発展は本書で掲載されたアルゴリズム・アイデアをその基礎においている。特に本書では,深層学習を利用した深層強化学習を含む最近の発展に,本書で紹介されたアルゴリズムがどのように使われているかを解説した訳者補遺を追加することで,本書と最先端の研究との橋渡しをしている。
目次
第1章 マルコフ決定過程
第2章 価値推定問題
第3章 制御
第4章 さらなる勉強のために
付録A 割引マルコフ決定過程の理論
付録B TD(λ)法の前方観測的な見方と後方観測的な見方について
付録C 深層強化学習を含む最近の発展

商品詳細情報

サイズ 24cm
原題 原タイトル:Algorithms for Reinforcement Learning
初版の取り扱いについて 初版・重版・刷りの出荷は指定ができません。
また、初版にのみにお付けしている特典(初回特典、初回仕様特典)がある商品は、
商品ページに特典の表記が掲載されている場合でも無くなり次第、終了となりますのでご了承ください。

ページの先頭へ

閉じる

  • 速習強化学習 基礎理論とアルゴリズム
  • 速習強化学習 基礎理論とアルゴリズム

閉じる

エラーが発生しました。

読み込み中