強化学習

保護中: 関数近似を用いた強化学習(1) – 価値関数の関数近似(バッチ学習の場合)

デジタルトランスフォーメーション(DX)、人工知能(AI)、機械学習(ML)タスクのための強化学習での膨大な状態数に対応するための価値関数のバッチ学習のケースでの関数近似
推論技術:inference Technology

保護中: 時系列・空間データのモデリング(1)(動的線形モデル)

動的線形モデルを中心とした時間・空間モデルのベイズモデル化とMCMCによる評価
web技術:web technology

ワークフロー&サービス技術

ワークフロー&サービス技術にいて ワークフローとサービス技術は、ビジネスや組織において重要な役割を果たすもので、ワークフローは、タスクやプロセスがどのように実行されるかを定義し、効率的な作業フローを確立し、一...
IOT技術:IOT Technology

保護中: モデルベース型の強化学習(スパースサンプリング、UCT、モンテカルロ探索木)

デジタルトランスフォーメーション(DX)、人工知能(AI)、機械学習(ML)タスクに活用されるモデルベース型の強化学習(スパースサンプリング、UCT、モンテカルロ探索木)
アルゴリズム:Algorithms

機械学習プロフェッショナルシリーズ ベイズ深層学習 読書メモ

機械学習プロフェッショナルシリーズ ベイズ深層学習 読書メモ 機械学習プロフェッショナルシリーズ 「ベイズ深層学習 」より読書メモを記述する 前書き ベイズ深層学習の目指すところ 深層学習の課題 大...
セマンテックウェブ技術:Semantic web Technology

ISWC2010論文集より

  ISWC2010論文集より 知識情報をハンドリングする人工知能技術の一つであるセマンティックウェブ技術の国際学会であるISWC2010より。 前回はISWC2009について述べた。今回は中国の上海で開かれ...
グラフ理論

構造学習

構造学習について データが持つ構造を学習することは、そのデータが何であるかという解釈を行う上で重要なものとなる。構造学習の中で最もシンプルなもは、階層的なクラスタリングであり、決定木による学習の基本的な機械学習アルゴリズム...
微分積分:Calculus

機械学習プロフェッショナルシリーズ「機械学習のための連続最適化」読書メモ

サマリー 機械学習における連続最適化とは、ニューラルネットワークの重みやバイアスの最適化、回帰分析のパラメータ推定、SVMのパラメータ推定等の変数が実数値をとる最適化問題を解く手法となる。連続最適化の代表的な手法には、勾配降...
Symbolic Logic

ISWC2009論文集より

  ISWC2009論文集より 知識情報をハンドリングする人工知能技術の一つであるセマンティックウェブ技術の国際学会であるISWC2009より。 前回はISWC2008について述べた。今回はアメリカのワシント...
IOT技術:IOT Technology

保護中: モデルフリー型の強化学習(2)- 方策反復法(Q学習法、SARSA、アクタークリック法)

デジタルトランスフォーメーション(DX)、人工知能(AI)、機械学習タスクに活用されるモデルフリー型強化学習への価値反復法(Q学習法、SARSA法、アクター・クリティック法)
モバイルバージョンを終了
タイトルとURLをコピーしました