AI制御ワーキング第2回研究会を以下の期日にて開催いたします。
- 日 時:2026年5月22日(金)世話人会 研究会13:00 – 17:00, 意見交換会 17:30 – 19:30
- 場 所:オンサイトのみ
オンサイト:日本会議室 名古屋駅前店・第2会議室
〒450-0002
愛知県名古屋市中村区名駅3-23-16 タキビル4階
名古屋駅前店の貸し会議室施設トップ|名古屋会議室 | 日本会議室
意見交換会:楽蔵うたげ 名駅4丁目店 (Web)
〒450-0002
愛知県名古屋市中村区名駅4-5-18 コスモス名駅westビル2F
※1 参加費として5000円を実費で頂戴いたします。当日、会場にて集金させていただきます。領収書が必要な場合は、参加申込時にご連絡ください。
※2 参加申込締切後にキャンセルされる場合は、5月20日(水) 17:00までに事務局 (scej.sis.office@gmail.com)へご連絡ください。キャンセル料が発生した場合はご本人負担とさせていただきます。 - 研究会
前回の研究会での議論を踏まえ、本研究会ではAI制御に関する要素技術の一つである、強化学習に関する勉強会を開催する。
※)本研究会では、Pythonを用いた強化学習のハンズオンもおこないます。Python環境に関しては、開催日1~2週間前を目途に参加者へ連絡します。各人PCの持参をお願いします。
13:00 – 13:10 事務連絡
13:10 – 16:00 講演 藤田医科大学 吉本 潤一郎 氏
タイトル: ゼロから学ぶ強化学習:基本理論からPythonフレームワークまで概要:強化学習とは,環境とのインタラクションを通して試行錯誤的に最適な戦略や行動選択則を獲得する機械学習法の枠組みである.近年,強化学習はロボット制御やゲームAIにとどまらず,プロセス最適化や自律制御といった化学工学分野への応用可能性が急速に注目されている.しかしながら,その理論体系は確率過程や動的計画法を基盤としており,従来のプロセス制御の枠組みとは異なる視点を必要とするため,初学者にとっては理解のハードルが高い.
本講演では,機械学習の全体像の中における強化学習の位置づけを明確にした上で,その歴史的背景から基礎理論までを体系的に解説する.特に,マルコフ決定過程(MDP)による問題定式化を出発点として,価値反復法や方策反復法といった古典的手法の原理を丁寧に導入する.続いて,モンテカルロ法,TD学習,Q学習,SARSA法などの代表的アルゴリズムの理解を通じて,「モデルベース学習」と「モデルフリー学習」の違いとその意味を整理する.
さらに,実応用において重要となる探索と知識利用のジレンマ,メタ学習,高次元・連続空間への対応といった実践的課題についても取り上げ,深層強化学習(DQN)の基本的考え方に触れる.講演の後半では,Pythonを用いた簡単なアルゴリズム実装演習を通じて,理論と実装の対応関係を具体的に理解する機会を提供する.
16:10 – 17:00 総合討論 - 参加申込:4月24日(金)までに下記フォーム からお申込みください。
- 問い合わせ先:世話人 大久保順平(E-mail:okubo.jumpei@chiyodacorp.com)
- 今後の予定:未定