简介
Electron 是一个开源的跨平台桌面应用程序开发框架,它允许开发者使用 Web 技术(如 JavaScript、HTML 和 CSS)来构建桌面应用程序。Electron 嵌入了 Chromium(一个开源的 Web 浏览器引擎)和 Node.js(一…
Lecture 5: Monte Carlo Learning
The simplest MC-based RL algorithm: MC Basic
理解MC basic算法的关键是理解如何将policy iteration算法迁移到model-free的条件下。
Policy iteration算法在每次迭代过程中有两步: { Policy evaluation: v π k r π k γ…