一、深度强化学习理论基础
1.1 马尔可夫决策过程
强化学习中,智能体(强化学习中独立的能够思想并可以同环境交互的实体)和环境一直在交互。在智能体和环境交互的过程中会产生一个序列: S 0 , A 0 , R 1 , S 1 , A 1 , R 2 , ⋯ …
Qrcode生成中间带log的二维码图片
1.引入依赖 <dependency><groupId>com.swetake.util</groupId><artifactId>QRCode</artifactId><version>3.0</version></dependency>2.测试
public class QRCodeUtil {public static int …