From Computational Problem to zk-SNARK
本部分就是将计算难题转换为多项式,然后使用zk-SNARK。(注:以下用 P,V 替代 Prover,Verifier)
计算难题->R1CS
R1CS(Rank-1 Constraint System)是一种能够将…
一、深度强化学习理论基础
1.1 马尔可夫决策过程
强化学习中,智能体(强化学习中独立的能够思想并可以同环境交互的实体)和环境一直在交互。在智能体和环境交互的过程中会产生一个序列: S 0 , A 0 , R 1 , S 1 , A 1 , R 2 , ⋯ …