2、Q-learning属于哪种算法A.On-policy算法B.Off-policy 算法C.Model-based 算法D.Value-based 算法

2、Q-learning属于哪种算法

A.On-policy算法

B.Off-policy 算法

C.Model-based 算法

D.Value-based 算法


参考答案和解析
B

相关考题:

蒙特卡罗算法是以下的哪种() A.分支界限算法B.概率算法C.贪心算法D.回溯算法

下面安全算法中,属于加密算法的是(1),属于报文摘要算法的是(2)。空白(2)处应选择() A.MD5和3DESB.MD5和SHA1C.DES和SHA1D.DES和3DES

我国的商用密码算法中属于分组加密算法的是() A.SM2B.SM3C.SM4D.SM9

以下哪种算法只与信号强度有关,而与路径损耗无关?___ A.M-算法B.K-算法C.定位算法D.L-算法

以下哪种算法不属于多个分区的可变分区存储管理方式的主存分配算法() A、最先适应分配算法B、最优适应分配算法C、最坏适应分配算法D、最后适应分配算法

下面哪种算法不属于页式虚拟存储管理中的页面调度算法() A、先进先出调度算法B、最近最少用调度算法C、优先数调度算法D、最近最不常用调度算法

以下哪种算法是公钥加密算法?A.Blowfish算法B.AES算法C.三重DESD.RSA算法

直放站引入后,对下列哪种算法不产生影响()。A.功率控制算法B.准入控制算法C.负载平衡算法D.切换算法

( 45 )下列哪种加密算法不属于对称加密 ? ( )A ) DESB ) IDEAC ) TDEAD ) RSA

下面哪种算法是对称加密算法? A.Blowfish算法 B.ElGamal算法 C.背包加密算法 D.RSA算法

(49)以下哪种算法是公钥加密算法?A)Blowfish算法B)AES算法C)三重DESD)RSA 算法

加密算法中的EEA3属于哪种安全算法? A.Null algorithmB.ZUCC.ZESD.SNOW3G

在Q-Learning中,所谓的Q函数是指()。A、状态动作函数B、状态值函数C、动作值函数D、策略函数

在OS/2中采用哪种调度方式和调度算法?

以下哪种加密算法不属于对称加密算法?()A、DESB、3DESC、AESD、HASH

AES算法是哪种算法?()。A、对称密钥加密B、非对称密钥加密C、哈希算法D、流加密

以下哪种算法只与信号强度有关,而与路径损耗无关()A、M-算法B、K-算法C、L-算法D、定位算法

下列哪种算法属于分类算法的范畴().A、Apriori算法B、k-means算法C、kNN算法D、FP-Growth算法

下列哪种算法属于聚类算法的范畴().A、Apriori算法B、k-means算法C、kNN算法D、C4.5算法

加密算法中的EEA3属于哪种安全算法?A、Null algorithmB、ZUCC、ZESD、SNOW3G

单选题以下哪种加密算法不属于对称加密算法?()ADESB3DESCAESDHASH

问答题在OS/2中采用哪种调度方式和调度算法?

单选题在Q-Learning中,所谓的Q函数是指()。A状态动作函数B状态值函数C动作值函数D策略函数

单选题下列哪种算法属于聚类算法的范畴().AApriori算法Bk-means算法CkNN算法DC4.5算法

单选题直放站引入后,对下列哪种算法不产生影响?()A功率控制算法B准入控制算法C负载平衡算法D切换算法

单选题下面安全算法中,属于加密算法的是(1),属于报文摘要算法的是(2)。空白(2)处应选择()AMD5和3DESBMD5和SHA1CDES和SHA1DDES和3DES

单选题下面哪种算法不属于页式虚拟存储管理中的页面调度算法()A先进先出调度算法B最近最少用调度算法C优先数调度算法D最近最不常用调度算法

单选题如果是PHASE2手机,作小区重选时应用哪种算法计算()AC1BC2CC3