在强化学习过程中,()表示随机地采取某个动作,以便于尝试各种结果;()表示采取当前认为最优的动作,以便于进一步优化评估当前认为最优的动作的值。A、探索;开发B、开发;探索C、探索;输出D、开发;输出
在强化学习过程中,()表示随机地采取某个动作,以便于尝试各种结果;()表示采取当前认为最优的动作,以便于进一步优化评估当前认为最优的动作的值。
- A、探索;开发
- B、开发;探索
- C、探索;输出
- D、开发;输出
相关考题:
关于探索“互联网+”教育的供给方式,下列说法正确的是()A、A鼓励基于互联网平台开发数字教育资源B鼓励学校探索网络化教育新模式C探索教育公共服务提供新方式D推广在线开放课程学习新模式B、A鼓励基于互联网平台开发数字教育资源B鼓励学校探索网络化教育新模式C探索教育公共服务提供新方式D推广在线开放课程学习新模式C、A鼓励基于互联网平台开发数字教育资源B鼓励学校探索网络化教育新模式C探索教育公共服务提供新方式D推广在线开放课程学习新模式D、A鼓励基于互联网平台开发数字教育资源B鼓励学校探索网络化教育新模式C探索教育公共服务提供新方式D推广在线开放课程学习新模式
单选题在强化学习过程中,()表示随机地采取某个动作,以便于尝试各种结果;()表示采取当前认为最优的动作,以便于进一步优化评估当前认为最优的动作的值。A探索;开发B开发;探索C探索;输出D开发;输出
多选题关于探索“互联网+”教育的供给方式,下列说法正确的是()AA鼓励基于互联网平台开发数字教育资源B鼓励学校探索网络化教育新模式C探索教育公共服务提供新方式D推广在线开放课程学习新模式BA鼓励基于互联网平台开发数字教育资源B鼓励学校探索网络化教育新模式C探索教育公共服务提供新方式D推广在线开放课程学习新模式CA鼓励基于互联网平台开发数字教育资源B鼓励学校探索网络化教育新模式C探索教育公共服务提供新方式D推广在线开放课程学习新模式DA鼓励基于互联网平台开发数字教育资源B鼓励学校探索网络化教育新模式C探索教育公共服务提供新方式D推广在线开放课程学习新模式
单选题强化学习中,()主要探索未知的动作会产生的效果,有利于更新Q值,获得更好的策略。A探索B开发C输入D输出