单选题强化学习的框架是智能体()通过观察当前状态作出相应动作。ASBACAgentDEnvironment
单选题
强化学习的框架是智能体()通过观察当前状态作出相应动作。
A
S
B
A
C
Agent
D
Environment
参考解析
解析:
暂无解析
相关考题:
在强化学习过程中,()表示随机地采取某个动作,以便于尝试各种结果;()表示采取当前认为最优的动作,以便于进一步优化评估当前认为最优的动作的值。A、探索;开发B、开发;探索C、探索;输出D、开发;输出
Dreamweaver MX2004的“文件”菜单命令中,菜单项“保存框架页”表示的是()。A、保存所有框架页B、保存当前框架页C、保存当前窗口的所有文档D、将当前文档恢复到上次保存时的状态
在学习过程中,学习者本人并没有受到直接的外在强化,但通过观察他人某种行为收到强化.从而在自己身上也产生了类似的强化效果,心理学家班杜拉将这种现象称为()。A、内在强化B、负强化C、替代强化D、无意强化
单选题在强化学习过程中,()表示随机地采取某个动作,以便于尝试各种结果;()表示采取当前认为最优的动作,以便于进一步优化评估当前认为最优的动作的值。A探索;开发B开发;探索C探索;输出D开发;输出
多选题在强化学习中,主体和环境之间交互的要素有()。A状态B动作C回报D强化