Q函数Q（s，a）是指在一个给定状态s下，采取某一个动作a之后，_睦霖题库

单项选择题Q函数Q（s，a）是指在一个给定状态s下，采取某一个动作a之后，后续的各个状态所能得到的回报的（）。: A、期望值; B、最大值; C、最小值; D、总和

正确答案：A
答案解析：
关注下方微信公众号，在线模考后查看

热门试题