试题详情
单项选择题在ε-greedy策略当中,ε的值越大,表示采用随机的一个动作的概率越(),采用当前Q函数值最大的动作的概率越()。

A、大;小

B、大;大

C、小;小

D、小;大

  • A
  • 关注下方微信公众号,在线模考后查看

热门试题