- 1、本文档内容版权归属内容提供方,所产生的收益全部归内容提供方所有。如果您对本文有版权争议,可选择认领,认领后既往收益都归您。。
- 2、本文档由用户上传,本站不保证质量和数量令人满意,可能有诸多瑕疵,付费之前,请仔细先通过免费阅读内容等途径辨别内容交易风险。如存在严重挂羊头卖狗肉之情形,可联系本站下载客服投诉处理。
- 3、文档侵权举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
一、单选题
1.Q-learningQQ(s,a)
中的值表示()
A、在状态s下执行动作a的累积回报期望
B、仅状态s的价值
C、仅动作a的价值
D、与状态和动作无关的常数
答案:A
解析:Q值是动作价值函数,衡量在状态s选择动作a的长期价值,故选A。
2.以下关于UDP协议的描述,错误的是?
A、UDP是无连接的
B、UDP不保证数据的可靠传输
C、UDP的首部开销比TCP小
DUDP
、不支持广播和多播
答案:D
原创力文档


文档评论(0)