当前位置:看奇闻 > 科技探索 > 手机访问:m.zhongliu365.com
来源:www.zhongliu365.com时间:2017-12-13奇闻指数:编辑:刘杨手机版
代理停顿,进行一个随机的试验(试验一个随机选择的行动,并评估结果)。
基于上一步尝试的结果,选择一个ETT最优的行动,这一行动和第一步决定采取的行动(意图)不一定一样。
反复进行后,得到了一个意图和行动可能不一致的数据库。基于这个数据库,可以选择在任一时刻对当前意图而言最大化期望回报的行动。这一方法利用了意图这一有用的信息,Pearl将其称为意图特定优化(intent-specific optimization)。
意图特定优化提供了从试验中提取反事实信息的机制,从而提升了机器学习模型的表现。Pearl比较了代理直接按意图行动所得的结果和经过意图特定优化再行动的结果,表明意图特定优化提升了代理的表现。
IBM(国际商业机器公司)一直是电脑行业的龙头老大,几乎引领...
去看看>>猛犸象复活计划由日本的一个科研团队于2011年1月宣布,其内容...
去看看>>根域名服务器 同义词 根服务器一般指根域名服务器 根服务器主...
去看看>>除了不幸被忽悠装了伪宽带的以外,很多家庭的网络问题其实都...
去看看>>IPone X生于2017年11月3号,11月4号宣布死亡,享年36小时! 随着i...
去看看>>霍金 年轻时,曾在剑桥大学攻读博士学位,当初他所攻读的是宇...
去看看>>马云是本世纪最大的神话,虽然后悔创办阿里巴巴,但是还是让...
去看看>>2016年中国的共享经济市场规模接近4万亿元,增长率为76.4%。共享...
去看看>>