当前位置:看奇闻 > 科技探索 > 手机访问:m.zhongliu365.com

贝叶斯网络之父无人问津?一文详解Judea Pearl NIPS 2017报告(14)

来源:www.zhongliu365.com时间:2017-12-13奇闻指数:编辑:刘杨手机版

从表面上看,x'和y'地位是平等的,都代表实际发生的、可以直接从数据中观察到的事件。因此相对而言,似乎不需要我们重点关注。但实际上,x'和y'的情况是不一样的。x'代表的是行动,或者说选择,也就是说,实际选择了行动x',而不是x。这个选择,往往隐含着关于行动主体的一些信息。这些信息,有时和结果间存在因果关系。

比如,如果我们想分析参加某英语培训和英语成绩提升之间的关系,那么最简单直接的办法,就是统计参加培训的学生和没参加培训的学生的成绩提升(或下降)分值的平均值。从直觉上说,如果我们只统计十几个学生,那可能因为样本偏差而导致不准确的结果。反之,如果我们统计大量的学生,那样本偏差的影响就越小,结果也越精确。这就是所谓大数据的威力。

然而,如果我们从反事实的角度去看,那我们就会发现,上面统计方法可能存在再怎么增加样本也没法避免的偏差。参加培训的学生,事实上选择了参加培训,而不是不参加培训,这一选择本身就可能隐含了某些信息。比如,相比那些选择不参加培训的学生,这些学生可能学习英语的意愿更强,积极性更高。也就是说,即使这些学生当初选择不参加培训,英语成绩也会提升。

奇人奇事未解之谜世界之最奇异生物宇宙探索

本月排行

口就在黑洞内
  • 猛犸象,科研团队在象体发现完好的细胞,或将迎来猛犸象宝宝