For investors
股价:
5.36 美元 %For investors
股价:
5.36 美元 %认真做教育 专心促就业
第二种错误叫幸存者误差,就是说,选择的样本里有过高或者过低数据,那得出的结论就会有问题。打个简单的比方,一个屋子里如果坐着姚明,那屋子里人的平均身高肯定就会偏高嘛。美国的一所大学曾经有个报告,说他们学校地理系的毕业生平均年收入水平最高,这就很让人费解了,因为地理系不是这个学校的热门专业,也不是社会上的高薪职业,怎么会出现这样的结果呢?原来啊,这是因为,NBA超级球星乔丹就是这家学校地理系毕业的,他一个人就拉高了整个学校的平均水平。所以,为了避免出现这种幸存者误差,有时候做统计往往要去掉一个最高分,去掉一个最低分,再把平均下来的分数作为最终得分。
第三种错误叫回忆误差。什么意思呢?就是说,你选择的数据样本,会受到大脑回忆的影响,从而产生误差。这个误差的形成完全是心理作用,我们都愿意将现状理解为过去发生的必然结果,就是喜欢把现状和过去用因果关系对应上,尤其是对一些特别糟或者特别好的情况。比如说,哈佛大学曾经做了一个心理实验,找来一组患有乳腺癌的女性,还有一组健康的女性,让她们共同回忆自己早年的饮食习惯。结果发现,那些患病的女性回忆过去的时候,觉得自己摄入的脂肪含量比实际上要高很大一截,但健康女性那组就没出现这种情况。这就是回忆误差。如果你根据这个研究得出结论:患乳腺癌的妇女在年轻的时候摄入了太多的脂肪。那就太荒谬了。
大数据处理信息服务商金盛网聚认为,大数据样本的选取要求我们使用正确的采集和对待数据的方式。只有做到正确抓取和利用数据,我们才能通过数据样本提供的各种线索,接触到事物的本质和真相,进而为我所用。大数据的基础在于,以事实为依据,以客观为追求,尽量避免“取悦”式的结论发表。因为“片面强调”有悖于大数据发展的初衷,没有普世价值的结论无法为受众提供核心价值。
更多山东编程培训相关资讯,请扫描下方二维码