从LinkedIn看大数据挖掘应重视的四个变量
根据以往的经验,你连接的人当中,已经做过这些事情,如果我告诉你他们做过这些事情的话,你会更加的可能也会做这些事情。 创事记:还有其他变量么? 李玥:这三大变量基本组成了我们看的最多的数据。当然每一个分类里面,又会有很多很多的数据。其实我们会花很多的精力去采集这些数据,然后不断地扩充我们的变量仓库。因为随着数据的增加,预测的准确度也会越来越高。 此外,时间序列也是非常重要的。很多时候你做的这件事情离现在有多久,会对你的预测产生很大影响。比如说,我在网站上看了一个投影仪相关的描述。如果你第二天就跟我说,我会给你50%的折扣,那我买下的可能性是很大的,因为我有很大的兴趣。如果一个月之后,您再来问我,我可能就没有很大的兴趣了。这只是一个方面,但在整个时间序列里面,多久之前发生这件事情很重要。 另外,在整个时间序列当中,行为的变化也很重要。比如说,我看这个投影仪的介绍,如果我以前是一个月看一次,但我最近变成一个礼拜看一次,或者说变成一天看一次,整个时间序列就能告诉你,我的关注点是不断增加的。所以时间序列里的这种模式也非常重要 (编辑:佛山站长网) 【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容! |