加入收藏 | 设为首页 | 会员中心 | 我要投稿 佛山站长网 (https://www.0757zz.com/)- 科技、建站、经验、云计算、5G、大数据,站长网!
当前位置: 首页 > 运营中心 > 建站资源 > 经验 > 正文

从卖家角度细说淘宝的降权判定系统

发布时间:2013-07-24 14:09:19 所属栏目:经验 来源:站长网
导读:接触很多朋友都说做淘宝很苦逼,其实哪个行业不苦逼?当然本人也很苦逼中。很多没做过互联网的同学或者以前学校学的不是有关IT互联网的同学,投入电商创业大军,总是会遇到

3丶点击比率,这个大家也懂,重要是点击数据被收入了特征索引库。

4丶ALEXA数据,这里用流量精灵刷流量的人大概深有体会。

5丶来源统计,我们在量子统计里面就能看到这些信息

6丶唯一参数,这个需要调用很多参数,例如大家知道的MAC,硬盘序列号,浏览器版本,系统UI等。有一些唯一参数在WEB上很难做到获取,不是技术实现部了,因为这样太危险了,HTTP的协议权限要求太高,会造成整个PC数据暴露在外,就是有些朋友说的浏览个淘宝网页就能把我的系统安装时间,浏览器版本号什么读取出来?其实不是,是调用了系统的数据,如前面的CTU,知道关联什么了吧?

7丶点击时间时间顺差,打开一个页面,二次点击是否为瞬间?因为每个页面都由印象转变为关注,再转变成点击行动,当你打开一个前端页面,一定时间参数内立即关闭,也可以判断为无效点击。没错,淘宝就是根据这个特征识别是否为机器人或者故意点击的。至于菜鸟卖家,怎么检验?这个我们可以才量子记录浏览深度和直通车过滤里面检验数据。也就是大家互刷为什么要深度浏览这样了。这个大家都做淘宝大家都懂。

8丶鼠标值,显示屏幕上的每个点都具有一个坐标值,当你在某个点按下鼠标时,都会有一个坐标值,当采用机器人点击时,为同一个鼠标值,可以只记一次点击。每次点击都会产生鼠标的KEYUP 和KEYDOWN的行为,如果未能捕获到这个值,可能是模拟数据提交。又有菜鸟卖家会问?啥?机器人点淘宝,不会吧??为避免误解,科普一下,我们把系统或者软件也可以比喻成机器人。例如大家知道的刷信誉软件。

再跟大家补充一下这个系统我们运营过程遇到的各种触发条件(何为触发条件?就是你做了什么动作为条件,系统会检验什么信息):磁盘底层信息(实名认证和安装数字证书和安装支付宝安全控件读取调用,能够读取的我们知道的有旺旺客户端,支付宝安全控件,数字证书等),网卡mac,浏览器和系统UI(https数据传输调用,通俗地说就是我们打来淘宝界面就调用了进行比对了,就是我们知道的浏览器COOKIE,这个技术在WEB已经运用的很成熟了,大家无需多疑,呵呵)。

特征索引数据库:收集到的信息进行整理丶分类丶索引以产生索引库。按照一定方式有序编排起来,以供检索的数据库。我们可以叫做此系统是不断收集和更新数据的学习型病毒积累系统,里面包含了大量数据,经过大量订单交易订单步骤轨迹数据的收集,分析比对,集合信息,就像我们日常配货一样先把货集合好,建立多个特征信息库。就是我们经常听到的数据纬度,里面有多少纬度就是商业机密,然后交给下面说的检索系统调用此数据库的数据纬度。我们每生成一个订单,就会生成各种数据进入这个系统供检索和分析。

数据检索系统data retrieva:从索引数据库或存储中查找和选取所需数据的过程。淘宝有千千万万个订单,每一个订单号都需要经过这个系统分析比对,其中调用了哪些数据我们估计在运营或者炒作过程中也得出了一些经验,没错,罪魁祸首就是他读取了你能想到的一些信息,我在这里举几个例子开发模型,大家可以举一反三:

1丶淘宝静默转化数据纬度比对

旺旺在线聊天:如系统设定无聊天为w ,手机旺旺为WW,旺信为WWW,网页旺旺为WWWW 检索系统则调用特征索引数据库数据分析交易数据的其中一个纬度比对:

例女装类目交易订单中此纬度正常百分比【特征索引数据库数据】:

WW>15%

www>0.15%

wwww>2%

淘宝商品ID123456  交易订单1丶2丶3丶4丶5-100个订单【我们知道销量数100个订单中】ww<15% 纬度异常,判定降权。反之亦然。   

2丶购买旺旺信誉度纬度比对

设置购买旺旺信誉度0=w 1心=ww 2心=www…………如此类推

纬度判定指标为

订单中此纬度正常百分比【特征索引数据库数据】:

w<60%

ww<40%

www<30

淘宝商品ID123456  交易订单1丶2丶3丶4丶5-100个订单【我们知道销量数100个订单中】ww>60% 纬度异常,判定降权。反之亦然。

以上纬度为虚拟数据,别对号入座,是为举例说明,大家经过各种降权苦逼后应该都知道很多纬度,这个我们可以后期在探讨再分享。

每个数据比对后都会进入最终判定,大家都应该知道的是,如单一纬度异常,就是判定疑似虚假交易,可申诉,申诉后进入人工判定(淘宝为了节省人力,你不申诉就不人工了,默认系统判定)。如果系统检测多个纬度异常,就是虚假交易,哈哈,还是为了节省人力资源,自动关闭申诉接口。就是大家听到客服说的不允许申诉了。如果你恶意申诉,后果严重哦。

如果你看不懂上面的,这里通俗地说我们知道的后台计算流程,用通俗语言大概可以这样理解:

判断点击过滤(pmcots) > 判断交易(ctu) > 检索订单数据(数据检索) > 结果判定

再说几个日常比较典型的,支付宝账户关联,支付宝系统在安全方面银行交易系统利用SSH框架做的https+数字证书,这个之记录硬件和加密数据传输,不存在账户关联,至少系统不会去检测,(进入人工判定不知道)。比如说刷单返款,用其他支付宝返款之类的云云,无非也是自我安慰而已。

再说一下物流单号,淘宝其实有两个物流公司接口,一个是客户端物流显示系统,就是我们看到的前端物流信息,如果进入人工判定,还有一个是物流公司开放给淘宝的一个内部API接口,此物流信息和物流网点的内部系统显示的物流信息一致,比客户端的更及时,更详细。这个系统虽然把物流系统作了一个纬度判定,但是因为在技术上的原因,并不能以匹配物流指标的字符串是否相符合为系统自检测判定指标,因为访问量大,需要匹配的字符串太多,数据运算压力大。但是重复的物流单号和时间匹配是有存在的,淘宝今年更新了前端拦截技术,把重复使用过的物流单号拦截在前端提示,可是由于数据库的更新和传输延迟,有一定比例的拦截失败,到了物流判定,一般是人工检测是否恶意使用虚假单号了。

关于申诉,订单申诉的都是随机抽取(可能其中只有一个订单进入了判定异常),大家不要纠结为什么是这5个。

以下给大家分析一些降权案例:

1丶为什么很多人说刷一个新单品,很快就降权了,而同样方式刷的一个热卖单品,却不会降权。

(编辑:佛山站长网)

【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容!

热点阅读