为什么刚准备考研,淘宝就给我推荐防脱洗发水?
10月12日
你在网上搜索过的最奇怪的一个问题是什么呢?
作者 | 文小宁
你在网上搜索过的最奇怪的一个问题是什么呢?
学堂君曾经搜过很多奇奇怪怪的问题,比如:
“从第一个人类诞生到此时此刻,这个世界上曾经总共有多少个人存在过?”
“将死之人在他/她生命的最后一刻会想些什么呢?”
“地球上是不是隐藏着外星间谍?”
“人类最早的记忆是从几岁开始?如何证明那是真实的记忆而不是虚构呢?”……
你也搜索过这些问题吗?
你是不是也曾经搜索过这样奇奇怪怪的问题呢?
英国一家网络技术公司通过谷歌的自动搜索引擎和关键词分析,提取出了一长串网友们曾经搜索过的滑稽词条,其中不乏“我怀孕了吗?”,“外星人是真的吗?”,“为什么男人也有乳头呢?”,“世界是方的还是圆的?”,“男人能怀孕吗?”……这样的“傻”问题。
纽约时报经济板块的专栏作家Stephens Davidowitz,曾经在谷歌做过数据分析的工作,在他看来,在这些听起来有趣的问题背后,其实隐藏着更为深层的思想活动,这些想法甚至可能是阴暗的。
“在信息时代到来之前,人们总是试图将自己羞于见人的想法隐藏于心。
而在如今的信息化时代,尽管人们仍然不会在他人面前表露这些想法,但却会在谷歌和AV网站上肆意暴露自己的真实想法,这或许是因为后者会给人一种匿身的安全感。”其实你早就暴露了好吗?!
“通过大数据分析,我们可以透彻地看到人们真正想要的和真正想做的事情,而不是他们口头上表达的所想所做”,Davidowitz直言不讳[1]。
举个栗子,比如:人们可能会在民意测验中声明自己并不存在种族歧视,民意测验的数据结果也表明,相比20世纪50年代,人们对于跨种族婚姻、女性权益、同性婚姻这些焦点问题的态度正在逐年变得更加开放和包容,而不似之前那样保守。
但事实真的是这样吗?那些宣称众生平等的人们,真的不存在偏见和歧视吗?
大数据分析 | 找寻背后的真相
谷歌意向分析程序的运行结果给这群人狠狠打响了脸。
运行结果表明,在2008年的美国总统选举中,奥巴马之所以在民主党集中区所获得的选票要比预期更少,是因为在这样的地区仍然存在着内隐的种族歧视。
比如,Davidowitz通过数据分析发现,有20%的用户在使用谷歌搜索“黑鬼”这一词条的时候,都会在后面紧跟着“段子(joke)”这个搜索词。
而在奥巴马的第一个大选之夜,搜索词中含有“奥巴马”这一搜索词的词条,有百分之一包括了“3k党”或“黑鬼”这样的词。不要觉得百分之一这个比例小,要想想3亿美国人,每人至少搜一次“奥巴马”的话,也有三百万次搜索行为是带有明显歧视意味的。
“值得一提的是,在美国的某些州,搜索‘黑鬼总统’的频率甚至比搜索‘第一位黑人总统’的频率还要高”,Davidowitz如是说道。
并且,令人意外的是,这种冒犯性搜索行为的频发地区并不是南部的共和党集中区(按理来说共和党应该更保守,而民主党更开放自由),而是北部的纽约州,西部的宾夕法尼亚州,东部的俄亥俄州,密歇根州和伊利诺斯州这些民主党居多的地区(要知道奥巴马可是民主党派人士啊喂!自家人窝内斗的吗?粉到深处自然黑?)。
这种民意测验和个人真实想法的差异,解释了为什么在种族歧视搜索行为频发的地区,奥巴马获得的选票会比预期更低,也解释了为什么特朗普会令吃瓜群众们大跌眼镜,在最后的总统选举中击败希拉里取得胜利。
大数据=被监听监控?
看到这里,你是不是又产生了另一种担忧:这种意向分析的操作,是不是意味着我们上网的一举一动都会被监视、分析呢?为什么我刚浏览过备考教材,淘宝就给我推荐了某王防脱洗发水呢?是不是真像之前网上疯传的淘宝会偷偷监听我和室友的对话,甚至会提取我手机相册里的每一张图片呢?
其实,并没有所谓的监听监控,淘宝京东百度腾讯也不会一键提取你手机里所有的照片和小视频(这些操作对他们来说也是很烧钱烧人力的)。
但是,你在各大app页面的搜索痕迹、浏览痕迹的确都会被搜索引擎采集记录下来,再通过一系列复杂的算法提取出你的用户属性以及倾向,其中就包括了你的个人属性(如年龄、性别、职业等)以及你的意图倾向(主要为商业意图,比如你可能会想要购买的物品)[2]。
而在互联网这一波操作有一个专有名词:用户行为分析系统(OCI)。OCI通过分析用户的历史浏览记录和搜索记录可以很好地分析出一个完整人物的性格、爱好倾向甚至是作息规律等方面的属性。
接着,OCI会从这些属性中挖掘出一个完整人格下的潜在消费意向,并且向用户推荐他/她所感兴趣的、可能需要的产品[3]。
比如,如果你每天都在淘宝搜索“肉松小贝”“抹茶毛巾蛋糕卷”“芝士火鸡面”“牛轧奶芙”这类肥宅御用美食,就不要怪淘宝首页给你推送“130斤的胖MM穿了也显瘦的秋季美衣”了……
不知从何时起,大数据这个词语被越来越多的人挂在嘴边。但对于大数据到底是做什么的,或许有很多人仍像学堂君这样一知半解。
正如马云在卸任演讲中说那样:“很多人还没搞清什么是PC互联网,移动互联网已经来了,我们还没搞清楚移动互联的时候,大数据时代又来了。”
大数据时代已经来临,你察觉到了吗?又对此有哪些准备和看法呢?欢迎留言讨论呀⊙ω⊙
图片来源:图虫创意
参考文献
[1] https://www.scientificamerican.com/article/web-searches-reveal-in-aggregate-what-were-really-thinking/
[2] 徐晓峰. (2013). 大规模用户在线行为数据分析. (Doctoral dissertation, 上海交通大学).
[3] Dai, H., Zhao, L., Nie, Z., Wen, J. R., Wang, L., & Li, Y. (2006). Detecting online commercial intention (OCI). International Conference on World Wide Web (pp.829-837). ACM.