世人基本都认为我们已经进入了大数据时代,而且普遍认为大数据时代的到来,对于我国经济发展是绝对的利好,其主要支撑理由就是我们获取大数据更容易、更直接、更全面,……,如:微信支付、摩拜单车、视频采集、监控录像等等,换句话说,就是我们个人服从集体、集体服从国家、国家服从中央的整体概念,让我们的大数据系统建立起来可以做到畅通无阻。我们在大数据采集方面的优势能够确保我们在大数据应用、管理、决策等方面的优势吗?
最近我们看到不少关于《今日头条》的新闻,一方面是《今日头条》创始人张一鸣宣布永远关闭《内涵段子》,一方面是有关部门下发指令,“为依法规范传播秩序,各互联网应用商店暂停今日头条、凤凰新闻、网易新闻和天天快报四款移动应用程序的下载服务”。 暂停“今日头条”下载服务3周。技术男张一鸣创办的《今日头条》没有编辑团队,不对内容进行人工干预,全靠算法学习进行个性化的机器推荐,也不进行内容的生产加工,只做内容分发渠道。
《今日头条》核心竞争力和优势就在基于大数据采集与AI算法进行个性化推荐,它不仅是一个新闻客户端,还是信息分发平台。但是,在大数据完整采集的基础上,就是为了流量为了广告为了利益,投其所好进一步推送相关信息,有目标客户喜欢游戏,就拼命推送各种游戏;有喜欢情色内容,就不断分发不同形式的情色信息;有喜欢夜郎自大的,就灌输中国政治经济一统天下的概念;……,让客户个体认为自己的见识就是永远正确的。用完整的大数据基础去固化各种偏离客观实际的偏见。
这个月初(4月1日)中国建筑卫生陶瓷协会在相关行业高峰论坛上披露了2017年我国瓷砖行业的产业数据,2017年全国瓷砖产量101.46亿平方米,同比增长-1.15%。此前十来天中国陶瓷工业协会发布的全国1410家规模以上陶瓷墙地砖企业产量完成108.18亿平米,比上年增长6.52%,这两个数据显然不一致。更有甚者,相关数据披露2017年福建省瓷砖产量14.40亿平方米,产量居全国第二(广东第一,27.03亿平方米)。这个数据明显不连贯,2016年全国瓷砖产量福建省第一,产量23.74亿平方米(广东省第二,23.53亿平方米)。诚然,我也注意到2017年我国瓷砖产业数据引用了民间的“全国瓷砖产能调查数据”,也许福建产区的数据与产能调查数据有关。
但是这种有关是什么样的相关,我们无法获悉。这让我想起2017年我国不少地方(辽宁、内蒙、天津等地)的GDP数据,与往年的不连贯,也就不觉得十分奇怪了,我们的统计部门又不独立,偶尔也要看领导的眼色、思维来进行统计。时而不连贯不靠谱也就在所难免,不管如何,原始数据总不能成为任人打扮的小姑娘。
大数据时代已经来临,我们仅有大数据采集的优势,并不能代表我们在大数据方面有优势。如果我们的基础数据都不靠谱,只能导致谬误,比无知距离真理更远。如果我们的大数据仅仅是去追逐更大的利益,而不是真理,那也将导致“明月照沟渠”的结果。
大数据时代,基础数据的真实、透明以及大数据应用的价值观这两方面没有很好解决,我们在大数据方面就没有任何优势可言。