对此,褒者不一,贬者亦众。
有趣的是:莫论褒贬,都喜欢拿今日头条的算法阅读作比。
希望本文,能够跳出人和算法的争论,带给你一些不同的见解。
一、什么是“好看”?
在微信公众号发表的文章,右下角原本是一个大拇指形状的“点赞”图标,只有一个计数功能。
新版微信将其改为星星形状(这个形状的历史渊源应该是浏览器书签的Favorite喜爱或收藏)的“好看”图标。而且,更为重要的,它的功能从计数(count)变成了投票(vote),这个投票会让你的好友在“看一看”里面看到这篇文章的可能性提高。
二、微信“好看”想干什么?
其实微信“好看”和今日头条都在试图解决同样一个问题,就是在信息爆炸的互联网时代,如何让受众或者读者更有效的接触到他希望阅读的信息,而摒弃掉他不希望阅读的信息。
我们把这个问题叫做“信息筛”问题(the information seive problem),即如何设计和构建一个效率最高的信息筛子,满足几亿甚至十几亿读者众口难调的要求。
那么微信和今日头条则分别是两个武林派别的最高代表。前者可称之为“碳基筛”,后者则称之为“硅基筛”。
我在命名上开了一个小玩笑。
所谓“碳基筛”就是指依靠人脑去筛选信息,因为人主要是碳水化合物构成的‘而所谓“硅基筛”则是指依靠电脑去筛选信息,因为计算机主要的核心计算部件是硅、锗等半导体材料。
粗略地讲,碳基筛派经过三代发展:
第一代是靠权威编辑,编啥你看啥,这叫门户;
第二代是靠大V,大V你要仰望,说啥你听啥,这叫微博;
第三代就是靠朋友圈,朋友读啥分享给你,你就读啥,这是微信。
到了微信这一代,还有个名字,叫做社交化阅读。
而硅基派迄今则经过了两代发展:
第一代是靠关键词检索,你得明确告诉电脑你想看啥,这叫搜索引擎。
第二代就是电脑会试探你,先推一批文章看看你的反应,然后慢慢揣摩你的脾气和喜好,不断调整策略,逐渐让你欲罢不能,这就是今日头条这一代所搞的。
还有个名字,叫做个性化推荐。
三、什么是算法?
个性化推荐背后的工作机制就是所谓的机器学习算法,更迎合大众的讲法叫做AI人工智能算法。
其实原理非常简单,就是一个复杂的数学函数。
函数大家都学过吧?函数里面有一大堆的变量和参数。
那么变量呢?就是每篇文章都能提取出来一些数值放进去。
而参数呢?则是根据你的情况个性化定制的哟。
知道了变量和参数,函数就能算出一个判断结果,这篇文章你喜不喜欢。
有了这个函数就简单了:把所有文章都算一遍,就知道你最喜欢的是哪些了,优先把这些推荐给你;如果你表现出了不喜欢,比如看都没看一眼,或者匆匆看了一眼就关掉了,那么算法会默默地看在眼里,然后偷偷地调整函数里面的参数,争取下一次能够选的更合你的心意哦。
四、算法霸权主义
个推算法(个性化推荐算法)也常常为大家诟病。
比如导致过度沉迷啦(所谓巴甫洛夫的狗效应),让人越来越只能读到自己的狭窄偏好之内的文章啦(所谓坐井观天效应)。
但是最严重的问题是,算法是由一个中心主体所控制的。读者在算法面前,其实地位相当于一条被投喂的狗。
而那个控制投喂算法的,则是所有人的上帝。
而且,这个上帝,并非慈悲为怀的,而是以挣钱为目的的。
算法在拟合读者的喜好,读者也在出卖自己的灵魂。读者在用自己的偏好训练算法,算法也在用自己的推荐驯化读者。所有个推算法的终极优化目标只有一个,就是读者大脑中多巴胺的分泌量。
最终,上帝控制算法,而算法控制了所有人。
五、失控、涌现和自组织
微信之父张小龙和头条之父张一鸣信奉截然不同的哲学。
张小龙应该蛮喜欢凯文凯利的那本书《失控》。在他的哲学里,上帝应该仅仅制定优雅而极简的规则,然后放任系统失控,自然演化,就像鱼群或者鸟群那样。
在极简规则约束下的众多行为体自由行动,复杂系统进入混沌状态,涌现出(emerge)宏观秩序,产生自组织的繁复形态,令人叹为观止。
当然在整个哲学中,张小龙义不容辞要担纲上帝的角色,并持续关注系统演化,适时出手调整规则、实施干预。
六、社交推荐比算法推荐更好吗?
朋友推荐的假设是,你所在圈层的信息来源、阅读口味都比较相似。
进一步的,只有对于人类这种社会化程度如此之高的动物,这种方式才是合意的。
同样的,这种方法会造成一堆堆井底之蛙的现象。圈层和圈层之间的割裂明显,人与人之间的信息鸿沟和认知鸿沟反而加大。
七、推荐系统的dilemma
推荐系统的结果有两个效果指标:一个叫做中意度(affinity),一个叫做提升度(lift)。
中意度指的是:推荐结果整体而言符合喜好的程度有多少,也就是整体打开率的情况。
而提升度指的则是:进行个性化推荐相比于不作个性化推荐,文章的打开率提高的程度。
这两个指标往往是矛盾的。
如果只追求前者,那么就要尽可能给所有人推送最热门的文章——但这样一来,提升度就会降低,因为热文本来就是符合大多数人口味的。
而如果要提高提升度,就要选一些本来比较冷门的文章。但是比较容易引起个别人好奇心的,进行个推,这样打开率肯定就会有比较高的提高,但是极端情况下就会放弃掉极高打开率的热文。
无论是碳基筛还是硅基筛,所有的信息筛都存在这个两难处境(Dilemma)。
八、隐私问题
社交推荐还有一个问题就是隐私问题。
因为为了背书效果,你的阅读口味和偏好也许会被透露给你的朋友。
九、把算法的控制权交还给每一个人
我们应该建立一种把算法控制权完全交还给每一个人的、去中心化的、新型的推荐系统。
这一系统由一种称之为AI智能体(AI Smart Agent)的虚拟代理组成,每个人都可以从系统中租用一个智能体。
该智能体可以运行算法,依据主人的阅读口味,以及通过与主人的朋友们的智能体互相交流所得知的主人朋友的阅读口味,从文章数据库中筛选并推荐。
与中心化的算法系统不同,AI智能体的控制权完全在主人手中;这一控制权的完全度与比特币私钥对于比特币的控制权一样完全。
尤为重要的是:AI智能体是“自足的”(self-sufficient)。
也就是说:智能体存在一个生存博弈,主人需要考虑这一博弈,并选择如何延续智能体的生命。比如:给予它燃料代币,或者允许它推送一些合意的广告以赚取广告费,以便使得智能体能够持续提供服务。
是的,智能体们通过去中心化的区块链网络进行协同,相互交换意见,支付代币给予提供计算资源支撑它们运行的“矿工们”,并从主人或者广告商那里挣到代币收入。
这里没有上帝之手。
读者是智能体的主人,并对智能体有完全的控制权;读者可以充分发挥自己的理性,让智能体按照自己的要求运行。
智能体在经济上“自足”运营,并通过互相交流将算法推荐和社交推荐有效结合起来,且有效保护了主人们的隐私权利。
AI智能体通过区块链而组成网络,这是下一代信息筛技术。
这,也是阅读的未来。