(抖音)眼下是一笔烂账。中国与美国对股权、运营权、源代码与数据分配都僵持不下。不过有一点大家都同意,就是 的算法很珍贵。特朗普跟中国都说 的算法会影响国家安全。
真的吗?熟悉机器学习的人不会相信 真的发展出什么独门密技,是硅谷无法破解或模仿的。
然而同时 的成就也摆在眼前。它是第一个从中国“反攻”美国的网络服务。不仅席卷美国,在印度、中东、东南亚都以奇迹般的速度崛起。 是过去 10 年第一个新的全球社交媒体,突破了由 、脸书、 等美国“上一代”社交媒体的控制。
媒体要打入陌生的文化圈非常困难。中国也不是强势文化输出国。如果 不是靠算法,那是靠什么?——靠整个产品设计围绕着算法。
Wei 曾在亚马逊、 与 Hulu 带领过产品团队。同时他也是电影导演,因此对于媒体常有独到见解。我之前介绍过他写的《地位即服务》( as a )架构。最近他写了两篇文章分析 的优势,分别是《 与分类帽》( and the Hat)与《像算法一样的看》( like an )。
他指出社交媒体最重要的资料叫兴趣图谱( graph)。也就是用户的喜好。知道用户喜欢看什么,平台才能推送适合的内容,以及适合的广告。
然而传统社交媒体都是通过间接的资料建立兴趣图谱:社交图谱( graph)。传统平台鼓励用户加好友、点赞、关注等,建立社交关系。接着平台再根据社交关系推论用户的兴趣:“你的朋友都喜欢这个,你可能也喜欢?”
这种做法至少有三个问题。
第一,不精确。例如你关注我的微博,可能想看我的科技评论。但我有时也会聊文学、游戏、生活,对他们来说就是噪声。
第二,无法规模化。可规模化是指量体增加仍维持同样的品质。可是在传统社交媒体上,当朋友与关注对象突破数百,甚至数千人时,动态就变得一团混乱。小学同学、同事、父母、应酬上只聊过一次的“朋友”、不认识的意见领袖等,全部的言论挤在一起。这是为什么好友多了以后看朋友圈让人疲惫,因为还是要花力气拨开迷雾。
另外,大杂烩也导致社会的对立。我解释过,传统社交媒体笃信自由主义,认为平台应该让多元想法激荡、竞争。现实却是人类无法处理这么多信息,反而倾向党同伐异,从共同的敌人来寻求归属感。
第三,不公平。先行者在传统社交媒体有优势。平台为了鼓励创作者积累粉丝,会优先导引流量给那些已经积累粉丝的人。这导致贫者益贫,富者益富。“新人”难以追上先行者,没有兴趣在平台上发表创作。
合在一起,最坏的结果是“脉络崩塌”( )。即用户觉得平台上的内容太乱、不有趣、充满对立与愤怒,于是一个一个的离开,启动递减的飞轮效应。
如果说传统社交平台是资本主义(有很多流量的人能“赚”到更多流量),那么 就是列宁主义,由“中央”决定流量的去向。 的核心是“推荐”墙,每个用户看到的推荐内容都由算法决定。
的算法几乎不考虑社交图谱,而是完全偏重用户的使用行为。只要你的视频能吸引一小批人驻足,算法就会推荐给其他可能感兴趣的人。这解决了前述的三个问题。
首先,算法分配更公平。 会根据用户的停留时间,用户是否点赞、浏览创作者首页、点击音乐来源或标签等行为来判断用户的兴趣。这让“新人”更有机会突围。
其次,可以规模化。每个人看到的推荐墙都不一样,也不会各种内容“挤”在一起。 Wei 将之比喻为《哈利波特》中的“分类帽”( hat),将学生分到格里芬多、斯莱特林等不同学院。用户在 上也“吵”不起来,因为不知道彼此看了什么内容。
第三,算法推荐更精确。 直接建立兴趣图谱,避开了社交图谱内含的噪声。而且显然这种方法在全球都适用。
创造了自给自足的数据循环( loop),用数据训练算法,用户就能看到真正有兴趣的内容。而越多用户使用 ,就有越多创作者博求关注。
然而,你会问,为何 的算法特别精确?算法本身不特别,关键在于获取大量的训练数据。可是没有社交关系作为诱因, 用什么吸引第一批用户?
很简单,用钱。
字节跳动并购 .ly,将之改名为 后,引入了字节跳动的招牌算法。同时字节跳动开始为 狂打广告,据说在 2018 年就花了 10 亿美金。
有了用户就有了数据。 最特别的就是其数据是自给自足的,完全来自 app 内。视频会自动循环播放,直到用户动作为止。换言之, 在逼用户表态:你喜欢这则视频吗?不喜欢?程度多少?这和的设计类似:“左滑没兴趣,右滑喜欢”。相较之下,传统社交媒体则采“无限卷动”( )机制,用户可以不断的往下滑。
用起来比较麻烦,因为用户要一直动作;然而却让算法能获取更清楚的信息,知道每个动作对应的视频。相反,传统社交媒体的算法很难判断用户是为了哪一则内容停留。
另一个例子是传统社交媒体中,用户很少主动点“没兴趣”。但 的设计已经内含了“没兴趣”的信号——只要你停留时间够短,就是表示没兴趣。
的算法也会判断视频中的内容,诸如物件、人物、性别、表情、视频长度、滤镜效果等。当然 也知道观众的喜好数据。
换言之, 最大的创新不是算法,而是整个产品围绕着算法的需求设计。这种“算法友善”(-)设计和一般的“用户友善”(user-)略为不同。就好像算法也化身为团队成员,在产品会议上发言:“产品需要这样设计,我才能拿到需要的数据。”
我们都知道互联网最重要的特性是网络效应,而 创造了“创意的网络效应”(the of )。创作者都知道,创意的核心是抄袭,咳咳,应该说致敬。 上有许多人翻拍同一首歌、跳同一首舞或是用同一个梗,就是一种致敬。 正是鼓励制作致敬与迷因(memes)的专家。
其次, 创造了一种互相连结、开放分享的文化。在算法之下,适者生存。创作者无法单纯依靠粉丝数量,必须时时观察流行趋势,察觉算法的偏好,并参与社群之中。而最快的方式就是合作、“致敬”。
中心的算法、数据的内循环、计划经济式的创作指导……看得出 为何是从中国崛起吗?
真正值钱的不是算法,而是整个产品设计概念。 指出了一条路,让算法居于核心,用设计来喂养算法。最终规模化地掌握每个人的个别兴趣,而且不需要经过“社交图谱”。
这个设计概念不只适用娱乐——字节跳动第一个“算法”作品是新闻 app“今日头条”。可以预计,未来任何需要算法的产业(例如电商、课程、交友等)都会出现采用“算法友善设计”的挑战者。
发表回复