字节,正在复制字节
(点击上图,立即加入!每日30+资讯等你来!)
作者:杨婷婷
编辑:周哲浩
微信公众号:远川科技评论(ID: kechuangych)
围绕字节跳动的标签中,一直有“高速增长”这个关键词。从2012年推出“今日头条”开始,字节创造了一个又一个的增长神话:头条、抖音从巨头的缝隙中成长,一跃成为超级APP。TikTok更是突破了中国互联网公司进军海外的瓶颈,全球月活用户从2018年1月的5500万,2年时间猛增到7亿,最新数据已经突破10亿。
截至目前,字节形成了丰富的产品矩阵,包括头条、抖音、西瓜视频、懂车帝、飞书等。业务数量之多,增长速度之快,在互联网行业也是首屈一指。字节的增长方法论也是行业内讨论焦点,A/B测试的应用,数据驱动的产品理念引领风潮,但具体怎么做,依旧显得很神秘。
近期,字节跳动“新帅”梁汝波通过内部信正式宣告了字节的新一轮架构调整。其中,企业服务部门火山引擎走到了台前,正式成为字节六大核心业务板块中的一员。
火山引擎背后的技术团队是字节跳动的中台部门,承载着字节跳动飞速成长过程中积累的增长方法、技术工具和能力,逐渐揭开了字节跳动增长的秘密。
那么,问题来了:
1. 字节跳动的增长神话是如何炼成的?
2. 字节的数据中台独特之处是什么?
3. 字节的成功可以复制吗?
2021年春晚倒计时之际,央视宣布抖音成为春晚独家互动伙伴,将于除夕夜为全国人民发放12亿红包。这次活动产生了累计703亿次红包互动,春晚直播间累计观看人数12.21亿,抖音发拜年视频累计播放超506亿次,也再度将抖音及其背后的公司——字节跳动,推上了话题热榜。
为了在央视春晚顺利发出红包雨,字节跳动在内部经历了18场技术预演。相比于往年“前辈们”平均90天的筹备时间,字节仅仅只有27天的筹备周期。
电商大促和春晚红包活动可以称作是互联网公司的两次大考。春节红包活动更是一部记载互联网公司宕机事故的编年史。那为何字节跳动能在这么短的时间内,完成这个艰巨的任务?
字节跳动的副总裁杨震原在云产品发布会的演讲中提到,移动时代,敏捷是公司发展的核心竞争力。敏捷也不是盲目的敏捷,要基于业务做总体设计、合理分层。追求敏捷时,更要思考如何解决各种风险:稳定性、综合成本、性能、运维复杂度等。
字节跳动副总裁杨震原分享火山引擎技术理念
现在的字节跳动,每天都有20000次线上变更,每天新增1500个A/B 测试,可以说是敏捷的极致。敏捷的方法论很简单,两个关键点就是:容器化部署和微服务构建云。
容器,负责代码的部署、隔离和资源分配,可以理解为代码的“集装箱”;微服务则是把复杂的应用拆分成一个个小的服务单元,从而做到局部单元独立升级、替换,从而实现快速迭代。杨震原表示,字节跳动的在线微服务类型数量超过10万,容器实例部署的规模大概处于1000万的量级。
反映到组织结构上来说,字节过去使用的中台模式,就是把共性化的模块抽离出来,支撑前台的敏捷迭代。
在字节内部,有许许多多的中台:数据中台、开发中台、安全中台....但无论拆开多少个中台,都离不开一个最关键的数据中台:打通业务数据,让数据变成资产并服务于业务。
诺贝尔奖得主罗默的内生增长理论证明了数据资产的重要性:有形资产边际效益递减,无形资产边际效益递增。经济增长的动力来自于对人力资本、创新和知识的投资。那么数据,变成了企业增长的重要资产。
无论前台是什么业务,数据中台都可以根据数据实时反馈,帮助业务更好地进行用户增长、精准运营、商业化变现,提升产品的迭代质量。而这一切不仅需要具体的技术产品,也需要一套行之有效的实施方法。
数据中台的模式是对的,但路径却需要选择。
目前业内的数据中台建设有两个普遍路径。路径一是大而全,一开始就设计出宏大的实施计划,一般需要1-3年的基础建设;路径二是以业务价值为导向,以实际业务的痛点为突破口去实施数据中台建设。
第一种方式目标远大,但落地周期过长,可能无法应对外部环节的剧烈变化,也有投入大、周期长、看不到效果的问题。第二种方式,响应迅速,从小处着手,可以让数字化转型以滚雪球的方式滚动起来,但对数据中台的灵活性提出了较高的要求。
字节采取的模式是第二种,以战代练,让数据中台真正为业务所驱动。
以字节跳动最为有名的A/B测试为例。早在2012年,公司创业初期,字节跳动内部就开始了A/B测试,核心理念是通过科学、可量化的方法去协助产品决策。可以说,字节跳动从创业初期就贯彻了数据驱动。
一个广为人知的例子是西瓜视频的命名。西瓜视频最初的名字是“头条视频”。为了提升品牌辨识度,团队琢磨要起个更好的名字。很多公司在这个情况下,往往会基于员工的经验去选择新的名字。
字节跳动却在内部调研征集到西瓜视频、奇妙视频、筷子视频、阳光视频4个名字后,进行了A/B测试。通过改变应用商店里产品的名称和Logo,来验证哪一个名字会获得更高的点击率。最终,头条视频更名为了点击率最高的“西瓜视频”。
A/B测试往往能发挥意料之外的作用。今日头条的App曾有一个卸载时召回用户的页面。一般到这个卸载页面,召回用户的难度很大。但通过A/B测试,今日头条不断改进这个页面的颜色和排版,竟然提高了50%的召回率。
目前,单单是抖音这个产品,每年都会进行6-8万次的A/B测试。在字节跳动,每天都有1500个新增的A/B测试,服务着500多项业务。如果从字节跳动创业开始算起,字节已经累计做了80万次A/B测试。幕后在发挥作用的,正是字节在内部打磨的A/B测试平台Libra,这样的能力也已于今年4月通过火山引擎A/B测试开放给外部企业客户。
火山引擎的ByteHouse-极速OLAP引擎也是字节内部孵化的典型案例。在字节跳动的业务场景里,很多环节对数据数量和及时性有特别强的需求。比如说字节的数据分析师,每天都要处理海量的数据,来为业务策略的调整获取最及时有效的数据。
在过去,一篇图文内容,一个短视频的分析大概需要几分钟、十几分钟甚至更久——大大拖慢了数据分析的效率。ByteHouse孵化之后,便实现了三秒、两秒甚至几百毫秒的数据分析速度。
火山引擎数据产品ByteHouse的产品架构
字节数据中台的优势就在于,是字节技术能力的凝练。而这,正是外部企业所渴求的。
2017年,杨震原团队收到了一家手机厂商的订单需求。当时杨震原的技术团队主要任务是支持公司内部的今日头条、抖音等内部业务,并不对外服务,但该企业的需求对于他们来说并不难。
该手机厂商希望使用今日头条的推荐算法,来提高自身应用商店的商业转化率。推荐算法正是字节的强势能力,且各个产品线的推荐算法也是由统一的推荐平台支持的,最终帮助这家手机厂商应用商店的广告收入提高了一倍以上。
但,字节特色的数据中台,在向外复制的时候,能有普适性吗?
12月2日,火山引擎在"新云·共未来"发布会上正式对外发布:大数据研发治理套件(DataLeap)公有云版、ByteHouse云数仓版、湖仓一体分析服务及E-MapReduce服务等四款面向企业用户的数据产品,未来将通过敏捷迭代的产品,持续帮助企业构建数智引擎。
数字化增长的两个核心突破方向是数据驱动和敏捷开发。在今年早期,字节跳动首先开放了数据驱动的应用层,而现在数据驱动的开发层和治理层的能力也正式对外开放,这意味着字节跳动在成长过程中沉淀的企业增长方法论正在向外复制。
火山引擎数据产品能力全景图
2014年前后,互联网上“流量红利结束”、“进入互联网下半场”的言论甚嚣尘上。在流量紧缺的时代里,用户内增变成一项很重要的课题——如何珍惜获取的每一份流量。
在火山引擎数据中台的解决方案中,把2.0时代的精细化运营定义为“人与策略的精细化匹配”,意思是如何根据数据去制定每一个用户的最佳运营策略。
蓝河乳业作为一家发展迅速的年轻奶粉品牌,就面临着相似的问题。蓝河过去也有一些自己的数字化积累,有自己的会员管理体系,也早在2017年就建设了一个“妈妈有惊喜”的在线平台。在和抖音合作之后,蓝河与火山引擎达成了进一步的深度合作。
火山引擎将通过“客户数据平台CDP”和“智能数据洞察ABI”,联动“增长营销GMP”等产品,帮助蓝河乳业建立更完善的消费者服务体系,实现从基础建设到智能洞察再到精准营销的一站式、精细化的数据运营体系,绘制蓝河的消费者数字运营能力。
随着客户应用数据越来越深,也就提出了更多体系化治理数据、提升数据效率的需求。此次发布的四个新产品,正是基于解决客户建设数据中台的需求。这意味着不仅仅把数据用好,还要把数据管好。
得到作为知识服务型企业,在过去以开源技术为根基,自研平台的思路推进数据系统建设。但伴随着数据需求的复杂化,得到技术基建能力也面临新的挑战。
首先,以开源技术为主的技术架构,意味着要不断投入人力,才能保障最佳的实践和稳定性。其次,数据治理体系的不足,需要投入相当大的人力和时间成本才能建设完善。
对于这家成长期企业来说,自研技术体系意味着耗时耗力,并不是好选择。它最终选择了引入火山引擎来加速数字化转型。从第三方厂商中选择火山引擎,不仅仅是因为得到和字节早期的情况是类似的,也在于火山引擎能躬身入局。
火山引擎作为外脑真正地参与到数据治理的工作中,从旁观者、指导者变成了面临困难的人,才能切实地解决问题。
火山引擎的BP机制起到了至关重要的作用。数据BP,翻译成数据业务伙伴,本质上是将将具备数据专业能力的人才上升至业务线,在一线保障数据治理工作的有序落地。
在得到的数字化转型中,火山引擎的BP人员作为枢纽,协同业务方、产研中心、数据分析师相互交流、沟通。在一线解决业务线具体数据需求的同时,也保障数据治理工作的有序落地。
在今年5月,得到与火山引擎正式达成合作,确定了数据指标治理、业务数据治理、埋点数据治理、数据底座管理体系四大治理方向,引入DataLeap平台治理。在研发部分提供了数据集成、数据开发、业务智慧运维,妥善替代了开源架构,彻底释放了投入这部分的研发资源。
经过三个月的试运营,得到建立了完善的数据治理层面的方法论。粗略评估,得到整体的数据治理能力跃进了3年水平,在逐步趋向健康的数据底座上,具备了用数据切实的解决业务问题的先决条件。
火山引擎数据产品的优势在于,是字节多年数据驱动增长的实践,沉淀出了端到端数据技术全链路能力。
单个数据产品可以解决部分问题,但想要构建数据体系,还需要端到端的数据产品。在当今时代,数据的应用变得越来越复杂,每个环节都在产生数据,不同业务的人都要使用数据。那么如何通过体系化的数据工具、数据方法论,更好地管理数据,便成了企业的核心竞争力之一。
以业务价值为驱动的火山引擎数据中台,正是在实战中形成了数据应用、数据研发和数据治理三大闭环。字节跳动的经验,正在复制到越来越多的公司。
全球最大的云计算厂商不是微软,也不是谷歌,而是电商公司亚马逊。原因在于,每一次电商大促磨练出了亚马逊的云计算能力,而这个能力,帮助了千千万万有着共同需求的公司。
大公司的某项能力强悍到了一定程度,就会出现“业务外溢”,赋能更多的外部企业。这是从ToC 到ToB的自然演化之路。
本文转载自远川科技评论。
点“在看”为物联网产业加油!