编者按:自大流行以来,我们见证了多媒体技术走向巅峰,RTC伴随着生活的方方面面,不可分割。一时间,多媒体圈空前热闹,资本涌入,人才争夺空前火爆,跳槽很多时候意味着薪资数倍增长。然而好景不长,2021年在线教育“团灭”,导致许多技术服务商现金流紧张。另一方面,RTC服务过分同质化,价格战不可避免。许多小公司无力支撑,或被收购,或被迫裁员转型退出战场,整个行业处在焦虑的煎熬中。剩者为王,也许真正的赢家属于巨头们。声网成为RTC PaaS的第一股,腾讯会议一家独大,钉钉收购了拍乐云强化中小企业生态,字节跳动依靠抖音等产品矩阵在海内外一路狂奔......然而,除此之外多媒体就没有出路了吗?LiveVideoStack采访了火山引擎RTC负责人宋慎义,他认为:“RTC的服务也许并不是现在这么单一,有许多需求并未被满足或做的足够好。”我们现在缺少的是耐心、勇气,以及一点点运气。
文 / 宋慎义
策划 / LiveVideoStack
1
LiveVideoStack:宋慎义你好,请简单的向LiveVideoStack的读者介绍下自己。
宋慎义:十几年前我毕业进入微软,开发数字电视系统,就这样机缘巧合的进入了音视频行业。后来做过几年互动直播,在2017年加入字节跳动,先后负责直播和RTC的工作,字节跳动今年正好成立10周年,我也有幸见证了字节跳动这几年的快速发展,也见证了互联网音视频快速发展的时代。希望能够在这个行业中一直深耕下去,为更多的用户提供极致的音视频体验。
2
LiveVideoStack:2017年LiveVIdeoStack组织第一次技术沙龙,你就在现场。当时你已经去字节跳动了吗?是怎样的机缘选择了字节跳动?
宋慎义:当时已经决定了去字节跳动,换工作的主要原因是互动直播这个场景比较单一,自己希望找到一个多场景、差异化的音视频团队去理解更多的场景,从而做出更好的音视频服务。
2016、2017年的时候很流行一种商业模式,使用短视频/文字个性化推荐吸引用户,然后使用直播进行变现。那时候今日头条已经是已经广受用户喜爱了,抖音、火山、西瓜视频处于高速发展期。我在使用中发现了字节跳动的两个优势,一个是个性化推荐做的最好,第二个是非常有耐心的做增长,而不是着急着直播变现。我判断字节跳动的几个产品能够有更好的增长,长期看也一定会在互动直播和社交方向投入,就加入了刚刚组建的字节跳动视频架构部。
3
LiveVideoStack:进入字节跳动这五年,对你最大的改变是什么?有哪些难忘的时刻?
宋慎义:最大的改变是认知的变化,我逐渐意识到,技术的发展,都要回归到技术应用的本源。以前做技术很崇尚高深的、底层的技术,随着自己接触到的场景越来越复杂、挑战越来越大,渐渐的发现,能够帮助更多的人、创造更大的价值的技术,才是好技术。
难忘的时刻有很多,能够提升用户体验、帮助客户解决问题的时刻,是最难忘的。
我记得有一个在线教育的客户,疫情期间用户量增长比较大,用户场景也变得更复杂。我们去现场亲自去当了几天老师和学生之后,发现实际用户场景,并不是单纯的做高深的算法和指标就有效果的。学校的外网带宽不足、有的老师在国外隔离、教室的音视频设备接了十几根线等等问题。为了解决这个客户的问题,做了多套解决方案,比如局域网自动切换P2P、私有云/边缘云下沉到局域网、实时设备检测、全球三层网络加速、动态/静态降级、根据评论自动诊断/降级等方案。不但解决了客户的问题,而且给我们服务更多的用户提供了思路。很多方案并不依赖特别高深的技术,而是坚持从用户场景出发,以解决用户问题为最终目标,我认为这才是一个技术人应有的技术态度。
4
LiveVideoStack:你怎么看技术、产品与商业的关系?在火山引擎是怎么处理这三者关系的?
宋慎义:这个问题让我想起了“技工贸”和“贸工技”这两种发展路线的对比,谈一下我的看法。
大多数情况下,商业是最底层的驱动力。广义的商业,不仅仅包括商业价值,也可以包括社会价值。产品和技术是否能够长期正向的发展,最终肯定要看能够创造多少价值。所以要先想社会需要什么、客户需要什么,然后想我们能够怎样帮到客户、客户愿意为我们的哪些能力或者服务付费,最后再想我们有什么、能做什么。反之,带着技术去找市场,风险会很大。
技术需要长期积淀,很多公司希望有一套技术方案或者几个技术大牛就能一招制胜,这过于乐观了。技术对一家公司的影响,往往需要很多年的时间才能够体现出来,大部分技术尝试会以失败告终,成本也很高。如果有商业或者产品来定义技术的价值,可以起到很好的牵引作用,技术尝试的成功率会高很多。不过单纯的技术驱动也有意义,技术可以产生革命性的创新,而技术的革新,在产品的同质化的时候有概率突破内卷。所以做技术,一方面要能够服务产品和市场,另一方面也要保持良好的创新氛围。
产品是一个很重要的桥梁,不但能够把多样化的商业价值拆解开,而且能够将我们的能力变成通用可复制的、有盈利能力的功能或者实物。不过产品与技术、产品与商业化的界限也不是那么清晰,比如技术服务属于产品还是技术,不同的公司有不同的分配,定价策略属于产品还是商业化,也比较模糊。
这几个环节很难说哪个更重要,就像“技工贸”和“贸工技”两种发展路线的争论很难有答案一样。最重要的是了解自己的产品和行业处于什么状态,自己清楚要在哪个环节更多投入。
火山引擎的商业目标很明确:一个是互联网业务增长,另一个是传统企业数字化转型。火山引擎所有的产品,都是围绕这个商业目标来做的。而得益于字节跳动在这两方面的技术积累,也让火山引擎在增长和数字化转型这两个目标有很强的竞争力。
大家看到火山引擎在最近一两年上架了很多新产品,其实每个产品都是在内部业务或者外部客户的场景中抽象总结出来的,在上架之前做好充分的商业化论证,想好它的商业价值、盈利模式、产品形态、技术积累。在我看来还是非常实用主义,客户需要什么,我们就会尽量满足。
5
LiveVideoStack:火山引擎内部支持到对外提供服务,你们有哪些天然的优势?又有哪些必须解决的挑战?
宋慎义:如果你去问互联网公司,现在最大的痛点是什么,得到的答案大概率是“业务增长”。在字节跳动这么多优秀产品的发展历程中,“用户增长”、“商业增长”有经过验证的方法,这里面不仅包括“用户体验”、“数据驱动”、“生态建设”的方法论,也包括支撑字节跳动高速发展的技术底座。火山引擎能把支撑互联网公司的增长理念、技术优势做成产品,满足企业的商业增长需求。
挑战也很多:
火山引擎在行业中属于后来者,行业中很多产品还是偏同质化的,友商们也一直在迭代和创新,需要火山引擎更快的追赶。也需要一些创新的产品形态,创新一定会伴随着不确定性,而“拥抱不确定性”是字节跳动一贯以来的工作方式。云计算行业财务导向比较强,大家喜欢推广高流水、高毛利的产品,而对客户的核心诉求(比如用户增长、收入增长、数字化提效)需要更多思考,这同时也是火山引擎的一个机会。6
LiveVideoStack:2022年,火山引擎的主要动作是什么?目标客户/市场在哪里?
宋慎义:火山引擎的使命是开放字节跳动最好的技术实践,帮助每家企业去构建属于他们的数字化增长引擎。
产品矩阵比较多,我主要说一下视频云,国内外视频云厂商,大家普遍是根据市场上的产品形态做个类似的,做出来都一个样,而火山引擎会从需求侧探索一下,客户需要什么样的视频云?
在字节跳动的实践中,视频是一种新的生产力,好的视频体验是能够显著促进增长的生产工具。火山引擎会更加清晰地衡量体验、做面向体验的视频云,从播放体验、互动体验、画质体验、性能体验等不同的维度来综合评估视频体验。并且能够将体验映射到获客、留客等增长模型,通过体验的优化来量化甚至预估业务增长收益。
音视频能力大家都有,但是哪些能力能够促进增长,哪些能力对增长的量化收益是什么,这是火山引擎的核心竞争力。甚至不同的场景优化手段和策略也不一样,很多公司会忽略这一点,但这些是字节跳动过去几年的宝贵经验,火山引擎将它们做成优化策略类的产品,帮助客户应用适合自己的策略。
主要的客户包括:期望业务增长的互联网客户,传统企业数字化转型。
互联网音视频是过去几年的主要战场,未来一定会有新的信息传递模式的产生,给我们带来新的机会。
传统行业的视频场景可能会成为视频云市场的关键。比如广电行业纷纷成立新媒体平台、大街小巷中的视频大屏也越来越多、电商零售行业也从过去的图文化发展到视频化、互动化。这些场景已经不太像互联网的流量生意,而是更贴近实际的商业属性。互联网的视频需求,主要关注体验和增长,而传统行业的需求,需要智能的创作工具、灵活的视频管理能力,另外传统行业的音视频研发能力相对比较弱,所以更需要行业属性的全栈音视频方案。
7
LiveVideoStack:RTC发展了6-7年了,技术还有进一步突破的空间吗?在线教育“团灭”,下一个RTC的主要应用场景在哪里?
宋慎义:RTC发展了不止6-7年,从IP电话、视频会议算起来,有将近30年了,技术依然在持续发展,目前看有几个难题还没有得到很好的解决:
1、RTC正处于一个很有趣的状态,每个方案都希望互联互通,但是大家又无法互联互通。
a.包大小是最显而易见的,这个不展开讲了。
b.系统的封闭,抬高使用门槛,无法创造出更丰富的应用,对开发者和创作者不够友好。
c.设备、网络环境的多样性限制了应用的推广。
d.各厂商在自己的框架内做私有方案,从业人员的技术交流不自由,不充分。
2、RTC由于多了“实时性”这个限制,在清晰度、流畅性上是需要持续突破,才能够追赶直播、点播的体验效果。
3、主流的开源/商业RTC系统还无法承载高清富媒体,云端渲染、点云、XR、体积视频等场景的实时化还无法大规模应用。
从以上几个角度看,突破的空间很大,同时突破的难度也比较大,需要从业者有更多的耐心。
RTC通道化、标准化、简单化、互联互通是大势所趋,同时也要把性能做上去,这样开发者才能够专心的做好应用,技术和应用才能更加繁荣。
关于在线教育,只是从之前的野蛮生长回归到正常状态,对于RTC而言是往好的方向发展,我们更清楚的了解真实的用户需求。世界各国都在努力用科技去提升教育的效率和质量,也都在试图用科技去优化儿童、成人、老人的教育,各行各业也都有行业特色的教育形式,不能只把目光关注在被资本催化的虚假繁荣,而忽视这些真实需求。
行业机会很多,比如我们有一个客户,是做机械设计的,现在也开始结合VR和RTC技术去学习和工作。
我发现一个现象,人们对实时互动和协作的需求是不断增长的,大家按理说应该信心满满,但是现在国内的RTC从业人员普遍有一些焦虑。这种焦虑的一个主要原因是RTC SDK产品的同质化,大家误以为RTC就只能是这个样子,另外疫情的消退和在线教育的退潮也加剧了这种焦虑。
目前以“集成SDK”作为产品服务的形态,在中国实践的挺好,造就了很多优秀的企业和产品,但是放眼全球、考虑行业发展的趋势,也许会产生其他的产品服务形态,比如更上层的APaaS组件、更底层的原子能力、更加定制化的应用。不好说哪个会成为未来的主流,但是国外的产品和技术具备更丰富的多样性,这种发展形态才是良性的。
多样性很重要,一个行业的繁荣,需要百家争鸣,需要多样化,而不是同质化产品。继续做ToB的友商们都可以尝试一下,也许RTC SDK并不是RTC产品的终局形态,也许面向不同产业、不同场景需要不同的RTC产品。
火山引擎RTC也会在APaaS能力、底层原子能力、产业应用等方面做更多的探索,因为需求是存在的,目前的产品和技术又无法很好的满足需求,这就是机会,没必要焦虑。
从技术能力上,现在的RTC方案还无法让开发者随心所欲的使用,比如经常遇到并发能力、清晰度、实时性、富媒体能力的限制,也需要长期补足。火山引擎RTC在超千人开麦、超高清音视频、多链路传输、XR互动方面也持续进行技术攻关,这个周期会比较长,相信会带来更好的体验,也给开发者提供更好的工具。
▼扫描下图二维码或点击阅读原文▼
了解音视频大会更多详情