随着通信技术和移动互联网的快速发展,大众获取知识的方式也发生了巨大变化。近几年,在市场发展、技术进步、政策利好、资本注入等因素的共同推进下,中国在线教育市场愈发活跃。据前瞻产业研究院发布的《中国在线教育行业市场前瞻与投资战略规划分析报告》统计数据显示,截止至2018年底中国在线教育市场规模增长突破3000亿元。预测2019年中国在线教育市场规模将超3600亿元,达到3670亿元。
在这样的行业背景之下,在线教育平台如何在竞争中脱颖而出,立于不败之地呢?阿里云视频云产品专家王利军认为:“技术是业务发展的基石,平台应该精耕细作,不断汲取外部优秀的技术力量,利用稳定经济的云计算应对资源、网络、性能、功耗、成本等各方面的挑战,将精力回归到提升用户体验与创新应用本身,用实实在在的好体验来回馈用户,才是维系平台口碑的有效途径。”
那么究竟该如何利用云计算能力提升指标与用户体验呢?下文整理自王利军在2019云栖大会中的演讲《视频云驱动在线教育创新应用》,详细阐述了阿里云视频云面向在线教育场景的产品服务、解决方案、技术能力和场景实践。
阿里云视频云R系产品家族
阿里云以IaaS层的ECS、ENS、MEC为基础底座,网络层的SD-RTC为传输通道,搭建了音视频通信(RTC)和低延时直播(RTS)两款PaaS层产品,用于解决在线教育授课直播中的实时性互动和低延迟等业务诉求。
音视频通信(Real-TimeCommunication, RTC)是阿里云覆盖全球的实时音视频开发平台,依托业界领先的核心网络传输算法、音视频编解码技术、信道传输、弱网对抗算法、网络调度技术构建优质的通信体验,同时具备多重终端准入验证、频道会话多重鉴权、信令与媒体传输层加密保护等多项数据安全保障技术,让用户快速搭建多端实时应用,适用于互动娱乐、在线教育、视频会议等场景。
超低延时直播(Real-Time Streaming, RTS) 是在阿里云视频直播(ApsaraVideoLive)的基础上,进行全链路延时监控、传输协议改造等底层技术优化,支持千万级并发场景下的毫秒级延迟直播能力,保障低延时、低卡顿、高清流畅的极致直播观看体验。
视频云技术驱动在线教育体验升级
一、SCC编码智能分配码率,提升清晰度
在线教育业务场景中,视频是最重要的资源,但是不管现在的网络多好,由于终端用户分布广泛与网络的复杂性,通常情况下,平台会消耗大量的带宽来在视频清晰度与直播流畅度中间取得平衡,这是平台的第一个关键痛点。阿里云视频云利用黑科技SCC编码,面向内容纹理进行编解码,让码率分配在人眼更敏锐的区域,这使得平台在同等带宽下,终端观看的清晰度更好;在主观用户体验不变的情况下,平均降低15%卡顿率。综合平均结果,SCC编码可以帮助平台节省40%码率。
在今年增长非常迅速的编程在线课堂场景中,由于屏幕共享的是代码,经常会出现色块、文字纹理不清,注释不清晰,淡色字体消失等情况,使用面向内容纹理的SCC编码后,再同等码率之下,字母的边缘更清楚,全部代码清晰可见,观看体验大幅度提升。
二、音频3A算法,智能降噪
互联网应用中音频降噪面临的场景会更复杂,传统的降噪是单模做法,对平稳噪声,如空调声、风扇声、环境白噪声等消除效果较好,但是对于非稳态的噪声(如:汽车声、街边声)消除效果不佳,这会导致整体的听感很差,授课效果大打折扣。
RTC智能降噪可以根据用户的场景不同而进行模型迭代,除了能够消除平稳噪声,也能针对嘈杂声,汽车声,街边声等非稳噪声进行增强消除,抑制能力比传统模式多20db以上。如下图中间标红区域中所示,在实际办公场景录制中有个人打了喷嚏,也可以被较完美的消除。
RTC智能降噪经过5年音频数据沉淀,上亿次通话验证,已经建立了持续学习的云端特征库,具备海量历史数据回归验证与模型训练,可以精准识别场景,从而进行稳定、多场景的噪声消除。
三、自研ARWNT弱网传输算法
由于在线教育场景中终端学生侧的网络情况参差不齐、十分复杂,通常在线教育类直播会面临弱网情况下提升视频传输效果的需求。FEC冗余让贫瘠的弱网传输雪上加霜,而超时与大量重传还会加重网络拥塞,传输效果难以达成预期。阿里云RTC自研ARWNT弱网传输算法,基于场景识别进行拥塞模型和链路模型的策略选择,能够实现音频抗丢包率70%,视频抗丢包率30%,在同等的丢包环境下,弱网传输效率提升65%。
四、流式RTS,支撑千万并发下的毫秒级延时
常见的直播场景包括1对N广播式直播和N对N互动式直播,其中1对N广播式直播大部分采用RTMP、HLS或FLV协议,虽然具备集成方便、兼容性较好、支持大规模并发等优点,但延时最低只有3-6秒;而N对N互动直播一般采用WebRTC/RTC协议,延时可以控制在800毫秒之内,但是无法支持大规模并发直播。
阿里云超低延时直播服务RTS 1.0在原有视频直播服务基础上,进行全链路延时监控与优化,从采集编码、上行推流、CDN分发、下行拉流、解码渲染等多环节针对性优化,基于阿里云遍布全球的2800多个CDN节点资源、智能调度系统以及网络拥塞、抗弱网优化、缓冲策略等进行一系列底层核心技术,打磨出真正支持稳定、流畅、千万高并发场景的毫秒级超低延时直播解决方案。目前,全新升级的RTS 2.0将使用流式传输实现更低的延时,进一步提升用户观看体验。
视频云在线教育场景最佳实践
基于以上的产品技术,阿里云RTC、RTS产品针对在线教育场景积累了丰富的实践经验,比如成本与体验怎样平衡、如何选择合适的延时方案、分辨率与码率怎样合理选择、AI如何在课程中应用等。
一、成本与体验的平衡
通常在线教育模式中,1V1体验最佳,但是老师成本居高不下,互动大班课成本低,但是互动性和学生参与感不够。而位于中间的小班课又受限于名师资源有限。是否有一种方法把互动大班和小班放在一起,用技术手段来解决成本和教学体验平衡的问题呢?
RTC的做法是频道规格升级,大方能力全面开放,利用灵活的发布订阅模型,任意组建虚拟频道,非对等网络延时控制在250-300毫秒之间,名师给几百人上课,助教在每个教室里进行辅导互动,解决名师资源不够和学生互动体验的问题。
二、选择合适的延时方案
1V1、小班课、互动大班课、超大班课、直播网课,随着参与学生数的增加,直播互动性会逐渐下降,对延时的要求也会降低。阿里云视频云提供音视频通信RTC、超低延时直播RTS和视频直播三种产品,分别适用于可实时沟通、可互动、可广播等业务场景需求,便于平台选择最合适、最经济、最高效的延时方案。
三、码率与分辨率的合理选择
在线教育场景中,用户终端的类型包括电视、台式机、笔记本电脑、平板电脑、手机等等,当屏幕小的终端接入的时候,平台时常会遇到分辨率过大,小设备功耗和性能与高分辨率相矛盾的问题。阿里云视频云按照实际终端的设备和网络属性下发对等的视频流,实现一次编码,大小屏无缝对接,根据设备和带宽,匹配最佳的视频传输策略。
四、AI课程应用实践
在线教育场景中,视频云AI技术已经融入前中后各个阶段。在授课前期的课程编排、视频融合环节融入AI,节省传统专业人员工作周期,为平台降本提效;在授课中期,智能编码、智能降噪、AI双语字幕等技术可以解决平台和用户痛点,提升用户体验;在授课后期,针对课程效果进行AI分析,为后续课堂提供数据依据,同时将直播课程智能剪辑成精彩片段,帮助学生强化记忆、高效温习。
未来,随着5G的到来、AI技术的发展,AI教师、实时学生表情识别、智能助教等应用将更加广泛普及,这需要更加实时、稳定流畅的网络作为通信基础。智能、稳定、开放、经济的云计算服务将始终作为承载众多垂直应用场景变革的技术基础,为生态带来全新的商业成功机遇。王利军表示:“阿里云将从底层算法、终端接入、智能调度、云边协同、网络传输、视频转码等多维度全面构建视频云PaaS服务平台,做好大视频领域稳固的技术基石。同时,我们也会联合在线教育领域垂直合作伙伴,探索更多垂直应用的落地。”