学习理财博客空间

理财鱼

您现在的位置是:理财鱼 > 原创专题 >

原创专题

作业帮多项技术亮相QCon全球软件开发大会

发布时间:2021-07-29 11:40原创专题 评论

近日,QCon全球软件开发大会在北京国际会议中心举行,150余位演讲嘉宾现场分享最新技术创新和实践,为大家带来一场浩瀚的技术之旅。受大会邀请,作业帮中台产研中心蒋宏飞博士、流媒体客户端负责人曾建斌出席大会,分别分享了作业帮在线教育技术的创新实践。

NLP技术促进在线教育业务提效的实践和创新

在“人工智能驱动业务实践”专场,作业帮中台产研中心蒋宏飞博士分享了NLP(Natural Language Processing)技术在在线教育服务中的实践和创新。

作业帮多项技术亮相QCon全球软件开发大会


作业帮蒋宏飞博士在QCon人工智能驱动业务实践专场分享

01 数字化的终极追求是因材施教

“DT(Data technology)的本质就是可以批量化生产个性化的产品和服务。”对于这句互联网“名言”,蒋宏飞解释说,这里面的两个关键词就是批量化和个性化,原本它们是矛盾的,批量化意味着强调效率,而个性化意味着强调体验,这是个“两难”的问题。如果能逐步达到“数字化”,那么这个矛盾就可以得到不同程度的化解。

在企业数字化中,“用户数字化”是非常核心的内容。蒋宏飞说,用户数字化的终极追求莫不过人们耳熟能详的这些词:用户画像、用户分层、用户运营、千人千面等。在教育场景下,指的就是个性化教学、个性化学习规划、个性化题目推荐等。

蒋宏飞表示,在线教育服务模式下,人的服务占很大比重,人与人的沟通占服务的很大比重。这是目前在线教育服务的主要特点。

02 在线教育服务中的“数字化挑战”

在线教育服务场景下,主要用户数据类型可分为四类。第一类:打点行为类数据,属于最常见的结构化数据;第二类:评价类数据,这些数据有结构化,也有非结构化的;第三类:问卷类数据,开放式主观反馈的部分,属于非结构化文本数据;第四类:服务沟通类数据,用户上课时与主讲/辅导老师以及其他同学的弹幕互动、同辅导老师以及客服的沟通等,都是非结构化文本数据。

蒋宏飞表示,非结构化文本数据属于在线教育核心业务环节产生的数据,量大且内容丰富。这些数据的结构化处理对“数字化”意义重大,在技术上也最具挑战性。

“非结构化数据的结构化,是全面数字化的最后一道障碍。”蒋宏飞说,传统数字化建设一般要经过数据采集、数据治理、数据挖掘、数据分析、智能应用等步骤。而在线上教育这种重“沟通服务”的场景里,文本结构化变成不可或缺的重要一环,介于数据治理和数据挖掘之间。要做好文本数据的结构化,打通这个“数字化”的关键环节,就需要用NLP技术。

03 作业帮的FTP应用和实践

蒋宏飞表示,NLP在工业界落地的两种主流技术方案粗粗划分可大致分为词式、语义式。FTP(Fast Text Processing)平台(编者注:此处借用了计算机领域的一个术语,实际上两者没有任何关系)对应的是后者。

为什么要做这个平台?蒋宏飞说,远景目标是赋能公司业务运营数字化、精细化、智能化。具体考虑三点:一是业务的需求越来越多,越来越复杂,时间要求越来越高;二是沉淀下来的数据和模型,希望能不断复用;三是算法方面不能一直写临时训练脚本,需要有个平台积累起来,让算法能力有个持续建设成长的承载。

他说,FTP里面涉及到的技术点非常丰富,应用场景也极为多样,包括从个性化服务支撑、用户专题研究、用户反馈深度挖掘再到质量保障辅助等等。作业帮在FTP中融合了很多结合业务场景的经验和微创新,也陆续产出了一些专利。

以质量保障辅助为例。作业帮用户群广泛,不少用户来自偏远地区,用户端的网络质量、手机质量等情况千差万别,事先很难测得全面,因此,FTP也会支持质量保障部做一些监测方面的数据打标辅助,能够帮助质量保障部及时发现问题,从而支持研发人员尽快调整优化,保障使用不同机型的学生都能有流畅的听课体验。

WebRTC在作业帮的实践应用

在“音视频体验提升实践”专场,作业帮流媒体客户端负责人曾建斌着重分享了作业帮自研的ZRTC技术的应用发展情况。

作业帮多项技术亮相QCon全球软件开发大会


作业帮曾建斌在QCon音视频体验提升专场分享

曾建斌首先介绍了作业帮2015年以来使用WebRTC技术的历程。从最开始使用voice engine模块实现一对一语音通话、使用apm模块消除噪音,到基于licode实现了推流源站和转推功能,再到实现多人视频语音功能等,WebRTC技术使用伴随着公司业务发展日益深入。到了2020年,作业帮开始自研ZRTC并且实现全面落地,90%以上实时通信流量都使用了ZRTC。

“为什么我们要重新设计一套RTC服务呢?”曾建斌说,在几年使用WebRTC过程中,发现了一些不适合在线教育行业应用之处,比如代码结构层次太多、版本接口经常变来变去、对移动设备兼容不佳、建立连接的过程长等等。“教育行业课程系统最大的特点是必须要稳定,稳定必须放在第一位,此外还要能快速响应突发情况,对低端设备兼容性好,SDK接口要灵活,多种接入方式能兼顾接通率和成本等。然而,面对教育行业对系统近乎苛刻的稳定性要求,却没有银弹可以解决所有的问题。

他介绍,作业帮自研的实时通信服务ZRTC,结合教育场景的要求,实现了对WebRTC的架构优化、网络优化、音视频优化和机型适配优化。以音视频优化为例,改进音频传输策略、主讲录音采用双声道模式、引用AI技术噪音消除等七大项。经过ZRTC优化,实现了四方面效果。第一,与使用第三方RTC服务相比,可以大幅降低成本。第二,从后台打点监控来看,卡顿率比第三方RTC低。第三,音视频质量要好于第三方RTC服务。第四,排查解决问题的速度更快。

曾建斌透露,未来还将对ZRTC技术进行持续优化,实现更好的使用体验。

QCon是由InfoQ中国主办的综合性技术盛会,每年在伦敦、北京、纽约、圣保罗、上海、旧金山召开。自2007年3月份开始举办以来,已经有超万名有多年从业经验的技术人员参加过QCon大会。QCon内容源于实践并面向社区,演讲嘉宾依据热点话题,面向5年以上工作经验的技术团队负责人、机构师、工程总监、开发人员分享技术创新和实践

>相关《作业帮多项技术亮相QCon全球软件开发大会》内容:


1、 以数字技术赋能绿色发展 天味食品斩获“2021中国上市公司口碑榜”两项大奖

理财鱼小提示:以数字技术赋能绿色发展 天味食品斩获“2021中国上市公司口碑榜”两项大奖 12月20日,由每日经济新闻主办的2021第十届中国上市公司高峰论坛周拉开序幕,论坛周以“科技创新 绿色发展”为主题。12月24日,由每日经济新闻主办的2021中国上市公司品牌...【继续阅读】


2、 神舟十三号乘组两名航天员已成功出舱 实施舱外作业将成为空间站阶段飞行任务工作常态

理财鱼小提示:神舟十三号乘组两名航天员已成功出舱 实施舱外作业将成为空间站阶段飞行任务工作常态 据中国载人航天工程办公室消息,北京时间2021年12月26日18时44分,神舟十三号航天员叶光富成功打开天和核心舱节点舱舱门,航天员叶光富于18时50分、航天员翟志...【继续阅读】


3、 A股明日风口:2022年将加快推进技术装备攻关 重点推动氢能等重点领域

炒股就看金麒麟分析师研报,权威,专业,及时,全面,助您挖掘潜力主题机会! 12月26日消息,行业利好密集出台,有8大板块有望成为A股明日风口。 1、国家能源局:2022年将加快推进技术装备攻关 重点推动氢能等重点领域 国家能源局党组书记、局长章建华发布...【继续阅读】