0分数字人直播挑战上海高考英语作文“翻车”了

2022年11月25日 by 没有评论

后脚AI数字人就又双叒叕要去开直播挑战了。然鹅……专家现场给出的分数,简直令人大跌眼镜——0分!!!

直播间的弹幕瞬间“炸”了,画风是这样的:好奇的友友们就要问了,之前高考语文作文都能hold住的AI数字人,为啥英语作文就搞不定呢?

因为写作过程中若是出现插画,就会被认为做了标记,固然得分为0。那言归正传,AI数字人写出来的英语作文内容本身,结果又如何呢?

已经达到了普通高中毕业生英语写作优秀水平。不仅如此,这个AI数字人是在10秒钟时间完成了40篇!

基于此,甚至北京外国语大学教授王馥芳都提了更高的期望——希望去挑战一下专八。

上个月因为挑战高考语文全国卷的作文还上过热搜,引来不少网友的围观。接下来,让我们一起看看度晓晓在这次挑战中的具体表现如何。

学校要举办一个走进历史的活动,有三种活动的方式:第一种是制作短视频;第二种是拜访老战士;第三种是历史舞台剧。

梅德明教授对题目点评道,一定要紧扣“走进历史”的主题,以及形式上是一封信,在字数方面也要控制在150字左右。

度晓晓在短暂的思考之后,便拿出了40篇中的一篇做了展示:不难看出,从作文内容结构上是较为完整的,并且像“Most importantly”、“Moreover”等词汇的应用,也让逻辑变得非常清晰。

并且梅教授还强调,如此点评,不是因为作文是出自数字人之手,而是把它看做是正常考生的答卷来看待的。

因为在上个月挑战题为《本手、妙手、俗手》语文高考作文时,她便已经展露出锋芒。

当时度晓晓平均1秒钟所生成的作文,让北京语文专家打出48分(满分60),并被点评为:

作文紧扣主题、立意明确,结构完整、语言流畅,而且还善于引经据典、使用修辞手法。

度晓晓背后的这一套“功夫”,正是得益于百度文心大模型的能力。文心大模型一个非常突出的标签和特点,便是“知识增强”。

简单来说,它是一个能从大规模知识和海量数据中进行融合学习的大模型,并且具备效率高、效果好,以及通用性强等特点。

若是把文心大模型扒开来看,可以明显看到它可以分为三大类,分别是“基础通用大模型”、“任务大模型”和“行业大模型”。

首先是文心最新推出的ERNIE 3.0 Zeus这个千亿级的大模型。它是一个任务知识增强的大模型,除了可以对无标注数据和知识图谱的学习之外,还可以通过持续学习,对百余种不同形式的任务数据学习。

在原理方面,ERNIE 3.0 Zeus在学习过程中主要使用的统一范式的多任务学习。

这种方法便可以轻松对数据中不同粒度的语义信息进行建模。除此之外,ERNIE 3.0 Zeus层次化提示(Prompt)学习技术,通过层次化的Text Prompt库将百余种不同的任务统一组织成自然语言的形式,和海量无监督文本以及百度知识图谱联合学习。

而且还引入了层次化的Soft Prompt,如此一来便可以对不同任务之间的共性与特性进行建模。

也正是基于这样的能力,度晓晓便可以先去精准地理解英语作文的题目,然后根据体裁要求,构思和组织材料,完成英语作文的输出。

据了解,ERNIE-M构建了大小为25万的多语言词表,约1.5万亿字符。它的学习过程可以大致分为两个阶段:

第一阶段:从少量的双语语料中学习跨语言理解能力,使模型学到初步的语言对齐关系;

第二阶段:使用回译的思想,通过大量的单语语料学习,增强模型的跨语言理解能力。

这也就是度晓晓能够在完成英语作文的同时,还可以用韩语和法语等多个语言去写作的原因了。

那么在看完度晓晓挑战上海高考英语作文和其背后的能力之后,还有一个问题值得探讨:

首先,在内容生产的方式上,像度晓晓这种数字人的能力加持之下,正在向一种新的趋势发展——AIGC。

这是继UGC(用户生产内容)、PGC(专业生产内容)和OGC(职业生产内容)等内容生产方式之后的“新生代”。

至于这种内容生产方式背后所具备有的意义和价值,从百度研究院在今年年初所发布的科技趋势预测中便可窥见一二:

2022年AIGC借助大模型的跨模态综合技术能力,可以激发创意,提升内容多样性,降作成本,将实现大规模应用。

而早在度晓晓上个月挑战完语文作文之际,便有媒体感慨道:“AIGC元年已至”。

但除此之外,随着数字人背后的能力逐步披露,其所具备的更深层意义和价值也在渐渐浮现。

服务型数字人是百度的优势所在,产品类型丰富,从最早的企业服务场景已经延伸到营销、办公等领域。

这句看似“数字人已落地”的背后,更是在揭示其背后文心大模型的大规模落地。

王海峰当时认为,正因深度学习具备通用性,以及深度学习平台在不断发展,所以它们正在推动AI步入一种新的模式。

到了2020年,“企业版平台”被纳入到了飞桨的全景图之中,并且还发布了预训练模型的开发模式。

而在去年,百度集团副总裁吴甜则是提出企业AI应用三阶段:AI先行者探路、AI工作坊应用、AI工业大生产。

并且针对每一个阶段分别阐述了企业将面临的困难和挑战,以及相应的解决方案。

这一切的目标显然正是百度希望能够让大模型更快、更高效地在产业中铺开来用。

值得一提的是,此前百度“前无古人”地提出的行业大模型,并不是否定其它大模型厂商的分类模式。

这更像是站在传统大模型的基础上,为了让它更好地能被产业用起来,而提出的一种新范式。

而像度晓晓近来两次挑战高考语文和英语作文,可以说只是一种展现大模型已经能够很好地被用起来的一隅。

据了解,文心大模型目前已经在诸如保险、银行、农业、生物医药、工业、搜索,甚至是智能音箱等领域和场景中实现落地应用,在提高垂直业务效率的道路上不断探索前行。

那么接下来,在大模型逐渐与实际场景深入交织融合之下,还会产生怎样的效果,值得拭目以待了。

Leave a Comment

您的电子邮箱地址不会被公开。 必填项已用*标注