300229 拓尔思
202208-25
虚拟人,拓尔思在元宇宙迈出坚实一步
发布时间:2022 -08-25
分享至:
分享

虚拟数字人是进入“元宇宙”的入口和重要载体,并已成为数字经济发展的“新动能”,为Z时代新消费市场,以及产业数字化转型构筑了巨大的想象空间和应用前景。拓尔思在虚拟人领域开辟出全新赛道,凭借业界领先的语义智能技术体系和丰富的行业项目落地经验,让虚拟人具备知识储备、语义理解、推理分析、自主决策和交互表达的智能驱动能力,使其不仅“更好看”而且“更有用”。未来,拓尔思也将通过不断探索,让大家在虚拟的世界感受到更多的便利与真实。

 

01

2021年被视为元宇宙元年,很多现象级的元宇宙方面的技术创新和场景应用开始火爆出圈,虚拟数字人便是其中的一个。虚拟数字人(又称虚拟人)拥有人类的外貌特征、行为能力、甚至思维能力以及自己独特的性格,在追求高度沉浸感的元宇宙世界里,无论从感官上还是交互层面,都可以给人们带来更真实的体验,因此被视为未来人们进入“元宇宙”的入口和重要载体。

 

分析其火爆成因,从供给端来看,以CG、渲染为主的动画技术在影视、游戏等行业已广泛普及,资本渴望通过追求新赛道,以新集成应用方式创造更多价值;从需求端来看,消费领域的流量经济和产业领域的人口红利都在面临增长瓶颈,对生产效率与成本提出了更多要求,虚拟人的高度拟人化代替真人角色进入生产生活各个领域,将成为数字经济发展的“新动能”,为Z时代新消费市场,以及产业数字化转型构筑巨大的想象空间和应用前景。

 

艾媒咨询数据显示,2021年中国虚拟人带动产业市场规模和核心市场规模,分别为1074.9亿元和62.2亿元,预计2025年分别达到6402.7亿元和480.6亿元,会呈现强劲的增长态势。根据《虚拟数字人深度产业报告》预测,在2030年,我国虚拟数字人整体市场规模将达到2700亿(见图1)。目前市场仍处于前期培育阶段,未来市场发展空间巨大。

 

1

 

从技术生成角度来看,虚拟人一般包括人物形象、语音生成、动画生成、音视频显示、交互等5个模块构成(见图2),前四个模块是我们常说的“好看的皮囊”,交互模块则是“有趣的灵魂”。与之相对应的技术有:人物模型、建模技术、动作捕捉技术、语音合成技术(TTS)、CG、渲染技术、AI(自然语言处理、自动语音识别、知识图谱等)。

2

 

其中,市面上目前最多见的身份型虚拟人,主要依赖于“皮囊”技术和优秀的制作组创作,用于沉浸式内容方面的创意创作及营销场景的探索(少部分也依赖动作捕捉技术,做真人换脸后的虚拟直播场景);而另外一种则是由算法驱动完成各种多模态交互的服务型虚拟人,主要被企业应用于替代真人的可标准化、模块化工作岗位,以达到降本增效的目的。后者技术的关键是语义智能,也正是拓尔思技术聚焦的方向(见图3)。

3

02

 

拓尔思是国内最早从事语义智能技术研究及商业化应用的厂商。公司有着以大数据、深度学习、行业知识图谱为核心的完整的语义智能技术体系和丰富的行业项目落地经验。基于大数据和自然语言处理的知识图谱的构建,可以让虚拟人具备知识储备、语义理解、推理分析、自主决策和交互表达的智能驱动能力,让虚拟人华丽的“形象”具备知识服务的“灵魂”表达,从“更好看”变得“更有用”。

 

更具体来说,是通过技术赋予虚拟人两大能力,一个是创造力,一个是思考的能力。虚拟人的创作力,体现在AI技术自动生成内容(AIGC)上,拓尔思的AI写作有几种形式,比如不改变新闻传递核心价值,由机器人自动生成新闻简讯或者摘要的创作,也有引入知识图谱后,基于固定模板化的自动创作模式,深度学习还可以通过复述改写技术和学习稿件评分标准,对创作内容进行润色,增强稿件的可读性。虚拟人的思考能力,体现在虚拟人能听得明白、有知识、懂检索、会输出四个方面,技术的核心是知识图谱能力。

 

知识图谱是表示客观世界实体和实体关系的知识库,以图模型的形式进行呈现。例如,我们可以把入住酒店这么一个事件(见图4),通过“实体-属性-关系”进行字段之间的关联,并完成有效存储,等待后续数据要素的再利用。拓尔思利用自身的知识图谱构建系统架构(见图5),完成了对原始数据的知识加工、知识发现、知识共享全过程管理。强大的知识图谱平台可以轻松支撑问答、写作、校对、搜索、画像、推荐、情报分析等方面的应用。

4

5

 

 

当然,知识图谱随着深度学习的应用,也在不断进化完善。未来发展趋势可能涉及到如下几个方面:

 

1、从知识图谱向事理图谱的延伸。目前知识图谱主要研究的是名词实体及其关系拓展,追求客观真实性,记录事件的who、when、where、what等元素,知识状态是相对静态的;而事理图谱会更深挖掘一步,研究的更多是谓词事件及其关系拓展,追求事件间演化规律的可能性度量,描述事件的how、why等元素,知识状态也是随了解的深入而动态演化的。也许某天真做到这步,AI就越发的像人类的思维模式了。

 

2、目前深度学习需要大规模样本数据进行训练,如何让深度学习摆脱对于大规模样本的依赖?如何让深度学习模型有效利用大量存在的先验知识?如何让深度学习模型的结果与先验知识一致已成为了当前深度学习领域的重要问题。

 

相信技术进步的方向,同时也可能是应用可以深化、拓展的方向。

 

目前,拓尔思已打通技术到应用的“最后一公里”,实现了虚拟人SaaS平台的上线运营。未来会在以下两大方向,助力行业实现数字化转型。

 

1、虚拟播报

虚拟播报不止涉及到媒体资讯行业,也涉及到任何需要依靠媒介进行信息输出的政府或企业,例如,直播带货、政策解读、产品宣讲等。拓尔思在冬奥期间,推出的“小思播冬奥”,即是虚拟播报的一次成功展示。首先由AI完成冬奥赛事相关的智能策划,通过虚拟记者实现策划主题相关的智能采编工作,再由AI通过预设好的模板进行图文并茂的自动创作,最终由虚拟人进行稿件的自动播报输出。整个策划、写稿、播报这个过程尽力达到完全去人化或半去人化,大大降低了行业之前同样工作所投入的人力和时间成本。随着AIGC的推广普及,未来虚拟播报替代真人的趋势会愈加明显。

拓尔思虚拟人小思

 2、数字员工

万科的崔筱盼,就属于此范畴,主要用于负责监测房企各类事项的逾期情况和工作异常,通过邮件向同事发出提醒,推动工作及时办理。当然,数字员工也可根据交互与否再进行区分。非交互数字员工的作用就是替代掉流程标准化却简单重复的工种。有了行业知识图谱的赋能和业务流程自动化,数字员工可以很轻松胜任。同样的工作还有合同审核、内容审核、专利审核、模块化的行政办公场景等。交互数字员工,顾名思义,需要和真人完成一定规模的互动,对虚拟人在语义理解方面的能力有更强的把握和更丰富的知识库。交互类型数字员工相比非交互类型,除了同样给予有效信息方面的反馈,给予面向用户更多的是人文关怀层面的反馈,比如金融智能客服、政务问答客服、特殊人群关怀陪伴等。在这点上来看,务实服务也许容易,但有温度的服务不易,因为AI和人还有一个最大的鸿沟,就在于逻辑易懂情绪难分。相信技术在这方面还有很长的路要走。


虚拟人是媒介,也是连接现实和虚拟的一座桥梁,如何利用好这座桥梁,更好地为企业为个人服务,让大家在虚拟的世界,感受到更多的便利与真实,是拓尔思要不断去探索去实现的目标。拓尔思将不懈努力,致力于通过大数据和人工智能,将有温度有效率的服务,带给更多用户。