拓尔思虚拟人SaaS服务平台的定位是开放服务平台,也是赋能平台。平台技术架构图如下所示:
最底层是虚拟人的形象技术支撑,包括形象、语音、视觉中枢,旨在实现本文合成语音,语音驱动虚拟人口型的同步。当然平台也支持针对虚拟人形象的选择,包括2D、3D、以及基于真人形象的采集训练还原,同时对虚拟人参数的各种可配置化功能,比如支持服装、颜色、姿势、 声音、肢体动作等参数的可配置化。
中间层是虚拟人的“大脑”,也是平台赋能部分。基于拓尔思自主可控的NLP技术和在众多领域落地的经验,虚拟人可以被赋予很多场景应用和特定角色,例如,泛行业垂直领域的智能问答,媒体行业内容自动创作及播报等。
目前虚拟人SaaS服务平台已正式上线,且推出了虚拟主播、虚拟直播、直播问答这三种形式的虚拟人服务。平台通过虚拟人制作的一站式服务,使得从选“人”到成片成为流程闭环,为用户的操作提供了最大便捷。
根据业务需要,可以申请定制主播形象。主播形象具有生动、鲜活等特点,提供多套服装配饰、表情动作、肢体动作、声音等供用户选择,适配不同场景的播报。支持多视频开窗、图片开窗、文本开窗、字幕、图层、背景、LOGO等视频编辑功能,用户只需简单拖入各种素材元素、配置元素的属性、调整元素图层的叠加顺序,就可以完成内容丰富、样式多样的虚拟人内容播报。
用户可以导入所需播报文本,可以对文本进行多音字检测,根据播报上下文,对多音字进行读音矫正,还提供数字文本的读音选择,比如电话号码、整数、小数等读法,此功能可以提高播报的准确度。
虚拟主播系统是“一站式虚拟主播视频生产和编辑服务”的系统,用户可以根据不同业务场景,添加多个不同镜头的虚拟主播视频段落,每个视频段落之间可以添加转场过渡,还可以添加片头、片尾、以及用户自己上传的视频段落,一键快速生成多场景视频段落,适用于不同平台视频发布需求,提高播报类场景的制作效率。
该系统提供视频管理功能,根据创建先后顺序显示当前用户已制作视频,并提供标题查询、标签过滤、时间过滤等多种筛选方式,方便用户查找视频,并对已有视频进行管理和归档,形成自己的数字资产。
该系统提供虚拟直播功能,实时把文本转换成视频流,在线播报出去,未来可以在24小时不间断虚拟直播、政务宣传和推广、文旅介绍等场景进行落地。
该系统提供在线交互、实时问答功能,拓尔思凭借NLP领域优势和积累的各场景行业术语,赋予虚拟人“实用灵魂”。通过语音识别、语义合成、自然语言处理、知识库、知识图谱、图像处理、口唇驱动及虚拟人合成等AI核心技术,针对特定行业客户,绘制专属行业的知识图谱,提供互动交流、业务办理、问答咨询、服务导览、实现虚拟人与真人的“面对面”实时交互,解决用户实际业务问题的创新性、智能化产品解决方案。从而达到提高服务效率、提升服务体验、降低综合成本、规范服务流程,为客户创造实际应用价值。
根据业务需要,可以申请定制主播形象。主播形象具有生动、鲜活等特点,提供多套服装配饰、表情动作、肢体动作、声音等供用户选择,适配不同场景的播报。支持多视频开窗、图片开窗、文本开窗、字幕、图层、背景、LOGO等视频编辑功能,用户只需简单拖入各种素材元素、配置元素的属性、调整元素图层的叠加顺序,就可以完成内容丰富、样式多样的虚拟人内容播报。
用户可以导入所需播报文本,可以对文本进行多音字检测,根据播报上下文,对多音字进行读音矫正,还提供数字文本的读音选择,比如电话号码、整数、小数等读法,此功能可以提高播报的准确度。
虚拟主播系统是“一站式虚拟主播视频生产和编辑服务”的系统,用户可以根据不同业务场景,添加多个不同镜头的虚拟主播视频段落,每个视频段落之间可以添加转场过渡,还可以添加片头、片尾、以及用户自己上传的视频段落,一键快速生成多场景视频段落,适用于不同平台视频发布需求,提高播报类场景的制作效率。
该系统提供视频管理功能,根据创建先后顺序显示当前用户已制作视频,并提供标题查询、标签过滤、时间过滤等多种筛选方式,方便用户查找视频,并对已有视频进行管理和归档,形成自己的数字资产。
该系统提供虚拟直播功能,实时把文本转换成视频流,在线播报出去,未来可以在24小时不间断虚拟直播、政务宣传和推广、文旅介绍等场景进行落地。
该系统提供在线交互、实时问答功能,拓尔思凭借NLP领域优势和积累的各场景行业术语,赋予虚拟人“实用灵魂”。通过语音识别、语义合成、自然语言处理、知识库、知识图谱、图像处理、口唇驱动及虚拟人合成等AI核心技术,针对特定行业客户,绘制专属行业的知识图谱,提供互动交流、业务办理、问答咨询、服务导览、实现虚拟人与真人的“面对面”实时交互,解决用户实际业务问题的创新性、智能化产品解决方案。从而达到提高服务效率、提升服务体验、降低综合成本、规范服务流程,为客户创造实际应用价值。