百度打造国内首个可交互超写实明星数字人,背后技术有多高深?

日期:2023-02-28 16:11:20 / 人气:208

日前,百度APP正式上线了以明星龚俊爲原型的数字人语音搜索助理。据引见,这是国际首个可以在在APP端完成用户互动的超写实数字人。用户进入该功用界面后,可以与“龚俊”实时交互,如讯问天气等成绩,“龚俊”将疾速辨认、搜索,并语音播报首条搜索后果。此外,用户也可以命令“龚俊”完成APP内的局部控制功用,如翻开夜间形式、进入书架页面等。据媒体报道称,该数字人在模型上,百度运用4D扫描技术捕获龚俊真人的说话以及日常表情的面部纤细变化,以完成对其自己的超写实复原。而在语音辨认上,百度赋予了其超高精确率的语音辨认技术,精确率到达98%,并且关于中英文混杂、生僻字、方言等各种语音也能精确辨认。另外,在语音分解上,该数字人依托于TTS(Text To Speech)技术,可以有限接近于原声。从专利角度看,依据智慧芽数据显示,百度及其关联企业在全球126个国度/地域中,共有1700余件与“语音辨认”相关的专利请求。其中,无效专利840余件,受权创造专利730余件。经过对上述全部专利停止剖析可知,百度在语音辨认技术范畴的专利布局,次要聚焦于语音交互、语音信息、人工智能、语音信号、语音分解、语音控制等相关的技术范畴。目前,虚拟偶像市场炽热,众多公司、机构纷繁发布本人的虚拟偶像,如DOTA2官方虚拟偶像dodo,清华大学虚拟先生华智冰,湖南卫视虚拟掌管人小漾,还有此前就曾经在二次元圈内大火的初音将来、洛天依等。量子位发布的《虚拟数字人深度产业报告》显示,虚拟数字人的使用可分爲效劳型虚拟人和身份型虚拟人。替代真人效劳中的虚拟主播和虚拟IP中的虚拟偶像是目前的市场热点。报告估计,在2030年,我国虚拟数字人全体市场规模将到达2700亿。身份型虚拟数字人约1750亿。效劳型虚拟数字人总规模超越950亿。目前市场仍处于后期培育阶段。

作者:傲世皇朝




现在致电 5243865 OR 查看更多联系方式 →

傲世皇朝 版权所有