近来,虚拟人呈现井喷式发展,银行、媒体、美妆等不同行业纷纷推出自己的虚拟人。一时之间AYAYI、LING、柳夜熙等各式各样风格鲜明的虚拟人类走进了大众视野。虚拟数字人形象上分为2D和3D两大类,外形风格上又分为卡通、拟真、写实等类型,超写实是指人物外观仿真度高,栩栩如生,这需要面部面数在1万面以上,高精度经得起360度无死角的怼拍,柳夜熙就是典型的3D超写实虚拟数字人,放大看看她的皮肤、五官、头发、肢体是不是已经很接近真人呢?
简单来说一个3D虚拟数字人的制作需要经过三个环节形象生成、动画生成和语音生成,形象生成决定了她的长相,动画生成让她灵活的动起来,而语音生成让她开口说话,进行表达和交互;形象生成部分*重要的是建模,常见的建模方式有手工建模、AI建模和扫描建模,随着科技的发展效率更高的扫描建模和AI建模技术逐渐成为人物建模的主流方式,建模完成要想让冰冷的模型动起来还需要进行一系列绑定和驱动。
骨骼和肌肉绑定决定了模型后续的肢体动作和面部表情的自然度和流畅性,目前有骨骼绑定和混合变形,绑定两种主流方式,而驱动分为真人驱动和智能驱动。真人驱动是指通过捕捉技术采集真人演员的动作和面部表情数据,之后将这些数据迁移合成到虚拟数字人身上。
而近年来,基于计算机视觉的捕捉技术发展迅猛,大多数数字虚拟人的面部表情就是通过一个景深摄像头采集真人的面部3D点阵云图,然后实时地将面部动作和表情迁移到数字人的身上,有了绑定和驱动,通过渲染来生成动画,渲染分为实时渲染和离线渲染,为实现虚拟数字人的实时操控与实时交互,各大渲染引擎一直在发力突破算法,提升实时渲染效率,希望在实时渲染的画面质量、渲染速度、计算资源三者中取得解。
虚拟数字人的语音可以使用真人语音或者合成语音经过人工智能技术加上的持续训练后,合成语音越来越类似真人语音的声调、节奏和抑扬顿挫,并能实时对应唇型。虚拟数字人是科技与艺术的结合,在未来充满想象的虚拟空间中,虚拟数字人也是更理想化、更自由的人类投射,继续体验虚拟世界的魅力。