数字人形象及声音采集服务-
版本: V1.0 | 交付方式: 人工服务 |
适用于: Windows/Linux/Android/iOS/Unix/其他 | 上架日期: 2024-01-09 02:56:11 |
一、数字人训练视频素材专业录制
1. 录制环境与技术支持:
专业场地:选择广播电台级别的隔音录影棚,确保录制环境绝对安静,无外部干扰。
设备配置:提供4K分辨率的专业级摄像机,配备高清绿幕背景、专业题词器、多角度补光灯以及高灵敏度收音麦克风,确保视频与音频的采集质量达到最高标准。
2. 形象准备与指导:
服装与妆容:客户提供符合要求的服装(避免绿色及高对比图案),并根据需要提供基础妆容指导,确保人物形象在镜头前清晰、立体。
动作与表情:根据数字人应用场景,指导客户完成3-5个符合其身份特征的常用动作以及自然流畅的表情变化。
3. 内容准备与演练:
演讲内容:客户提供的演讲脚本,内容需符合数字人未来应用场景的语言风格及话题范畴。
提前演练:在正式录制前,安排客户进行至少一次的全程演练,确保录制过程中无明显口误或动作失误。
4. 成果输出:
提供4K分辨率、MP4/MOV格式的视频文件,满足后续数字人模型训练及制作的需求。
二、数字人训练音频素材专业录制
1. 录制环境与技术支持:
隔音环境:确保录音室具有优良的隔音效果,防止外部噪音干扰。
专业设备:使用高保真度的录音设备,捕捉声音的每一个细节,确保音频质量纯净无瑕。
2. 内容准备与指导:
标准词句:客户提供或选择20句/100句标准词句作为录音内容,这些词句应涵盖数字人未来可能遇到的各种语境和语音特点。
朗读指导:提供朗读技巧指导,帮助客户掌握适当的语速、语调和停顿,使音频素材更加自然流畅。
3. 成果输出:
提供高质量、无噪音干扰的音频文件(如WAV、无损压缩格式等),时长与朗读内容相匹配,满足数字人声音模型训练的需求。需要注意的是,此处输出应为纯音频文件,而非视频文件。如需在视频中使用这些音频素材,需额外进行音视频同步处理。
方案提供了详细的准备指导和录制要求,确保了客户能够清楚地了解并参与整个录制过程,从而得到高质量的数字人训练素材。不过需要注意的是,在音频素材录制部分的输出内容描述可能存在错误或遗漏,需要根据实际情况进行调整