检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
单击界面右上方的“编辑”,进入音频文件编辑页面。 选中所有的音频文件,单击“分享”,可选择隔空投送或其他第三方应用导出音频文件至PC中。 一个长音频文件无需压缩,可直接上传至MetaStudio控制台,进行声音训练。 安卓手机 安卓手机推荐下载软件“超级录音机”进行录音,如图2所示。 图2 超级录音机 音频录制说明,如表2所示。
String 资产状态。 CREATING:资产创建中,主文件尚未上传 FAILED:主文件上传失败 UNACTIVED:主文件上传成功,资产未激活,资产不可用于其他业务(用户可更新状态) ACTIVED:主文件上传成功,资产激活,资产可用于其他业务(用户可更新状态) DELETI
complete tasks with astonishing speed and efficiency. 20. It can avoid obstacles and efficiently clean every corner of your home, ensuring thorough
"style_id" : "system_male_001", "model_cover_url" : "https://digitalhuman.obs.cn-east-3.myhuaweicloud.com:443/0d697589d98091f12f92c0073501cd79/3fc
表2 界面元素说明 界面元素 说明 本地导入 单击“本地导入”,从本地选择PNG、JPG、JPEG和BMP格式的图片上传。 也支持直接拖拽本地图片至图片列表区域,完成上传操作。 关键词搜索框,可输入图片名称进行精准搜索。 示例:科技。 筛选条件 支持通过背景图片来源的维度,筛选展示下方的图片。
题。 知识库 单击“添加”,在弹出的“选择知识库”对话框中,勾选对应的知识库。 这里的知识库均为“普通文件”类型,其来源请参考新增知识库-上传普通文件。 回答仅限于文档 是否开启回答仅限于文档。 如果开启此设置, 数字人仅回答知识库中内容。如果超出知识库范围,数字人使用兜底话术答复。
秒的演讲过程。 允许使用中文、英文录制。 录制全程眼睛需注视镜头,周围环境保持安静,脸部光照明亮且均匀。 拍摄完成后不要剪辑,整个视频一起上传至MetaStudio控制台。 注意事项 避免头部大幅度转动或者摆动,避免嘴巴被遮挡,可能造成口型异常。 视频中需保证仅出现录制者及其声音
响应Body参数 参数 参数类型 描述 count Integer 参数解释: 视频制作任务总数。 取值范围: 0-2147483647 jobs Array of DigitalHumanVideo objects 视频制作任务列表。 表6 DigitalHumanVideo 参数
第一次单击可折叠“文本驱动/视频驱动”,第二次单击后恢复展示。 音频驱动 需从本地上传已录制好的音频。音频文件格式需要为WAV、MP3或M4A,大小不能超过100M。 可单击“导入”上传音频,也可以直接拖拽本地音频文件至提示区域中,完成上传。单击左侧的图标,可试听音频效果。如果音频效果不佳,可以单击“导入”,覆盖更新音频。
对接第三方应用厂商类型。 说明: 0:科大讯飞AIUI;1:华为云CBS;2:科大讯飞星火交互认知大模型;6:第三方语言模型;8:奇妙问 取值范围: 0-32 huawei_ei_cbs 否 HuaweiEiCbs object 华为云CBS应用配置 iflytek_aiui_config
首先我们给大家介绍万兴播爆这款产品。 万兴播爆是万兴科技旗下一款AIGC视频创作工具,致力于出海营销视频制作。 只需要上传文案就可以生成一条真人模特出镜,多语言的口播讲解介绍视频,还支持上传图片、产品视频、企业logo、添加文字贴图背景音乐等编辑功能。 目前已经支持桌面端、移动端安卓iOS都可以直接下载使用。
name 是 String 应用名称。 app_type 是 Integer 对接第三方应用厂商类型。 说明: 0:科大讯飞AIUI;1:华为云CBS;2:科大讯飞星火交互认知大模型;5:第三方驱动;6:第三方语言模型;8:奇妙问 取值范围: 0-32 room_id 否 String
数字人形象生成完成。 如果训练生成的数字人形象不满足需求,单击右下方的“驳回”,进入“问题填写”界面。 输入“问题标题”、“问题描述”,并上传相应的附件,如更新后的绿幕视频文件等内容。如果存在多个问题,可以单击界面右上角的“添加问题”,增加多个问题描述。问题全部添加完成后,单击“确认”,等待服务管理员处理。
name 否 String 应用名称。 app_type 否 Integer 对接第三方应用厂商类型。 说明: 0:科大讯飞AIUI;1:华为云CBS;2:科大讯飞星火交互认知大模型;5:第三方驱动;6:第三方语言模型;8:奇妙问 取值范围: 0-32 room_id 否 String
用于语音驱动的音频文件上传URL。 表25 ShootScriptAudioFileItem 参数 参数类型 描述 sequence_no Integer 剧本序号。 取值范围: 0-2147483647 audio_file_upload_url String 语音驱动音频文件上传URL。创
本地打开模板文件,按照模板提示,输入需要添加的热词,示例如下所示: 数字人对话,weight:4.0 文件编辑完成后,单击“上传热词”,将文件上传至应用中。 单击界面右上方的“保存修改”,保存应用修改。 配置应用的设备人设。 开启闲聊功能后,再配置“设备人设”,这样用户在问一
object 用于语音驱动的音频文件上传URL列表。 表24 ShootScriptAudioFiles 参数 参数类型 描述 audio_file_url Array of ShootScriptAudioFileItem objects 用于语音驱动的音频文件上传URL。 表25 Sho
object 用于语音驱动的音频文件上传URL列表。 表24 ShootScriptAudioFiles 参数 参数类型 描述 audio_file_url Array of ShootScriptAudioFileItem objects 用于语音驱动的音频文件上传URL。 表25 Sho
用户输入的数字人名片信息。实际可以填写哪些字段取决于名片模板。 card_image_config 是 BusinessCardImageConfig object 用户上传的用于制作数字人名片的图片。 introduction_type 否 String 自我介绍驱动方式。 TEXT: 文本驱动,即通过TTS
请求URL:wss://metastudio-api.{region}.myhuaweicloud.com:443/v1/{project_id}/ttsc/jobs region当前仅支持下述区域: 华北-北京四:cn-north-4 华东-上海一:cn-east-3 project_id取值,详见获取项目ID。