检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
3D数字人 照片建模 左下角展示用户已购买资源的剩余量。单击图标,可以查看剩余量详情的列表数据。 语音驱动 左下角展示用户已购买资源的剩余量。单击图标,可以查看剩余量详情的列表数据。 视觉驱动 左下角展示用户已购买资源的剩余量。 资产管理 资产管理 左下角展示资产存储空间的已使用量,单位:GB。
智能交互限制 智能交互对硬件设备的最低配置要求,如表1所示。 表1 硬件设备要求 硬盘配置 最低配置 CPU i5及以上版本。 内存 8G以上。 硬盘 128G及以上。 操作系统 Windows或Android系统。 麦克风 需要有麦克风,且要保障1米以内的拾音效果。 扬声器 需要有扬声器。
3D数字人语音驱动 创建语音驱动任务 2次/秒 2次/秒 - 获取语音驱动任务列表 20次/秒 10次/秒 - 创建语音驱动表情动画任务 2次/秒 2次/秒 - 获取语音驱动表情数据 20次/秒 10次/秒 - 获取语音驱动数据 20次/秒 10次/秒 - 3D数字人视频驱动 创建视频驱动任务
environment variables CLOUD_SDK_AK and CLOUD_SDK_SK in the local environment ak = os.environ["CLOUD_SDK_AK"] sk = os.environ["CLOUD_SDK_SK"]
3D数字人语音驱动 创建语音驱动任务 2次/秒 2次/秒 - 获取语音驱动任务列表 20次/秒 10次/秒 - 创建语音驱动表情动画任务 2次/秒 2次/秒 - 获取语音驱动表情数据 20次/秒 10次/秒 - 获取语音驱动数据 20次/秒 10次/秒 - 3D数字人视频驱动 创建视频驱动任务
environment variables CLOUD_SDK_AK and CLOUD_SDK_SK in the local environment ak = os.environ["CLOUD_SDK_AK"] sk = os.environ["CLOUD_SDK_SK"]
47010114 第三方文本驱动失败,文本长度超过最大值 第三方文本驱动失败,文本长度超过最大值 第三方文本驱动请携带正确长度的文本数据 400 MSS.47010115 第三方文本驱动失败,seq参数小于最小值 第三方文本驱动失败,seq参数小于最小值 第三方文本驱动请携带正确的seq参数信息
environment variables CLOUD_SDK_AK and CLOUD_SDK_SK in the local environment ak = os.environ["CLOUD_SDK_AK"] sk = os.environ["CLOUD_SDK_SK"]
environment variables CLOUD_SDK_AK and CLOUD_SDK_SK in the local environment ak = os.environ["CLOUD_SDK_AK"] sk = os.environ["CLOUD_SDK_SK"]
environment variables CLOUD_SDK_AK and CLOUD_SDK_SK in the local environment ak = os.environ["CLOUD_SDK_AK"] sk = os.environ["CLOUD_SDK_SK"]
实时智能交互,提升客户满意度和品牌形象 开放的Web SDK及API可快速集成到第三方业务系统,实现AI数字员工问答、服务、陪练等场景任务。 1.5秒超低时延交互 实时驱动极低延时,保障用户真实体验。 多模型数字人大脑 华为云智能问答机器人CBS 华为云盘古大模型 科大讯飞星火交互大模型及AIUI 能力开放可集成 智能交互端侧Web
画布制作完成后,再制作语音。 选择“文本驱动”的方式。在文本输入框中,输入文本内容,以生成音频,如图2所示。 文本示例:今天是9月26日,星期二,天气晴朗,欢迎大家到访。我们精心布置了现场,室内摆放了各类植物和鲜花,场地宽敞明亮,足够大家在室内共同交流和活动。 图2 文本驱动 音频制作完成后,可单击音量图标,调整音频的音量。
} 更多编程语言的SDK代码示例,请参见API Explorer的代码示例页签,可生成自动对应的SDK代码示例。 状态码 状态码 描述 200 成功。 400 请求传参异常,包含错误码及对应描述。 401 未鉴权或鉴权失败。 500 内部服务错误。 错误码 请参见错误码。 父主题:
String 剧本封面下载url。 script_type String 脚本类型,即视频制作的驱动方式。默认TEXT TEXT: 文本驱动,即通过TTS合成语音 AUDIO: 语音驱动 text String 台词脚本。 create_time String 创建时间,格式遵循:RFC
画布左侧展示字幕内容,支持修改字幕内容、调整字幕样式。 须知:“音频驱动”方式目前仅支持中文普通话的场景开启字幕。 图标 展示当前视频的宽高比。 图标 第一次单击可折叠“文本驱动/视频驱动”,第二次单击后恢复展示。 音频驱动 需从本地上传已录制好的音频。音频文件格式需要为WAV、MP3或M4A,大小不能超过100M。
strings 分身数字人训练任务标签。 model_version String 分身数字人模型版本。默认是V3.2版本模型。 V3.2:V3.2版本模型 说明: V3和V2版本已废弃不用 取值范围: 0-64 默认取值: V3.2 matting_type String 抠图类型。默认是AI。
制作好数字人后,可以不购买路数进行直播吗? 数字人模型只能通过MetaStudio服务驱动,不与其他第三方服务兼容。数字人形象制作与视频直播是两个独立的功能,需各自计费。可通过包周期或按需计费方式购买路数。 视频直播间的场景布置好之后,可以通过捕捉网页画面或RTMP推流的方式向第
更多编程语言的SDK代码示例,请参见API Explorer的代码示例页签,可生成自动对应的SDK代码示例。 状态码 状态码 描述 200 处理成功返回。 400 请求传参异常,包含错误码及对应描述。 错误码 请参见错误码。 父主题: 智能交互数字人应用管理
更多编程语言的SDK代码示例,请参见API Explorer的代码示例页签,可生成自动对应的SDK代码示例。 状态码 状态码 描述 200 处理成功返回。 400 请求传参异常,包含错误码及对应描述。 错误码 请参见错误码。 父主题: 智能交互数字人应用管理
参数类型 描述 script_type 否 String 参数解释: 脚本类型,即视频制作的驱动方式 约束限制: 不涉及 取值范围 TEXT: 文本驱动,即通过TTS合成语音 AUDIO: 语音驱动 默认取值: TEXT text_config 否 TextConfig object 讲解词配置。