检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
创建声音制作任务(自研模型) MetaStudio已经预置了各种类型的声音,可以在视频制作界面或视频直播界面查看。如果预置声音仍无法满足用户需求,可使用自研模型自定义生成声音。 操作限制 MetaStudio不支持个人用户定制声音,仅支持企业用户。 定制声音时,从平台下载的授权书
创建声音制作任务(第三方模型) MetaStudio已经预置了各种类型的声音,可以在视频制作界面或视频直播界面查看。如果预置声音仍无法满足用户需求,可使用第三方模型“出门问问”自定义生成声音。第三方模型“出门问问”的详细说明,如下所示: 输入的语言不受限制。默认支持19种输入语言
调, 共同制定环境保护政策、分享经验和技术,并解决跨国界环境问题。 国际社会关注灾害风险管理, 通过建立早期预警系统、加强应急响应和灾后重建等措施, 减少灾害带来的环境破坏和人类损失。 国际社会加强跨境环境治理, 通过合作与协商解决共享资源和环境问题, 并推动发达国家和发展中国家之间的责任分担原则。
关联租户 SP用户可以将购买的资源分配给多个租户使用。分配资源前,需先参考本节,关联所有租户。 前提条件 关联租户已注册华为账号:单击进入注册页面。 关联租户已完成实名认证:单击进入实名认证。 关联租户提供项目ID给SP用户,获取项目ID的方法请参见获取项目ID。 关联租户提供的
在调用create接口之前,必须要有用户点击集成WebSDK的页面的行为。 浏览器通过有上述点击的行为,才能获取采集声音的权限。否则无法采集声音,无法正常使用语音唤醒能力。 浏览器使用限制,请参见表1。 表1 浏览器适配详情 操作系统类型 浏览器类型 浏览器版本 Windows Chrome浏览器
否 Boolean 参数解释: PPT是否需要自动解析。 约束限制: 部分过于复杂的PPT或压缩比过高的PPT可能无法解析。 超过50页PPT仅转换50页 转换的图片无法保证完全还原,需要自行确认。 取值范围: true: 自动解析 false: 无需解析 默认取值: false ppt_analysis_status
error_code String 业务返回码 MSS.000000001 - 失败 MSS.000000002 - 内部错误 MSS.000000003 - 非法参数 MSS.000000004 - 非法访问,未鉴权或者鉴权失败 error_msg String 返回描述 request_id
commond_result String 命令执行结果。 EXCUTE_SUCCESS: 命令提交成功 EXCUTE_FAILED: 命令提交失败 attachment_upload_url Array of strings 附件上传地址 multipart_data Array of
制台的视频直播间编辑界面或智能交互对话设置页面,选到当前音色。 如果界面正常展示且可以选择此音色使用,说明接口可以正常调用此音色,否则接口无法调用。 API流控 数字内容生产线服务对服务端API设置了调用次数限制,避免出现短时间内重复调用API,服务中断的情况。 如果调用API时,返回“APIGW
"MSS.00000003", "error_msg" : "Invalid parameter" } 状态码:401 未鉴权或鉴权失败。 { "error_code" : "MSS.00000001", "error_msg" : "Unauthorized" }
csv文件下载地址 state String 任务的状态。 PROCESSING:处理中 SUCCEED:成功 FAILED:失败 error_message String 失败任务描述 请求示例 无 响应示例 无 SDK代码示例 SDK代码示例如下。 Java Python Go 更多 1
阅读发音 按顺序读,确保音字一致。避免漏字多字、发音错误、阅读不流畅等问题。如有这些问题,需重新录制。 内容要求 不能使用短音频复制拼接成长音频,会影响训练效果,无法通过审核。 录制提交 表3 录音内容提交规范 声音类型 音频说明 音频命名 基础版 需整段录制所有语料生成一个长音
String 资产名称。 asset_state String 资产状态。 CREATING:资产创建中,主文件尚未上传 FAILED:主文件上传失败 UNACTIVED:主文件上传成功,资产未激活,资产不可用于其他业务(用户可更新状态) ACTIVED:主文件上传成功,资产激活,资产可用于其他业务(用户可更新状态)
网络暴力是当前社会面临的一大问题。 在社交媒体上,人们可以随意发表言论, 但是也需要意识到这些言论所带来的后果。 预防和治理网络暴力是一个需要全社会共同关注和解决的庞大课题, 除了平台方需要倾注努力,还需监管部门、用户、媒体等多方主体的协作支持、共同参与。 在一场网络暴力事件中,用户可能是直接施暴者、直接或间接传播者,也可能是受害者。
文本驱动方式的要求如下所示: 文本输入长度不超过2000字。 通过文本合成的音频时长不能超过5分钟。 在照片数字人制作页面,选择“文本驱动”方式驱动照片说话时,需要输入文本并选择音色,再单击“试听”预估音频时长。如果超过5分钟,会导致照片数字人制作失败。 父主题: 使用限制
智能交互全流程演示 智能交互(热词) 热词配置 00:54 智能交互热词配置流程演示 2D数字人最佳实践 华为云MetaStudio数字人 数字人解决方案及生产过程介绍 02:26 华为云MetaStudio数字人 行业应用案例 展示各行业场景数字人 02:21 数字人行业应用案例 万兴科技
结果。也可以在MetaStudio控制台的“我的创作 > 资源 > 已激活”页签,查看上传的资产文件。 图4 接口页面 常见错误 上传资产失败的常见错误,如下所示: 2中file_md5输入错误,因为文件的MD5计算错误,且没有进行Base64编码。 3中可能错误,如下所示: C
任务ID。 state String 任务的状态。 WAITING:等待 PROCESSING:处理中 SUCCEED:成功 FAILED:失败 CANCELED:取消 BLOCK: 冻结 job_type String 任务类型。 2D_DIGITAL_HUMAN_VIDEO: 分身数字人视频制作任务
任务ID。 state String 任务的状态。 WAITING:等待 PROCESSING:处理中 SUCCEED:成功 FAILED:失败 CANCELED:取消 BLOCK: 冻结 job_type String 任务类型。 2D_DIGITAL_HUMAN_VIDEO: 分身数字人视频制作任务
GENERATING:字幕文件生成中。 GENERATE_SUCCEED:字幕文件生成成功。 GENERATE_FAILED:字幕文件生成失败。 job_id String 字幕文件生成任务ID。 表23 AudioInfo 参数 参数类型 描述 audio_id Integer