检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
否 Boolean 参数解释: PPT是否需要自动解析。 约束限制: 部分过于复杂的PPT或压缩比过高的PPT可能无法解析。 超过50页PPT仅转换50页 转换的图片无法保证完全还原,需要自行确认。 取值范围: true: 自动解析 false: 无需解析 默认取值: false ppt_analysis_status
违反法律法规的内容: 涉黄、涉赌、涉毒、涉诈、侵权内容 盗版游戏/软件/盗版视频 P2P类金融诈骗信息 彩票类信息 违规医院和药品类信息 无法正常访问或内容不含有任何实质信息 可第一时间拨打华为云电话、提交工单,或者直接在举报中心举报违规内容。我们收到用户反馈后,会立即响应处理,共同维护合法合规的安全环境。
违反法律法规的内容: 涉黄、涉赌、涉毒、涉诈、侵权内容 盗版游戏/软件/盗版视频 P2P类金融诈骗信息 彩票类信息 违规医院和药品类信息 无法正常访问或内容不含有任何实质信息 可第一时间拨打华为云电话、提交工单,或者直接在举报中心举报违规内容。我们收到用户反馈后,会立即响应处理,共同维护合法合规的安全环境。
exe,弹出如图1所示的界面。 图1 工具运行界面 单击“选择webm文件”,选择WEBM格式的视频。 等待视频格式转换完成。请注意,视频格式转换过程中,一定不能关闭如图2所示的2个窗口。 图2 工具运行界面 视频转换过程中,工具的同级目录下面会出现一些过程文件,请勿移动或删除,待视频格式转换完成后,会自动删除。
性”,弹出桌面音频属性设置对话框,如图2所示。 需要确认这里的“设备”与Windows系统的声音输出设备是否一致。如果不一致,会导致OBS无法成功捕获声音给第三方直播平台。需要修改为一致后再直播。 图2 桌面音频属性设置 检查Windows系统的声音输出设备 在Windows系统
标签关系 可以包含文本,不可以包含其他标签。 备注 1 <prosody rate="50">大家好,我是MetaStudio数字人</prosody> word标签 描述 <word></word>:设置选中文字为连读模式。选中文字只能包含文字,不能有标点符号或者空格等字符。
也可以不看提词器自由发挥,通常自由演讲能够获得更好的拍摄效果。在演讲过程中,可以做一些自然的手部动作,但是不能做一些有明确含义的动作,比如数字手势、挥手、握拳等。同时,也不能做大幅度的手势动作,比如将手超过肩部,或将手挡住脸部。每次动作完成后,需要把手放回到初始位置后再做下一个动
激活资源 目前支持购买的资源类型,如表1所示。 需激活“一次性计费”产品后使用,必须在一年内激活,否则无法再激活使用。从激活日期开始计算,产品有效期为一年。 按需套餐包和包年/包月产品,可直接使用,无需激活。必须在有效期内使用完成,超出有效期后,自动失效。 表1 资源类型 服务类型
String 资产名称。 asset_state String 资产状态。 CREATING:资产创建中,主文件尚未上传 FAILED:主文件上传失败 UNACTIVED:主文件上传成功,资产未激活,资产不可用于其他业务(用户可更新状态) ACTIVED:主文件上传成功,资产激活,资产可用于其他业务(用户可更新状态)
onceCode 是 - string 一次性鉴权码,获取方式请参见创建一次性鉴权码。 说明: CreateOnceCode接口需要在后台调用,不能在浏览器直接调用,否则有跨域问题。 serverAddress 是 - string 智能交互服务端地址。 不同Region的取值如下所示:
超过20MB,时长不超过5分钟。 在线录音:在线录制音频。录音时长不能超过5分钟,为保证音频生成的效果,请保持录音环境安静无噪音。支持试听录制生成的语音。 文本驱动:通过输入文本,选择声音的方式,生成播报内容。不能超过2000字。 单击声音图标,会弹出声音对话框,可以选择需要使用的声音。
智能交互支持富媒体吗? 支持的富媒体格式 用户与数字人进行智能交互问答时,支持展示如下格式的富媒体: 图片:JPG、PNG、BMP、GIF、SVG。 视频:MP4。 导入富媒体操作 支持通过问答库导入富媒体,示例如表1所示。以奇妙问知识库为例,可以通过新增知识库来补充富媒体知识。
证底噪不能太大,且不能有其他人声出现,尤其是被拍摄模特正在说话的时候。 模特形象 分身数字人不支持替换衣服,因此,您在录制时的着装会决定您的数字人穿着。 在拍摄前,我们建议参照如下条目,对您的形象进行检查。 着装要求 避免任何会和背景融为一体的衣服颜色。如绿幕背景下,不能穿绿色的衣服或者含有任何绿色图案的衣服。
超过20MB,时长不超过5分钟。 在线录音:在线录制音频。录音时长不能超过5分钟,为保证音频生成的效果,请保持录音环境安静无噪音。支持试听录制生成的语音。 文本驱动:通过输入文本,选择声音的方式,生成播报内容。不能超过2000字。 单击声音图标,会弹出声音对话框,可以选择需要使用的声音。
认证鉴权 调用接口有如下两种认证方式,您可以选择其中一种进行认证鉴权。 AK/SK认证:通过AK(Access Key ID)/SK(Secret Access Key)加密调用请求。推荐使用AK/SK认证,其安全性比Token认证要高。 Token认证:通过Token认证调用请求。
关联租户 SP用户可以将购买的资源分配给多个租户使用。分配资源前,需先参考本节,关联所有租户。 前提条件 关联租户已注册华为账号:单击进入注册页面。 关联租户已完成实名认证:单击进入实名认证。 关联租户提供项目ID给SP用户,获取项目ID的方法请参见获取项目ID。 关联租户提供的
"MSS.00000003", "error_msg" : "Invalid parameter" } 状态码:401 未鉴权或鉴权失败。 { "error_code" : "MSS.00000001", "error_msg" : "Unauthorized" }
String 数字人智能交互对话任务的状态。 WAITING: 等待 PROCESSING: 处理中 SUCCEED: 成功 FAILED: 失败 CANCELED: 取消 HEARTBEAT: 心跳 duration Float 数字人智能交互对话时长,单位秒。 取值范围: 0-2147483647
15秒静默状态时,需正视镜头,面带微笑,嘴巴闭合,保持静默。 演讲过程中不限制说话的内容,出现失误可直接略过或从错误位置继续说话,无需打断拍摄。 背景尽量维持静态,不能出现规律性或大幅度的背景变化。 画面保持稳定,建议使用手机支架或手机稳定器。 在光线充足的地方拍摄,避免出现脸部光照不均匀或“阴阳脸”。 父主题:
阅读发音 按顺序读,确保音字一致。避免漏字多字、发音错误、阅读不流畅等问题。如有这些问题,需重新录制。 内容要求 不能使用短音频复制拼接成长音频,会影响训练效果,无法通过审核。 录制提交 表3 录音内容提交规范 声音类型 音频说明 音频命名 基础版 需整段录制所有语料生成一个长音