检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
支持创建文档问答库。非必须创建,可根据实际情况选择使用。 MetaStudio服务目前仅支持读取docx(包含图文)、txt和md格式,其他格式暂不支持。 docx格式说明:可以没有标题和分级标题, 如需添加标题和分级标题,请使用word标准格式,如图1和图2所示。 txt格式说
不能超过2000字。 单击声音图标,会弹出声音对话框,可以选择需要使用的声音。 无标注的系统声音,均为免费声音,可直接选用。 标注有“第三方”的声音,需要购买激活后才能使用,操作请参考购买出门问问声音套餐。 设置完成后,单击“生成视频”,弹出如图2所示的对话框,显示照片数字人视频的生成进度。
注册华为账号:单击进入注册页面。 完成实名认证:单击进入实名认证。 账户充值:为确保正常使用MetaStudio,您需要进行账户充值。 开通MetaStudio服务:单击进入MetaStudio控制台,根据开通引导完成服务开通。 推荐浏览器 推荐使用Chrome浏览器访问MetaStudio控制台。
前提条件 需要申请开通智能交互权限后,才可集成智能交互SDK,并使用Websocket接口驱动数字人。 父主题: 智能交互驱动
服务提供的能力进行封装,以简化用户的开发工作。用户直接调用智能交互Web SDK提供的接口,即可实现使用数字人智能交互业务能力的目的。 智能交互提供了如下主流平台SDK供开发者使用。 表1 客户端SDK 客户端 集成SDK 接口参考 Web Web SDK 接口参考 父主题: 智能交互客户端SDK
本根节点。 <break/>标签用于静音停顿,可设置停顿时长。 <phoneme></phoneme>标签,用于标记多音字发音。 <say-as></say-as>标签用于指定数字或英文的读法。 <sub></sub>标签用于设置当前标记文字的别名,即替代读法。 <prosody
频属性设置对话框,如图2所示。 需要确认这里的“设备”与Windows系统的声音输出设备是否一致。如果不一致,会导致OBS无法成功捕获声音给第三方直播平台。需要修改为一致后再直播。 图2 桌面音频属性设置 检查Windows系统的声音输出设备 在Windows系统的系统设置中,找
购买语音包后试听一直转圈圈是为什么? 需要检查已购买的第三方声音AK/SK是否配置正确,详见购买出门问问声音套餐。如果配置有误,则无法使用。 父主题: 计费咨询
系统资产标签定义 查询资产列表接口支持使用“tags”标签对分身数字人模型进行分类。 “tags”取值及其含义,如表1所示。 表1 tags标签说明 tags取值类型 说明 数字人类型 取值如下: VIRTUAL_AVATARS:分身数字人 VIRTUAL_HUMANS:虚拟数字人
403 Forbidden 请求被拒绝访问。 返回该状态码,表明请求能够到达服务端,且服务端能够理解用户请求,但是拒绝做更多的事情,因为该请求被设置为拒绝访问,建议直接修改该请求,不要重试该请求。 404 Not Found 所请求的资源不存在。 建议直接修改该请求,不要重试该请求。 405
d。 支持流式文本消息。seq为流式文本序号,从1开始计数;is_last用于判断流式文本的最后一包数据。如果不使用流式文本消息,seq设置为“1”,is_last设置为“true”。 建议每个分包数据长度大于6个字,否则可能会导致数字人说话卡顿。 详细交互流程如下所示: 用户发送文本驱动消息。
Java SDK使用指导 Python huaweicloud-sdk-python-v3 Python SDK使用指导 Go huaweicloud-sdk-go-v3 Go SDK使用指导 PHP huaweicloud-sdk-php-v3 PHP SDK使用指导 Node.js
文本驱动:通过输入文本,选择声音的方式,生成播报内容。不能超过2000字。 单击声音图标,会弹出声音对话框,可以选择需要使用的声音。 无标注的系统声音,均为免费声音,可直接选用。 标注有“第三方”的声音,需要购买激活后才能使用,操作请参考购买出门问问声音套餐。 请填写名片信息 姓名 必填项,数字人姓名。 不能超过32字符。
声音制作:录制真人声音,建模生成声音模型。 形象制作:拍摄形象采集视频,建模生成数字人形象。 视频制作:使用系统预置或自定义生成的数字人形象、声音,制作音视频内容。 视频直播:使用系统预置或自定义的数字人形象、声音,制作音视频直播内容。 智能交互:对接第三方大脑,通过数字人交互的方式与用户进行问答。
白名单。 租户所在Region的项目ID获取方法,请参见获取项目ID。 注意事项 加入白名单的租户,仅支持转移声音和分身模型资产给其他租户使用。 操作步骤 登录MetaStudio控制台。 在左侧导航栏中,单击“我的创作”。 选择“资源”页签,如图1所示。 图1 资源页面 选择左
上传的PPT支持编辑吗? 不支持在视频制作界面对PPT进行编辑,如局部内容放大或高亮显示等。需用户直接在本地编辑好后,上传控制台使用。 父主题: 视频制作
90100002 not support enumerate devices. 浏览器不支持enumerateDevices方法,请检查是否使用https协议访问,或更换浏览器。 90100003 no available devices. 没有找到可用设备,请排查设备是否就绪。 90100004
开发者论坛 开发者如果在使用MetaStudio数字内容生产线时有任何问题,可以在华为云开发者云社区的“数字内容生产线”板块提问。 父主题: 开发者论坛
修订记录 发布日期 修订记录 2024-07-09 新增PHP和Node.js语言SDK。 2023-06-30 第一次正式发布。
接口参考 主入口(HwICSUiSdk) 事件通知(EventMap) 错误码(ICSError) 授权浏览器麦克风的访问权限 Web语音唤醒 父主题: Web SDK