检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
科大讯飞星火交互大模型及AIUI 能力开放可集成 智能交互端侧Web SDK 形象驱动API 数字人大脑API 数字人能力开放,多种合作模式灵活选择 实名安全认证后,可使用控制台在线自助完成内容制作。 集成数字人API、SDK至企业自建平台。 联合专业直播服务伙伴,定制场景化解决方案,实现数字人直播系统交付和运营专业支持。
的“售货员”角色,如图5所示。 图5 我的角色 单击图标,从下拉框中选择“API信息”,弹出如图6所示的对话框。 可以看到下述信息: RoleId:角色ID。 AppSecret:角色密钥。 图6 API调用 父主题: 创建智能交互数字人(奇妙问)
扬声器 需要有扬声器。 触摸屏 需要有触摸屏。 带宽 4M以上。 由于浏览器的安全策略限制,仅支持通过“https://域名”方式访问,否则无法获取麦克风权限。 智能交互界面对浏览器的要求,如表2所示。 表2 浏览器适配详情 操作系统类型 浏览器类型 浏览器版本 Windows Chrome浏览器
第三方平台开播指南 视频直播支持对接淘宝、抖音、拼多多等第三方平台进行直播,相关操作请提交工单或联系客户经理获取。 常见问题 第三方直播平台直播画面不清晰怎么办? 第三方平台直播画面突然中断是怎么回事? 父主题: 附录
容生成的效率。 算法运行机制 训练阶段输入预先获取的高质量语音及其表情基系数,通过学习获得语音特征与表情基系数的关系。 用户使用时,输入音频流或音频文件。 音频经过安全审核后,进入下一步操作,否则不返回结果。 对音频特征提取后,获取音频特征,再通过算法将音频特征转换为表情基系数。
或公司信息的一段视频。 按需计费 按需预付费套餐包 3D数字人 照片建模 按照3D风格化基础模型建模,调用API接口的次数计费。 每成功调用一次3D风格化基础模型建模的API,从所购预付费资源包中扣除1次。 计费时优先使用套餐包中的额度,该额度使用完后,转按需付费。 照片建模的含
示例数字“1024”的读法如下所示: 数字:一零二四 数值:一千零二十四 日期:十月二十四 电话:幺零二四 示例英文“API”的读法如下所示: 字母:API 单词:api 音标 选中英文单词,输入合适的音标。 局部语速 选中需要变速播报的文本,设置局部语速。 取值范围[0.5x,2x],含义如下所示:
由于Chrome等浏览器只支持硬解码H265(HEVC)视频,当您的PC硬件不支持解码H265(HEVC)视频时,Chrome等浏览器将无法播放H265(HEVC)视频,并获取不到视频分辨率等参数。 在Chrome浏览器中输入“chrome://gpu”后,搜索“coding”。可以检查当前PC的浏览器是否支持H265(HEVC)视频解码。
交互对话。 发布成功后,自动跳转至与数字人智能互动页面,可以体验与数字人互动的效果。也可以复制数字人互动页面的网址,分享给其他用户使用。 获取数字人互动页面URL的方式还有:进入“我的创作 > 智能交互 > 对话项目”页面,单击智能交互对话项目右侧的“生成URL并复制”,将URL分享给其他用户使用。
单击webm2mov,将视频格式转换小工具webm2mov_20240814.rar下载至本地。 下载过程大约耗时3~5分钟,请耐心等待。 如果用户需要自定义工具,可以获取其源码。 本地解压工具包,得到ffmpeg目录和运行文件webm2mov.exe。 双击webm2mov.exe,弹出如图1所示的界面。 图1
等方面,中国大陆各个区域间区别不大,如果您或者您的目标用户在中国大陆,可以不用考虑不同区域造成的网络时延问题。 区域和终端节点 当您通过API使用资源时,您必须指定其区域终端节点。有关华为云的区域和终端节点的更多信息,请参阅地区和终端节点。
LM时,需要按照MetaStudio服务定义的接口参数格式(详见智能交互第三方LLM回调接口),开发LLM接口,由MetaStudio服务调用此接口,实现智能交互能力。 这里配置的是MetaStudio服务调用第三方语言模型的API地址。 流式响应 MetaStudio智能交互服
按照界面提示,选择您的付款方式,完成支付即可。 订单支付成功后,进入如图4所示的界面。 图4 订单支付成功 获取第三方声音使用凭证 下面以语音合成套餐为例,进行操作说明。其他声音套餐的操作均相同。 查看用户已购语音合成套餐,获取“用户账号”和“登录密码”,作为在MetaStudio控制台激活第三方声音的使用凭证。
调用结束数字人智能直播任务接口,停止直播任务。 服务自动关停直播任务 下述场景下, 生成的直播视频流没有观看者,服务为保障租户利益,会自动关停直播任务。 在MetaStudio控制台开播,且没有配置RTMP推流时,用户关闭了视频播放窗口一段时间以后,约2~3分钟。 调用API开播,且没有配置
图3 获取访问权限 单击“确定”,创建应用。 (可选)创建对话,操作请参考对话。 单击界面右上角的“发布”,发布数字人智能交互对话。 发布成功后,自动跳转至与数字人智能互动页面,可以体验与数字人互动的效果。也可以复制数字人互动页面的网址,分享给其他用户使用。 获取数字人互动页面URL的方式还有:进入“我的创作
自定义声音生成后,会自动展示在MetaStudio控制台声音列表中,可用于分身数字人视频制作、视频直播或智能交互等场景中。 通过MetaStudio的API调用自定义声音。 父主题: 声音制作
29. 这意味着它将不断地推出新功能、新技术和新服务,以满足大家不断变化的需求。 30. 同时,家用机器人还注重与开发者合作,开放API接口,让他们可以开发更多有趣的应用程序和插件,丰富大家的使用体验。 31. 通过前面的介绍,我们对家用机器人有了一个基本的了解。 32. 接
用户与数字人进行智能交互的页面,默认为用户需要自定义富媒体的展示效果,即用户自定义UI界面展示。 通过注册事件通知semanticRecognized获取回复文本,用户可以自行提取图片、视频标签进行自定义显示。 父主题: 智能交互
在左侧导航栏中,单击“应用信息”。进入“应用信息”页面,如图5所示。 MetaStudio服务创建智能交互时,需要使用如下应用信息: 应用名称 APPID APPKEY APISECRET 图5 应用信息 (可选)开启闲聊功能 闲聊功能可以丰富数字人可问答的内容,如:天气、旅游、假期等日常闲聊信息。 闲聊为可选功能,如需开启,可参考下述步骤进行操作:
在左侧导航栏中,单击“应用信息”。进入“应用信息”页面,如图11所示。 MetaStudio服务创建智能交互时,需要使用如下应用信息。 应用名称 APPID APPKEY APISECRET 图11 应用信息 (可选)开启闲聊功能 闲聊功能可以丰富数字人可问答的内容,如:天气、旅游、假期等日常闲聊信息。 闲聊为可选