检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
手机录制音频 请根据手机类型,执行相应操作: 苹果手机操作 安卓手机 苹果手机操作 苹果手机推荐下载软件“简易录音机(Easy Voice Recorder)”进行录音,如图1所示。 图1 简易录音机 音频录制说明,如表1所示。 表1 音频录制说明 音频录制 说明 采样率 推荐使用48kHz采样率录制音频。
解除所有IP访问的限制。 在客户端防火墙配置SparkRTC端口和域名白名单。 配置SparkRTC端口的防火墙白名单,如表1所示。 表1 防火墙端口白名单 端口类型 端口 TCP端口 443、6447 UDP端口 20000-20063 配置SparkRTC域名的防火墙白名单,如表2所示。 表2 防火墙域名白名单
属性关闭后,应用将不会对关闭的属性信息作答。 选择开启属性,可以单击属性右侧的“编辑回复”,选择“使用系统回复”或者“自定义”。如果选择“自定义”,需要输入自定义的回复内容;如果选择“使用系统回复”,均已预置回复内容,不支持编辑和修改。 图18 人设信息配置页面 人设信息设置完成
示。 请根据实际情况,配置下述信息: 资产标题:图片的标题。 图片简介:图片的基本介绍,方便了解和使用。 风格:关键词标签,方便用户搜索此类型的资产。 基本信息:图片的用途。 图3 上传图片 单击“图片上传”区域,从本地选择需要上传的图片资产。 单击界面右上方的“保存”,在弹出的
ErrorResponse 参数 参数类型 描述 error_code String 错误码。 error_msg String 错误描述。 表8 SharedConfig 参数 参数类型 描述 shared_type String 参数解释: 共享类型。 约束限制: 该配置仅用于模板
目前支持购买的资源类型,如表1所示。 需激活“一次性计费”产品后使用,必须在一年内激活,否则无法再激活使用。从激活日期开始计算,产品有效期为一年。 按需套餐包和包年/包月产品,可直接使用,无需激活。必须在有效期内使用完成,超出有效期后,自动失效。 表1 资源类型 服务类型 产品分类 计费模式
SDK默认方式展示效果 富媒体展示效果(自定义方式) 用户与数字人进行智能交互的页面,默认为用户需要自定义富媒体的展示效果,即用户自定义UI界面展示。 通过注册事件通知semanticRecognized获取回复文本,用户可以自行提取图片、视频标签进行自定义显示。 父主题: 智能交互
创建分身数字人定制任务 MetaStudio服务已预置多个数字人形象,可在视频制作界面或直播间界面查看。如果预置形象无法满足用户的需求,可以参考本节操作,自定义生成分身数字人。 注意事项 MetaStudio不支持个人用户定制形象,仅支持企业用户。 定制分身形象时,从平台下载的授权书中有明确说明,定制分身形象需授权给公司使用。
第三方用户id output_language 否 String 模型输出语言类型 custom_text 否 String 自定义试听文本 响应参数 状态码: 400 表4 响应Body参数 参数 参数类型 描述 error_code String 错误码。 error_msg String
产品优势 控制台自助服务,一站式快速生成所需内容 用户申请账号并上传相关授权,拍摄训练所需音视频素材,上传进行模型训练,生成自定义形象和声音。选择背景、声音、模特等内容,基于文本或语音智能驱动,实现视频制作、视频直播、智能交互等能力。 华为云盘古数字人大模型,赋能千行百业数字化营销新模式
形象制作 MetaStudio服务支持自定义生成分身数字人。 操作前准备 用户创建分身数字人定制任务前,需要参考操作步骤准备如下内容: 5~6分钟绿幕拍摄视频。 注意:如果制作分身形象的时候,选择保留拍摄背景,则需要准备实景背景拍摄视频。 身份证正反面照片。 形象授权签署文件,如授权书所示。
参数配置说明,如表1所示。 图2 创建应用 表1 创建应用 参数 说明 第三方应用 选择“第三方语言模型”。 应用名称 用户根据实际情况自定义即可。 APPID MetaStudio服务对接第三方语言模型LLM时,需要LLM提供的APPID信息。 APPKEY MetaStudi
t”。 委托站点:从下拉框中选择用户授权SIS服务所在Region。 热词ID:需要确保热词ID所在Region、语言类型与智能交互配置的SIS委托站点、语言类型一致,否则热词配置不生效。 需参考创建热词表,创建一个热词表,再参考调用热词表,复制热词ID至当前“热词ID”配置中。
声音制作 MetaStudio支持自定义生成声音。 操作前准备 用户创建声音制作任务前,需要参考操作步骤准备如下内容: 参考真人声音录制,提前录制一个WAV或MP3格式的长音频文件,每句之间需要有2~3秒的停顿。语料推荐使用文案样例(基础版)。 声音授权签署文件。 操作步骤 登录MetaStudio控制台。
String 批次名称 output_language 否 String 模型输出语言类型 custom_text 否 String 自定义试听文本 响应参数 状态码: 200 表4 响应Body参数 参数 参数类型 描述 job_id String 任务id。 training_data_uploading_url
单击webm2mov,将视频格式转换小工具webm2mov_20240814.rar下载至本地。 下载过程大约耗时3~5分钟,请耐心等待。 如果用户需要自定义工具,可以获取其源码。 本地解压工具包,得到ffmpeg目录和运行文件webm2mov.exe。 双击webm2mov.exe,弹出如图1所示的界面。
智能交互 如何实时切换智能交互的语言和声音? 智能交互支持富媒体吗? 如何自定义域名方式访问智能交互页面? 智能交互业务媒体流如何应对防火墙限制?
创建应用 表1 创建应用 参数 说明 第三方应用 如果已配置对话机器人服务CBS,请从下拉框中选择“华为云CBS”。 应用名称 用户根据实际情况自定义即可。 问答机器人ID CBS控制台的“智能问题机器人”页面中,问题机器人列表中“问题机器人名称/ID”列的ID值。界面详情请参见图3。 委托站点
String 批次名称 output_language 否 String 模型输出语言类型 custom_text 否 String 自定义试听文本 响应参数 状态码: 200 表4 响应Body参数 参数 参数类型 描述 job_id String 任务id。 training_data_uploading_url
String 批次名称 output_language 否 String 模型输出语言类型 custom_text 否 String 自定义试听文本 响应参数 状态码: 200 表4 响应Body参数 参数 参数类型 描述 job_id String 任务id。 training_data_uploading_url