检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
Flexus支持通过API集成使用吗? 支持,详见接口创建分身数字人模型训练任务的is_flexus字段。 父主题: API和SDK使用
式返回。后一条通知中的text字段值包含前一条通知的内容。例如:第一条通知的text值为“你吃”,第二条新识别了“饭了么”,则第二条text值为“你吃饭了么”。 semanticRecognized的流式返回是分段式返回。后一条通知中的text字段值与前一条通知的内容是上下衔接关
com/v3.0/OS-USER/users 请求消息头 附加请求头字段,如指定的URI和HTTP方法所要求的字段。例如定义消息体类型的请求头“Content-Type”,请求鉴权信息等。 详细的公共请求消息头字段请参见表3。 表3 公共请求消息头 名称 描述 是否必选 示例 Host
华北-北京四:cn-north-4 华东-上海一:cn-east-3 project_id取值,详见获取项目ID。 认证鉴权 header需要增加X-Auth-Token字段用于鉴权。获取认证鉴权的方式,详见认证鉴权。 发送请求 发送请求的流程如下所示: 建立WebSocket连接。 发送TTS合成请求,详见请求参数。
、情绪以及TTS语音合成的多音字、停顿等。 SSML基础定义可参考语音合成标记语言版本 1.0。MetaStudio在此基础上,扩展了一些字段用于实现数字人的控制。 MetaStudio SSML当前支持如下能力: TTS语音合成时,控制文字读音。 包含如下标签: <speak>
重音位置要合理,避免错误的重音。 阅读发音 按顺序读,确保音字一致。避免漏字多字、发音错误、阅读不流畅等问题。如有这些问题,需重新录制。 内容要求 不能使用短音频复制拼接成长音频,会影响训练效果,无法通过审核。 录制提交 表3 录音内容提交规范 声音类型 音频说明 音频命名 基础版 需整段录制所有语料生成一
下述智能交互客户端SDK的两个方法的配置字段enableCaption,默认值均为False,即用户自定义富媒体的展示效果。如果需要使用SDK提供的默认展示效果,需修改参数enableCaption的值为true。 修改create方法中param参数的config配置项,即修改是否显示字幕字段enableCaption的值为true。
持不变。 interruptSpeaking:支持中断数字人讲话。 jobInfoChange通知新增websocketAddr参数,用来拼接三方驱动场景websocket请求URL。 更新字幕列表头像。 SDK心跳超时支持自动恢复。 解决vue2脚手架引入SDK报错问题。 解决部分BUG,优化部分错误提示。
jobInfo:JobInfo类型。字段定义如表3所示。 表3 JobInfo 参数 类型 描述 jobId string 任务ID。 websocketAddr string | undefined 智能交互服务端websocket地址,三方驱动场景用来拼接websocket链接。 须知:
是否必选 参数类型 描述 tag 否 String 参数解释: 事件内容关键字段 说明: event_type为1,2,3,4:与LiveEventReport中event.content中反序列化后的JSON字段对应。如:弹幕事件上报事件。 { "timestamp": 1694481224245
HitConditionTag 参数 参数类型 描述 tag String 参数解释: 事件内容关键字段 说明: event_type为1,2,3,4:与LiveEventReport中event.content中反序列化后的JSON字段对应。如:弹幕事件上报事件。 { "timestamp": 1694481224245
申请开通后展示。 开通成功后,仅华为云账号下展示“子账户隔离配置”菜单,IAM子账户均不展示。 注意事项 如果华为云账号已通过API接口字段“X-App-UserId”自定义资产隔离能力。那么: 开启IAM子账户隔离能力后,自定义隔离能力全部失效,默认为通过IAM子账号进行资产隔离。
script_id String 参数解释: 剧本ID。 约束限制: 该字段无需填写。 取值范围: 字符长度1-64位。 默认取值: 不涉及。 script_name String 参数解释: 剧本名称。 约束限制: 该字段必须填写。 取值范围: 字符长度1-256位。 默认取值: 不涉及。
产类型,本次示例选择“IMAGE”。其他参数配置,请参见创建资产参数说明。 如果状态码返回200,说明创建资产接口调用成功,需要记录下返回字段asset_id(资产ID)的值。 图1 接口页面 在左侧导航栏中选择“文件管理 > 创建文件并获取上传URL”。 如果上传的资产文件大小
任务状态,默认所有状态。 可多个状态查询,使用英文逗号分隔。 如state=CREATING,PUBLISHED sort_key 否 String 排序字段,支持的排序方式有: 按创建时间排序:create_time 按更新时间排序:update_time 按资产排序:asset_order sort_dir
script_id 否 String 参数解释: 剧本ID。 约束限制: 该字段无需填写。 取值范围: 字符长度1-64位。 默认取值: 不涉及。 script_name 是 String 参数解释: 剧本名称。 约束限制: 该字段必须填写。 取值范围: 字符长度1-256位。 默认取值: 不涉及。
智能交互服务端websocket地址,三方驱动场景用来拼接websocket链接。 须知: 参数返回的地址默认无wss://前缀,实际使用时,需要补齐前缀。示例:如果返回字段内容为metastudio-api.cn-north-4.myhuaweicloud.com:443,则需要拼接为wss://metastudio-api
script_id 否 String 参数解释: 剧本ID。 约束限制: 该字段无需填写。 取值范围: 字符长度1-64位。 默认取值: 不涉及。 script_name 是 String 参数解释: 剧本名称。 约束限制: 该字段必须填写。 取值范围: 字符长度1-256位。 默认取值: 不涉及。
取值方式为:secret=hmac_sha256(URI(llm_url) + timestamp, appKey)&time_stamp=hex(timestamp)。 字段含义如下所示: llm_url:为创建智能交互数字人中“第三方语言模型地址”参数的取值,即第三方LLM自定义接口地址。 appKey:为创
3339 如"2021-01-10T08:43:17Z" sub_resource 否 String 子资源类型。当前只有flexus套餐包存在该字段 voice_clone_flexus: 语音克隆Flexus版 modeling_count_2d_model_flexus: 分身数字人形象制作Flexus版