检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
持文本驱动和语音驱动的方式说话。 5 数字人支持提供语义理解知识库吗? 不提供语义理解知识库。语义理解是知识库的能力,不是数字人的能力。 智能交互的主要功能是通过数字人与用户进行交互问答,也就是用户提问,数字人说出知识库返回的答案。数字人回答的内容,是由大模型或知识库返回的答案决定的。
ljzn_min Integer 逻辑智能最低时长(秒) 取值范围: 0-2147483647 ljzn_max Integer 逻辑智能最高时长(秒) 取值范围: 0-2147483647 ljzn_advice_value Integer 逻辑智能建议时长(秒) 取值范围: 0-2147483647
视频直播不支持透明背景设置,仅视频制作和智能交互支持。 直播任务退出说明 直播任务退出说明,如表2所示。 表2 直播任务退出说明 直播任务退出场景 操作说明 租户自行退出直播任务 租户可通过下述方式,退出直播任务。 在MetaStudio控制台开播页面,停止直播任务。 调用结束数字人智能直播任务接口,停止直播任务。
text 是 String 台词脚本。取值最小长度1,最大长度131072。 支持如下两种模式: 纯文本模式 使用纯文本,示例:大家好,我是人工智能小A,是位虚拟主播。 标签模式 标签模式使用SSML(Speech Synthesis Markup Language)标记语言。 需要使用的标签,如下所示:
量在减少。 各IAM用户资产共享:即每个IAM用户上传的资产、制作的形象和声音资产(包括制作任务)、合成的视频(包括剧本和任务)、直播间,智能交互项目等,全部可共享使用。 前提条件 MetaStudio控制台默认不展示“子账户隔离配置”菜单,需提交工单,并提供当前华为云账号所在R
著降低技术门槛,且购买简单,为中小企业提供超简单、超高性价比数字人。 使用限制 Flexus分身数字人目前仅支持视频制作,不支持视频直播和智能交互。 产品特性 轻量规格 购买简单,一次下单即可完成形象、声音和视频制作资源的购买。针对额外需求,支持客户选择不同档位套餐包进行充值。 极简体验
属性类型 属性值 是否必选 描述 interpret-as String number:数字 date:日期 figure:数值 phone:电话号码 english:英文单词 spell:逐个字母读英文 是 将内容解释为给定类型读法。 标签关系 可以包含文本,不可以包含其他标签。 示例
ASSET_MANAGER:资产管理 MODELING_2D:形象制作 LIVE_2D:分身数字人视频直播 VIDEO_2D:分身数字人视频制作 CHAT_2D:分身数字人智能交互 BUSINESS_CARD_2D:分身数字人名片 PICTURE_2D:照片数字人视频 MODELING_3D:3D照片建模 VDS_3D:3D视觉驱动
高品质:约5个工作日。 自定义声音应用方式,如下所示: 自定义声音生成后,会自动展示在MetaStudio控制台声音列表中,可用于分身数字人视频制作、视频直播或智能交互等场景中。 通过MetaStudio的API调用自定义声音。 父主题: 声音制作
进阶版(100句话) ADVANCE: 高级版 THIRD_PARTY: 第三方出门问问训练版 THIRD_PARTY_LJZN: 第三方逻辑智能训练版 FLEXUS: Flexus版---用的是大模型特征提取 batch_name 否 String 批次名称。 sort_key 否
ASSET_MANAGER:资产管理 MODELING_2D:形象制作 LIVE_2D:分身数字人视频直播 VIDEO_2D:分身数字人视频制作 CHAT_2D:分身数字人智能交互 BUSINESS_CARD_2D:分身数字人名片 PICTURE_2D:照片数字人视频 MODELING_3D:3D照片建模 VDS_3D:3D视觉驱动
is_realtime_voice 否 Boolean 音色是否支持实时合成。仅在音色查询时有效。 说明: 支持实时合成的音色,可以用于直播和智能交互场景。否则只能用于视频制作。 human_model_2d_version 否 String 模型版本 include_device_name
赠品库存有限,咱先到先得! 这波赠品库存仅剩最后几单,全凭手速,手快有手慢无! 你再犹豫你再纠结,就被拍完、就被抢完了哈! 有任何问题都可以直接来直播间找到客服的,我们做到售后无忧有保障。 现在在直播间下单的宝子,主播都可以帮你安排明天提速发货的。 新进直播间的宝宝们,动动你们的小手给主播点点赞,点赞过万就抽奖
说明操作,就可以详细了解了。 音频:从本地上传一个音频文件,支持MP4、WAV和M4A格式。当命中此规则后,使用此音频进行回复。 智能交互:通过智能交互的方式回复用户问题,相当于提供了一个第三方语言模型去答复用户问题。 回复问题的时候,支持同时在直播画面中展示图片或者视频信息,以
of strings 支持的业务类型。: VIDEO_2D:分身数字人视频制作 LIVE_2D:分身数字人直播 CHAT_2D:分身数字人智能交互 表4 ReviewConfig 参数 是否必选 参数类型 描述 no_need_review 否 Boolean 免审核。 目前仅白
of strings 支持的业务类型。: VIDEO_2D:分身数字人视频制作 LIVE_2D:分身数字人直播 CHAT_2D:分身数字人智能交互 表5 AssetExtraMeta 参数 参数类型 描述 human_model_meta HumanModelAssetMeta object
全局生效,可参考配置特殊词表配置。 数字英文 示例数字“1024”的读法如下所示: 数字:一零二四 数值:一千零二十四 日期:十月二十四 电话:幺零二四 示例英文“API”的读法如下所示: 字母:API 单词:api 音标 选中英文单词,输入合适的音标。 局部语速 选中需要变速播报的文本,设置局部语速。
of strings 支持的业务类型。: VIDEO_2D:分身数字人视频制作 LIVE_2D:分身数字人直播 CHAT_2D:分身数字人智能交互 表4 ReviewConfig 参数 是否必选 参数类型 描述 no_need_review 否 Boolean 免审核。 目前仅白
chat_video_start_time String 选取推理数据预处理智能交互视频起始时间。格式:“HH:MM:SS.mmm”。 chat_video_end_time String 选取推理数据预处理智能交互视频结束时间。格式:“HH:MM:SS.mmm”。 表11 InferenceActionMarkInfo
ue值有不同的读法,详情如下所示。 数字的读法包括: date:读日期 number:读数字 figure:读数值 telephone:读电话 英文的读法包括: spell:读字母 english:读单词 key 否 String 原始词。 value 否 String 自定义读法。其中,音标的读法请参考词典。