检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
String 参数解释: 直播事件回调地址,为https地址。 约束限制: 不涉及。 取值范围: 字符长度0-2048位。 默认取值: 不涉及。 auth_type String 参数解释: 认证类型。 约束限制: 不涉及。 取值范围: NONE:URL中自带认证。 MSS_A:HMAC
API和SDK使用 如何调用MetaStudio接口? 如何获取项目ID? Flexus支持通过API集成使用吗?
、时间和烹饪方式等参数。 它们还可以通过自然语言处理技术理解您的需求,根据您的口味偏好自动调整烹饪参数。 智能机器人还可以与智能烤箱、智能冰箱等,实现更加智能化的烹饪模式。 智能机器人可以根据您的口味和需求,自动烹饪美食。 智能机器人可以通过识别您所使用的食材,提供有关这些食材的营养信息和食谱建议。
String 参数解释: 直播事件回调地址,为https地址。 约束限制: 不涉及。 取值范围: 字符长度0-2048位。 默认取值: 不涉及。 auth_type String 参数解释: 认证类型。 约束限制: 不涉及。 取值范围: NONE:URL中自带认证。 MSS_A:HMAC
String 参数解释: 直播事件回调地址,为https地址。 约束限制: 不涉及。 取值范围: 字符长度0-2048位。 默认取值: 不涉及。 auth_type String 参数解释: 认证类型。 约束限制: 不涉及。 取值范围: NONE:URL中自带认证。 MSS_A:HMAC
优惠”。 服务扫描弹幕的时候,如果扫描到此关键词,自动回复当前互动内容。 回复方式 选择主播或助播进行回复,具体回复内容支持通过下述方式设置。 文本:通过文本方式设置回复内容,最多可增加5条回复。直播间开播后按照触发次数,从前往后依次命中答复,每次仅回复一条文本内容。 示例:关于
约束限制: 不涉及。 取值范围: 字符长度1-256位。 默认取值: 不涉及。 speed Integer 参数解释: 语速。50表示0.5倍语速,100表示正常语速,200表示2倍语速。 当取值为“100”时,表示一个成年人的正常语速,约为250字/分钟。 约束限制: 不涉及。 取值范围:
入剧本,平台自动解析输入内容。 直播剧本包含下述设置: 剧本驱动 支持下述三种方式任选其一: 文本驱动:输入文本,通过文本驱动数字人说话。 音频驱动:上传音频,通过音频驱动数字人说话。 即兴直播:无需设置剧本,直接开播。开播后数字人是不说话的,需要发送互动内容,或者开启真人接管,驱动数字人说话。
系统审核未通过 AUTO_VERIFY_FAILED: 自动审核失败 MANUAL_VERIFY_FAILED: 人工审核失败 算法训练中 说明: 算法训练中的状态仅管理员需要处理,普通用户仅需要显示“算法训练中”即可。 MANUAL_VERIFY_SUCCESS: 审核通过,等待预处理资源
高度拟真的虚拟人。 具备如下特点: 2D模型,通过拍摄真人视频训练生成 无表情&骨骼数据 只能由AI驱动 使用既定表情&动作 IP型数字人:由计算机图形学技术创造出来的与人类形象高度接近的数字化形象。 具备如下特点: 3D模型,通过艺术设计生成 有表情、骨骼数据 可由真人动作驱动
登录MetaStudio控制台。 在左侧导航栏中,单击“我的创作”。 选择“资源”页签,如图1所示。 图1 资源页面 如果需要删除已激活的资产,可以通过下述2种方式删除。 方式一:单击资产卡片中的“取消激活”。取消激活成功后,在“未激活”页签中,单击卡片中的图标,从下拉框中选择“删除”,删除资产。
关键词搜索框,可输入数字人名称进行精准搜索。 示例:yun lan。 刷新图标。如果有关键词,按照关键词进行刷新展示;如果没有关键词,恢复为默认展示。 筛选条件 支持通过角色、性别、姿势、行业、区域和分辨率的维度,筛选展示下方的数字人。 数字人列表 默认展示全量数字人。单击数字人形象,自动替换更新至视频直播的当前场景中。
示在“我的创作 > 分身名片”页面。 用户在控制台进行智能交互操作,生成的对话项目和技能,会展示在“我的创作 > 智能交互”页面。 一类是通过本地上传或者接收资产管理员转移的资产生成的,会展示在“我的创作 > 资源”页面。 父主题: 资产管理
单击“提交制作”。数据上传完成后,界面提示“制作任务提交成功!”,如图3所示。 数字人定制任务提交成功后,会在1个工作日内完成审核。任务审核通过后,才能进行算法训练,会在3个工作日内训练完成并生成数字人。 图3 制作任务提交成功 Flexus分身数字人训练任务提交后,会同时生成一个
请求Header参数 参数 是否必选 参数类型 描述 X-Auth-Token 否 String 用户Token。使用Token鉴权方式时必选。 通过调用IAM服务获取用户Token接口获取。 响应消息头中X-Subject-Token的值。 Authorization 否 String
取方式,如表1所示。 表1 终端节点获取方式 场景 获取方式 未通过WEB SDK调用场景 终端节点地址从接口StartSmartChatJob.xml的响应参数chat_access_address中获取。 通过WEB SDK调用场景 终端节点地址从智能交互SDK的通知jobI
播爆,在软件首页,我们可以看到有很多数字人模特可以直接选,男女都有 也可以根据地区来选择,像欧美亚洲模特都有,各种肤色模特都有,或者你可以通过商务、休闲的场景去挑选适合的数字人。 解决完模特问题,我们接下来就要处理文案问题。 万兴播爆针对文案也提供了三个AI功能,分别是智能脚本、AI文本翻译,甚至是AI视频翻译。
音可以使用flexus声音或标准版声音。标准版视频制作,不支持使用flexus形象或声音。 Flexus数字人与标准版数字人的视频制作资源不共享,分开计费。 按需计费 按需预付费套餐包 一次性计费 分身数字人形象制作 按分身数字人形象制作的个数计费。 每成功制作1个分身数字人形象,从所购预付费资源包中扣除1个。
“剧本驱动”包含3种方式: 文本驱动 需要通过文本驱动数字人说话。支持下述2种方式,增加文本内容。 直接在各个场景的段落框中输入文本内容。可单击图标,新增更多的段落。 单击右上方的“导入”,从本地导入不少于200字的txt文件。如果多个段落,可通过换行来实现,平台会自动解析输入内容。 手工输入文本示例,如下所示:
支持的格式为:MP3、WAV。 大小不超过20MB,时长不超过5分钟。 文本驱动 文本驱动方式的要求如下所示: 文本输入长度不超过2000字。 通过文本合成的音频时长不能超过5分钟。 在照片数字人制作页面,选择“文本驱动”方式驱动照片说话时,需要输入文本并选择音色,再单击“试听”预估音