检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
使用SP用户登录华为云控制台,单击界面左上角的图标,在弹出的服务列表界面中,搜索并单击“数字内容生产线 MetaStudio”服务,进入MetaStudio服务概览页面,如图1所示。 图1 服务概览页面 在左侧导航栏中,单击“资源管理”,进入“资源管理”页面,如图2所示。 图2 资源管理
覆盖了教育、医疗、广电传媒和电商等多个行业场景。中小企业对换背景诉求较低,Flexus版可短平快地解决客户应用需求,助力企业在数字化竞争中取得优势。 教育领域 数字人技术的重要应用之一。在教育行业,分身数字人可用于教育、培训机构平台、企业内部培训、IP知识视频宣传等。 通过分身
查看分身数字人定制任务审核进展。当前状态为“系统审核中”,需要等待服务管理员审核通过后,状态变更为“待算法训练”。 如果数字人定制任务被驳回,需要查看驳回原因,并重新按照要求录制视频并上传。 操作步骤详情如下所示: 在服务主界面,单击左侧导航栏中的“任务中心”。 查看“分身数字人”页签的数
(可选)开启闲聊功能:闲聊功能可以丰富数字人问答内容,如:天气、旅游、假期等日常闲聊信息。 需要在应用中,依次完成下述配置 开启讯飞闲聊功能,即开启“兜底设置”及其下的“讯飞闲聊”。 配置热词。 配置可用于闲聊的预置技能。 新增设备人设,并在应用中启用人设。 目前仅支持开启“播报类”的闲聊技能,即有“播报类”标识的技能。
对话项目”页面,单击智能交互对话项目右侧的“复制URL和激活码”,可以将URL和激活码分享给其他用户使用。 详细操作如下所示: 复制URL至浏览器中,进入“智能交互激活”页面。 复制激活码至激活码框中,单击“立即激活”。 完成验证并等待加载完成,即可开始对话。 图3 智能交互对话项目 父主题: 创建智能交互数字人(科大讯飞)
企业联邦虚拟用户,不支持修改资产归属。 操作步骤 登录MetaStudio控制台。 单击界面左上角的“服务概览”,进入MetaStudio服务概览页面。 在左侧导航栏中,选择“资产归属分配”,进入“资产归属分配”页面。 可以看到所有资产的名称/ID、类型、归属账号名称/ID和更新时间。 找到需要修改归属的资
剧本封面下载url。 表5 VoiceConfig 参数 参数类型 描述 voice_asset_id String 参数解释: 音色资产ID,可以从资产库中查询。 音色ID的查询操作,详见查询预置音色ID。 约束限制: 不涉及。 取值范围: 字符长度1-256位。 默认取值: 不涉及。 speed
务详情”页面,如图4所示。 查看分身数字人定制任务审核进展,当前状态为“系统审核中”。数字人定制任务提交成功后,会在1个工作日内完成审核。 图4 定制任务详情 审核通过后,任务状态变更为“算法训练中”,如图所示。 数字人定制任务审核通过后,启动算法训练,会在3个工作日内训练完成并生成数字人。
终端节点地址从接口启动数字人智能交互任务的响应参数chat_access_address中获取。 通过WEB SDK调用场景 终端节点地址从智能交互SDK的通知jobInfoChange的参数websocketAddr中获取。 功能介绍 该接口用于创建用户与数字人对话的WebSocket连接,驱动数字人对话。
String 音色资产ID,可以从资产库中查询。 introduction_audio_asset_id 否 String 自我介绍语音资产ID,用于驱动数字人口型。 说明: 介绍语音需要作为asset_type=AUDIO资产先上传至资产库。 使用时从资产库中查询。 video_asset_name
cn-east-3.myhuaweicloud.com robotId 否 - string 智能交互活动ID,为参数“taskUrl”取值URL中携带的robot_id参数的值。 示例,如果URL为“https://metastudio-api.cn-north-4.myhuaweicloud
预防和治理网络暴力是一个需要全社会共同关注和解决的庞大课题, 除了平台方需要倾注努力,还需监管部门、用户、媒体等多方主体的协作支持、共同参与。 在一场网络暴力事件中,用户可能是直接施暴者、直接或间接传播者,也可能是受害者。 用户应注重规范自身“文明上网”的行为习惯, 严守言论自由的义务边界,提高对于网络暴力行为的识别能力,
String 音色资产ID,可以从资产库中查询。 introduction_audio_asset_id 否 String 自我介绍语音资产ID,用于驱动数字人口型。 说明: 介绍语音需要作为asset_type=AUDIO资产先上传至资产库。 使用时从资产库中查询。 video_asset_name
操作前提 开通MetaStudio服务,如下所示: 注册华为账号:单击进入注册页面。 完成实名认证:单击进入实名认证。 账户充值:为确保正常使用MetaStudio,您需要进行账户充值。 开通MetaStudio服务:单击进入MetaStudio控制台,根据开通引导完成服务开通。
场地布置 背景:使用颜色均匀、无破损、无褶皱的绿幕背景。 灯光:使用均匀、稳定的光照,标准日光色色温。保证拍摄者光线充足,面部无阴影。录制过程中光线不发生显著变化。 机位:相机与人物眼神平齐,对焦于面部区域,确保面部清晰不失焦;建议竖拍,效果更佳。 收音:保证环境安静无噪声、无回声,避免其他人声干扰。
音频格式支持WAV、MP3,单段音频时长1~5分钟,建议1分钟。语料中的语言仅支持中文和英文。 视频中提取声音:直接提取训练视频中的声音,训练生成Flexus声音。 视频中的语言仅支持中文和英文。 须知:“单独上传语料包”的方式生成Flexus声音的效果会更好。 数字人名称 生成的Flexus数字人名称。
SYSTEM_AUDITING: 系统审核中 AUDITING: 人工审核中 WAITING_SPLIT: 等待切割 SPLITTING: 切割中 SPLIT_FAILED: 切割失败 ANNOTATING: 标注中 WAITING: 等待训练 PROCESSING: 任务训练中 RESULT_REVIEW:
auth_type 否 String 参数解释: 认证类型。 约束限制: 不涉及。 取值范围: NONE:URL中自带认证。 MSS_A:HMACSHA256签名模式,在URL中追加参数hwSecret、hwTime。 取值方式:hwSecret=hmac_sha256(Key, UR
VoiceConfig 参数 是否必选 参数类型 描述 voice_asset_id 是 String 参数解释: 音色资产ID,可以从资产库中查询。 音色ID的查询操作,详见查询预置音色ID。 约束限制: 不涉及。 取值范围: 字符长度1-256位。 默认取值: 不涉及。 speed
文本驱动,即通过TTS合成语音 AUDIO: 语音驱动,需要在资产库中先上传语音资产 默认取值: TEXT introduction_text String 自我介绍文本,用于驱动数字人口型。 voice_asset_id String 音色资产ID,可以从资产库中查询。 introduction_audio_asset_id