检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
场景说明 创建智能交互数字人(华为云CBS) 创建智能交互数字人(科大讯飞) 创建智能交互数字人(奇妙问) 创建智能交互数字人(第三方语言模型) 创建智能交互数字人(二次开发场景) 智能交互公共配置
资产管理 如何接收并激活声音和分身模型资产?
照片建模 照片建模任务创建失败是什么原因? 照片建模任务出现异常问题怎么办? 风格化照片建模的照片有什么要求? 风格化照片建模生成的模型文件是什么格式? 表情驱动数据格式如何定义? 肢体驱动数据格式如何定义?
{0} 请重试,如果失败请联系技术支持 MSS.47000013 model file down fail 请检查人物模型资产文件是否存在,不存在请更换人物模型,如果存在请联系技术支持 MSS.47000014 background file down fail 请检背景图片资产
第三方逻辑智能训练版 FLEXUS: Flexus版---用的是大模型特征提取 job_id String 任务id。 app_user_id String 用户id。 voice_name String 音色名称。该名称会作为资产库中音色模型资产名称。 sex String 性别。 FEMALE:
BUSINESS_CARD_TEMPLET: 数字人名片模板 3D数字人资产: HUMAN_MODEL:3D数字人模型 SCENE:场景模型 ANIMATION:动作动画 MATERIAL:风格化素材 NORMAL_MODEL: 普通模型 cover_url String 封面图片路径。 thumbnail_url
app_type Integer 对接第三方应用厂商类型。 说明: 0:科大讯飞AIUI;1:华为云CBS;2:科大讯飞星火交互认知大模型;5:第三方驱动;6:第三方语言模型;8:奇妙问 取值范围: 0-32 app_key String 应用的AccessKey或帐号。 robot_type
app_type Integer 对接第三方应用厂商类型。 说明: 0:科大讯飞AIUI;1:华为云CBS;2:科大讯飞星火交互认知大模型;5:第三方驱动;6:第三方语言模型;8:奇妙问 取值范围: 0-32 app_key String 应用的AccessKey或帐号。 robot_type
仅开启“委托语言交互服务(SIS)”后,才会展示“热词”配置。 数字人与用户进行智能交互对话时,语音识别不准确的专业词汇,可以作为热词反馈到语音模型,以提高语音识别的准确率。这里仅开启热词功能,实际的热词配置,请参见对话配置。 SIS委托站点 仅开启“委托语言交互服务(SIS)”后,才会展示“SIS委托站点”配置。
创建分身数字人模型训练任务 10次/秒 3次/秒 3次/秒 查询分身数字人模型训练任务列表 20次/秒 10次/秒 10次/秒 查询分身数字人模型训练任务详情 20次/秒 10次/秒 10次/秒 删除分身数字人模型训练任务 10次/秒 3次/秒 3次/秒 更新分身数字人模型训练任务 10次/秒
视频制作限制 视频制作配置 限制 视频制作剧本 一个视频制作剧本的场景数量不能超过50个。 一个视频制作剧本,仅支持使用一个数字人模型和一个音色模型。 文本驱动 每个单场景输入文字的数量不超过1万字。 所有场景输入文字的数量不超过10万字。 每个单场景如果包含语音合成标记语言SSML标签,文字数量需小于128K。
创建分身数字人模型训练任务 10次/秒 3次/秒 3次/秒 查询分身数字人模型训练任务列表 20次/秒 10次/秒 10次/秒 查询分身数字人模型训练任务详情 20次/秒 10次/秒 10次/秒 删除分身数字人模型训练任务 10次/秒 3次/秒 3次/秒 更新分身数字人模型训练任务 10次/秒
合自然,清晰度1080P。 智能交互根据客户需要,后台提供多种知识库配置,支持配置中英双语。 智能交互基于已有训练生成的数字分身形象模型和声音模型,结合知识库,可与用户进行实时对话。 用户购买路数越多,同时进行数字人交互对话的数量则越多。 资源超过有效期后将无法使用,建议开通自动续费功能。
内共同交流和活动。 图1 文本驱动 文本内容的操作说明如表1所示。 不同声音模型对表1中操作的支持情况有差异,所以如果表1中操作项置灰,说明当前声音模型不支持此操作。需要重新选择一个支持所需操作的声音模型进行设置。 表1 操作说明 操作 说明 插入停顿 将鼠标放在需要停顿的文字右
不是数字人的能力。 智能交互的主要功能是通过数字人与用户进行交互问答,也就是用户提问,数字人说出知识库返回的答案。数字人回答的内容,是由大模型或知识库返回的答案决定的。 6 数字人支持TTS和ASR吗? 已支持TTS(文本转语音),详见创建TTS异步任务。MetaStudio不提
单击资产卡片,进入资产详情界面,查看资产的全部信息,图片资产详情示例如图2所示。 编辑资产 单击资产卡片,在资产详情界面,单击“编辑”,修改资产信息。合成视频、声音模型、音乐等资产不支持编辑。 删除资产 只有未激活的资产才可删除。所以如果资产已激活,需先单击资产卡片中的“取消激活”,取消激活成功后,再在“
不是数字人的能力。 智能交互的主要功能是通过数字人与用户进行交互问答,也就是用户提问,数字人说出知识库返回的答案。数字人回答的内容,是由大模型或知识库返回的答案决定的。 6 数字人支持TTS和ASR吗? 已支持TTS(文本转语音),详见创建TTS异步任务。MetaStudio不提
第三方逻辑智能训练版 FLEXUS: Flexus版---用的是大模型特征提取 job_id String 任务id。 app_user_id String 用户id。 voice_name String 音色名称。该名称会作为资产库中音色模型资产名称。 sex String 性别。 FEMALE:
情况设置。 limit=60:一次可以查询的声音数据,可以根据实际情况设置。 asset_type=VOICE_MODEL:资产类型为音色模型。 asset_state=ACTIVED:资产为已激活状态。 asset_source=SYSTEM:系统资产。 voice_provi
声音授权签署文件。 操作步骤 登录MetaStudio控制台。 单击“声音制作”下方的“开始创建”,进入声音制作页面。 图1 定制声音 在“华为模型”页签,配置声音制作参数。 界面操作详情,如表1所示。 表1 界面操作说明 区域 说明 声音制作方式 选择“基础版声音制作”,音频格式为W