正在生成
详细信息:
检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
无法保存剧本怎么办? 剧本保存失败时,请您根据界面提示信息进行问题定位及修改。 提示“剧本名称包含非法字符” 请您根据要求修改剧本名称中的敏感字符。 提示“包含敏感词汇” 可能是讲解词中包含敏感词汇,去除讲解词中的敏感词汇即可。 提示“演示素材不存在或不可用” 请您检查选择的素材是否已激活。
speechRecognized的流式返回是覆盖式返回。后一条通知中的text字段值包含前一条通知的内容。例如:第一条通知的text值为“你吃”,第二条新识别了“饭了么”,则第二条text值为“你吃饭了么”。 semanticRecognized的流式返回是分段式返回。后一条通知中的text字段
fo 参数 类型 描述 text string 识别结果文本。 questionText string 问题文本。 resultId number 识别流式响应时返回的各包顺序序号。 isLast boolean 是否是最后一条识别结果。 chatId string 对话ID,每轮问答的ID值唯一。
如在科大讯飞创建同名技能后,导入技能文件所示。为方便识别和记忆,两边的技能名称可以设置成一样的。 技能标识:技能标识。必须与科大讯飞创建的技能标识,保持一致,如在科大讯飞创建同名技能后,导入技能文件所示。否则用户命中问题,也无法获取到对应的答案。 支持用户最多创建100个技能。 图4
传至服务器进行统计分析。处理的个人信息包括应用信息(浏览器User Agent)、SDK接口调用记录。上述信息不会与您个人身份关联,我们无法识别您的身份。 设备权限调用 当您使用相应功能及服务时,我们会通过客户应用向系统申请您设备的相应权限。您可以在客户应用或浏览器的设置功能中查
部分浏览器提交H265训练视频失败如何处理? 问题描述 制作分身形象时,上传的训练视频无法播放,或提交训练任务时,提示分辨率不符合要求,如下图所示。 图1 分身形象制作 问题原因 由于Chrome等浏览器只支持硬解码H265(HEVC)视频,当您的PC硬件不支持解码H265(HE
结果返回操作。 将视频图片输入至算法模型中,将视频图像分割为面部、手部和身体三个区域。 使用深度学习算法,识别面部区域转化为面部表情,识别手部区域转化为手部骨骼驱动数据,识别身体转化为人体骨骼驱动数据。 对算法输出系数进行平滑处理及异常数据过滤,返回结果。 算法应用场景 数字人视
“一次性计费”的产品,需要激活后,才能使用。需要一年以内完成激活,否则无法再激活使用。激活后有效期为一年。 按需套餐包和包周期(包年包月)的产品,无需激活,直接使用。必须在有效期内使用完成,超过有效期后,资源将无法再使用。 表1 资源类型 服务类型 产品分类 计费模式 分身数字人 分身数字人形象制作
所示。租户的项目ID必须与SP用户申请成为SP用户时,提供的项目ID所在Region保持一致。 租户名称:输入自定义租户名称,方便SP用户识别租户身份即可。 图2 关联租户 单击“创建”,租户创建完成,如图3所示。 图3 租户列表 如需取消关联,可单击右侧的“取消关联”,在弹出的
系统会对用户的提问音频进行检测,如果一句话末尾的静音时长超过500ms,会结束语音识别。 建议取值大于500ms。 热词 数字人与用户进行智能交互对话时,语音识别不准确的专业词汇,可以作为热词反馈到语音模型,以提高语音识别的准确率。 单击热词后面的问号图标,在提示框中单击“查看教程”,可以查看配置视频。
单击“应用配置”界面右上方的“保存修改”。 界面提示“保存成功”,说明应用配置页面的修改已生效。 配置热词。 展开“语音识别”下方的“高级设置”,如图9所示。 图9 应用配置 在“识别热词”区域,单击“下载热词模板”,将模板下载至本地。 本地打开模板文件,按照模板提示,输入需要添加的热词,示例如下所示:
创建分身数字人定制任务 MetaStudio服务已预置多个数字人形象,可在视频制作界面或直播间界面查看。如果预置形象无法满足用户的需求,可以参考本节操作,自定义生成分身数字人。 注意事项 MetaStudio不支持个人用户定制形象,仅支持企业用户。 定制分身形象时,从平台下载的授
单击“应用配置”界面右上方的“保存修改”。 界面提示“保存成功”,说明应用配置页面的修改已生效。 配置热词。 展开“语音识别”下方的“高级设置”,如图15所示。 图15 应用配置 在“识别热词”区域,单击“下载热词模板”,将模板下载至本地。 本地打开模板文件,按照模板提示,输入需要添加的热词,示例如下所示:
定提醒等。 163. 家用机器人还具备语音识别和语音回应功能,让您能够与机器人进行流畅的对话和交流。 164. 视觉交互:家用机器人配备了先进的摄像头和视觉传感器,可以通过图像识别和视觉感知与您进行交互。 165. 例如,机器人可以识别家庭成员的面孔、手势和身体姿势,并做出个性化的反应和服务。
行账户充值。 开通MetaStudio服务:单击进入MetaStudio控制台,根据开通引导完成服务开通。 IAM权限管理 如果华为云账号无法满足用户的使用诉求,可参考创建用户并授权使用MetaStudio,创建IAM用户,进行精细化的权限管理。 推荐浏览器 推荐使用Chrome浏览器访问MetaStudio控制台。
2e7", "voice_config" : { "voice_asset_id" : "394f3a27cd0b3d6164ca75c3db1edf6c", "speed" : 100, "pitch" : 100, "volume" : 140
发音吐字清晰、准确,音量适中。如果出现喷麦或嘶嘶声音,建议当前句子重新录制。 语速节奏 语速自然、平稳,切忌过快过慢、忽快忽慢。 音量适中 音量不能过小、过大、或忽大忽小,甚至削波爆音。峰值RMS在-9左右,无削波。 停顿断句 在标点或适当断句处自然停顿,需轻声换气。 当录制一个长音频文件时,每句之间需要有2~3秒的停顿。
创建声音制作任务(华为模型) MetaStudio已经预置了各种类型的声音,可以在视频制作界面或视频直播界面查看。如果预置声音仍无法满足用户需求,可使用华为模型自定义生成声音。 操作限制 MetaStudio不支持个人用户定制声音,仅支持企业用户。 定制声音时,从平台下载的授权书
制台的视频直播间编辑界面或智能交互对话设置页面,选到当前音色。 如果界面正常展示且可以选择此音色使用,说明接口可以正常调用此音色,否则接口无法调用。 API流控 数字内容生产线服务对服务端API设置了调用次数限制,避免出现短时间内重复调用API,服务中断的情况。 表1 API流控限制
制台的视频直播间编辑界面或智能交互对话设置页面,选到当前音色。 如果界面正常展示且可以选择此音色使用,说明接口可以正常调用此音色,否则接口无法调用。 API流控 数字内容生产线服务对服务端API设置了调用次数限制,避免出现短时间内重复调用API,服务中断的情况。 表1 API流控限制