检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
选择AI模型。不同模型需要配置的参数数量不同,其中,高阶模型需要配置的参数最多。 包含如下选项: 初阶模型 中阶模型 高阶模型 多轮对话 是否开启多轮会话。 如果开启,会根据上下文的信息进行语义理解,以生成连贯的对话。 业务ID 仅特殊定制的业务模型需要配置。 所在城市 智能交互面向的城市。
在左侧导航栏中,选择“租户管理”,进入“租户列表”页面,如图2所示。 图2 租户列表 单击租户名称右侧的“分配”,弹出“分配资源”对话框,如图3所示。 用户需要参考表1进行配置,如果需要分配多种资源类型,可单击右侧的图标,新增资源行。 图3 分配资源 表1 参数说明 参数 说明 请选择资源类型 从下拉框中选择已购买的资源类型。
分身数字人视频制作限制说明,如表1所示。 表1 视频制作限制 视频制作配置 限制 多场景配置 每个单场景,如果通过“文本驱动”方式生成语音时,所有段落汇总的文字数量需大于200字。 每个单场景,如果通过“音频驱动”方式生成语音时,每个音频时长需大于1分钟。 文本驱动配置 通过“文本驱动”方式生成语音时,对应的文本要求,如下所示:
单击界面右上方的“添加凭证”,弹出“购买序列号”对话框,如图8所示。 参数配置说明,如表1所示。 图8 购买序列号 表1 参数说明 参数 说明 主体 购买出门问问声音套餐中购买套餐包的归属主体,从下拉框中选择“出门问问”。 访问配置accessKey 出门问问需要配置为资源详情界面的“用户账号”,如获取第三方声音使用凭证-步骤2所示。
问答交互次数,请参考本节操作,订购套餐包。 操作步骤 在界面上方的主菜单中,单击“我的应用”。 单击应用所在行的图标,进入当前应用的“应用配置”页面。 在左侧导航栏中,单击“服务统计”,进入“服务统计”页面,如图1所示。 通过下图可以看出,科大讯飞免费赠送500次/天的问答交互。
这里设置的多音字,仅对当前视频草稿有效,如需全局生效,可参考配置特殊词表配置。 别名 选中需要通过别名播报的文本内容 ,单击“别名”,设置为实际播报的内容。 须知: 这里设置的别名,仅对当前视频草稿有效,如需全局生效,可参考配置特殊词表配置。 数字英文 示例数字“1024”的读法如下所示:
选中左侧的互动库,单击界面右侧的“新建”,弹出“新建互动”对话框,如图3所示。 可以给当前互动库,新增1条互动规则。参数配置说明,如表1所示。 图3 互动规则 表1 互动规则配置说明 参数 说明 类型 互动类型。 包含如下选项: 弹幕 用户入场 点赞 送礼 互动名称(可选) 互动名称。 触发方式
m4a,主文件大小不超过100M 音频资产:资产类型为AUDIO,主文件格式(忽略大小写)为wav,mp3,m4a,主文件大小不超过100M 调用方法 请参见如何调用API。 URI POST /v1/{project_id}/digital-assets 表1 路径参数 参数 是否必选 参数类型 描述
口确认语音和文本内容是否一致。确认成功后再上传和确认下一句。 文件上传后,调用“提交语音训练任务”接口,启动审核和训练。 调用方法 请参见如何调用API。 URI POST /v1/{project_id}/voice-training-manage/user/middle-jobs
口确认语音和文本内容是否一致。确认成功后再上传和确认下一句。 文件上传后,调用“提交语音训练任务”接口,启动审核和训练。 调用方法 请参见如何调用API。 URI POST /v1/{project_id}/voice-training-manage/user/basic-jobs
展示,建议将PPT转存为PDF文件后再导入。 操作详情请参考PPT如何转为PDF文件?。 如果PPT中有动画、动效,是不支持在MetaStudio控制台展示的,建议将PPT导出为视频后再导入。 操作详情请参考如何在MetaStudio控制台呈现PPT的动画效果?。 界面默认展示两
照片数字人限制 照片数字人视频制作限制说明,如表1所示。 表1 照片数字人视频制作限制 照片数字人视频制作配置 限制 人像照片 制作照片数字人的人像照片拍摄要求,如下所示: 真人正面照,不支持动漫卡通形象;面部占比50%以上,侧脸俯仰角度不超过15度。 五官清晰无遮挡,目视前方。
视频制作 使用数字人形象,设置画布、音频,合成视频。 适用于各类培训、宣讲、知识分享等场景。 视频直播 使用数字人形象,设置画布、剧本、互动和开播配置,生成直播视频。 可在合作的第三方平台进行数字人视频直播,如淘宝、拼多多、抖音等。 智能交互 包含下述功能实现场景: 支持开箱即用的智能交互数字人。
目前MetaStudio提供了Java、Python和Go语言SDK供开发者使用,如表1所示。您可以在GitHub仓库查看SDK更新历史、获取安装包以及查看指导文档。 SDK已知安全漏洞及修复版本、规避方案,请单击表1中的SDK对应语言的Github地址进行查看。 表1 服务端SDK
常见问题 智能交互SDK安装包里为什么有图片资源? SDK里面包含图片资源,是因为智能交互的动效、背景可能需要图片资源才能展示更好的效果。所以智能交互Web SDK为了方便用户集成使用,会同时包含UI相关资源。 speechRecognized和semanticRecognized通知的流式返回有什么差异?
! 为了感谢广大消费者,品牌现在特别推出限时优惠活动! 购买家用机器人,即可享受超值优惠!数量有限,先到先得! 只需一键下单,即可享受上门安装和贴心售后服务,让您无后顾之忧。 不要再犹豫了,现在是购买的最佳时机!限时优惠真的不容错过! 我们承诺,您在购买指定家用机器人后,将会享受到优质的售后服务和保障。
签,筛选展示所有的分身模型资产。 找到需要转移的资产,单击资产右下角的,从下拉框中选择“转移”,弹出“资产转移”对话框,如图2所示。 参数配置说明,如表1所示。 图2 资产转移 表1 参数说明 参数 说明 用户账号 需要接收资产的租户,其所在Region的项目ID,获取方法请参见获取项目ID。
声音授权签署文件。 操作步骤 登录MetaStudio控制台。 单击“声音制作”下方的“开始创建”,进入声音制作页面。 图1 定制声音 在“华为模型”页签,配置声音制作参数。 界面操作详情,如表1所示。 表1 界面操作说明 区域 说明 声音制作方式 选择声音制作方式“基础版声音制作”,音频格式为W
所以大家可以多多蹲守,记得随时留意咱们的左上角福袋区域,千万不要走开哦~ 在接下来的直播中,我们将详细介绍万兴播爆和万兴喵影的强大功能和用法,以及如何在职场中充分发挥它们的价值。 我们会分享一些实用的技巧和窍门,帮助你更好地利用这些工具提升工作效率,减轻职场压力。 在直播过程中,如果大家
即兴直播:无需设置剧本,直接开播。开播后数字人是不说话的,需要发送互动内容,或者开启真人接管,驱动数字人说话。 互动设置:支持弹幕、用户入场 、点赞和送礼设置。 直播配置:支持开播设置、输出设置、风控设置和更多设置。 界面下方的“加载完自动直播”,默认勾选,单击“准备开播”加载完成后自动开播。 如果希望延迟