检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
拍摄真人视频 您好!欢迎使用华为云数字人服务,本指南将协助您完成分身数字人形象的采集工作。 请注意,分身数字人形象制作的效果与您的录制效果有较大关联,为了获取更好的数字人效果,我们建议您使用以下标准进行拍摄。 以下是数字人拍摄标准概览,但是我们也建议您详细阅读每一块具体内容: 拍摄规格
界面提供录音指导,需要按照指导录制1分钟的长音频WAV或MP3文件。WAV或MP3文件支持直接上传,无需压缩,无需携带文案txt文件。 如果未使用服务预置文案,声音标签仅作为标签,来区分声音使用场景。 请选择声音性别 声音的性别,用于匹配声音模型的精准度。 如下所示: 男生 女生 请选择原始输入语言
可以被称之为虚拟形象、数字虚拟人、虚拟数字人等。数字人的核心技术主要包括计算机视觉、计算机图形学、动作捕捉和驱动、图像渲染和人工智能等。 服务型数字人:利用深度神经网络进行图像合成、高度拟真的虚拟人。 具备如下特点: 2D模型,通过拍摄真人视频训练生成 无表情&骨骼数据 只能由AI驱动
需要导入MetaStudio服务导出的技能文件。 表4 创建技能 参数 说明 技能名称 输入技能名称,必须与MetaStudio服务创建的技能一一对应,如4所示。 为方便识别和记忆,两边的技能名称可以设置一致。 技能标识 需要与MetaStudio服务新能技能的“技能标识”一致,如4所示。
成一个符合时长要求的基础版、进阶版或高品质音频文件。WAV或MP3格式音频文件支持直接上传,无需压缩,无需携带文案txt文件。 如果未使用服务预置文案,声音标签仅作为标签,来区分声音使用场景。 请选择声音性别 声音的性别,用于匹配声音模型的精准度。 如下所示: 男生 女生 原始输入语言
态,新特性将在各个区域(Region)陆续发布,欢迎体验。 2022年12月 序号 功能名称 功能描述 阶段 相关文档 1 数字内容生产线服务上线(受限公测) MetaStudio依托图形引擎和空间引擎两大媒体引擎,提供3D模型制作(Creator)、资产管理(Store)、内容
fail","error_code":"APIG.0301",是因为token解密失败,请检查token是否完整、是否过期、获取token与调用服务的区域是否跨区、账号是否因欠费等原因导致权限被限制。具体请参见Token认证鉴权。 父主题: API和SDK使用
创建应用:在科大讯飞的AIUI开放平台创建应用。 (可选)创建文档问答库:星火交互认知大模型应用,支持创建文档问答库。非必须创建,可根据实际情况选择使用。 MetaStudio服务目前仅支持读取docx(包含图文)、txt和md格式,其他格式暂不支持。 docx格式说明:可以没有标题和分级标题, 如需添加标题和分级标
医疗健康方面: 中国政府努力推进健康中国建设,加强基本医疗卫生服务,提高医疗服务质量和水平。 政府支持基层医疗卫生机构建设和人才培养,让更多人能享受到优质的医疗服务。 互联网技术帮助医疗健康领域发展,政府鼓励和支持互联网医疗健康服务, 推动远程医疗、在线诊疗、健康管理等模式的发展。 同时,会保护互联网医疗数据的安全和隐私。
创建应用:在科大讯飞的AIUI开放平台创建应用。 配置应用:应用需要使用AIUI通用语义模型,并启用创建技能中已创建的技能。 查看应用信息:在MetaStudio服务创建“科大讯飞AIUI通用语义模型”智能交互对话项目时,需要使用这里的应用信息,包括:应用名称、APPID、APPKEY和APISECRET。
者拍摄成jpg或png格式的图片后上传。 授权书内容,可参考授权书。 单击“提交制作”。 弹出“资源消耗提示”对话框。提示用户目前声音制作服务剩余数量,本次将消耗1个资源。 如果用户确认无误,单击“确认提交”。 声音制作任务提交成功后,界面提示“制作任务提交成功”,如图2所示。
bleLocalWakeup参数来开启Web语音唤醒能力。 定制唤醒能力 如果客户希望使用体现企业文化的唤醒词,需联系MetaStudio服务支持,技术人员会根据唤醒词定制唤醒模型。唤醒模型的定制周期在5个工作日左右,定制唤醒词的上限为8个。 唤醒词的反馈格式,如下所示: 唤醒:你好云笙、云笙你好
单击“添加意图及话术”,新增“意图1”配置框。 需配置下述参数: 意图1:从下拉框中选择意图,这里展示的意图是服务预置的,不支持从当前界面增加新的意图名称。用户也可以在提交工单时,同步补充需要的意图列表,让服务进行预置。仅支持选择已有意图,且每个意图仅能新增设置一次。 添加回复话术:单击“添加回复话
包含如下选项: 弹幕 用户入场 点赞 送礼 互动名称(可选) 互动名称。 触发方式 触发关键词,多个关键词用“|”分隔,示例“链接|型号|优惠”。 服务扫描弹幕的时候,如果扫描到此关键词,自动回复当前互动内容。 回复方式 选择主播或助播进行回复,具体回复内容支持通过下述方式设置。 文本:通
JobInfo 参数 类型 描述 jobId string 任务ID。 websocketAddr string | undefined 智能交互服务端websocket地址,三方驱动场景用来拼接websocket链接。 须知: 参数返回的地址默认无wss://前缀,实际使用时,需要补齐
登录密码”,作为在MetaStudio控制台激活第三方声音的使用凭证。 访问云商店买家中心,进入“已购买的服务”界面。 可以看到已购买的语音合成套餐信息。 图8 已购买的服务 单击已购买套餐右侧的“资源详情”,进入资源详情界面。 需要记录“用户账号”和“登录密码”,如图9所示。