检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
数字内容生产线的计费价格调整公告 随着数字人业务的发展,数字人市场已发生变化。华为云数字内容生产线为更好的提供服务,将从2024年9月27日起,对中国大陆分身数字人形象制作、声音制作进阶版、视频制作的按需计费及按需预付费套餐包,进行统一调价。调整后的价格如表1所示。 表1 中国大陆价格调整详情
(可选)提升问答交互次数 科大讯飞免费赠送500次/天的问答交互次数,如需提升问答交互次数,需订购套餐包。 操作步骤 在AIUI开放平台界面上方的主菜单中,选择“产品接入 > 我的应用”。 单击新增应用所在行的图标,进入“应用配置”页面。 在左侧导航栏中,选择“应用数据统计 >
通“声音合成”的按需计费。 详细操作为:单击“声音合成”卡片中的“去开通”,在弹出的“开通按需计费服务提示”对话框中,勾选同意协议。单击“确定”,开通按需计费。 如需使用第三方声音进行语音合成,请购买出门问问声音套餐,操作请参考《用户指南》的“购买出门问问声音套餐”章节。 调用方法
为什么会欠费? 除用户在资源购买页面,付费购买的资源外,用户还需查看如图1所示的服务概览页面。查看是否有计费项开通了按需计费,在计费项卡片右上角会有已开通按需计费的提示。超出套餐包的资源会自动走按需计费。 图1 服务概览页面 父主题: 计费咨询
声音账户余额不足,请充值后重新合成视频 说明用户第三方声音的已购套餐额度已用尽,需再次购买,详细操作请参见购买出门问问声音套餐。 查看已购套餐余额的操作如下所示: 登录MetaStudio控制台。 在左侧导航栏中,选择“我的创作”。 选择“声音 > 已购”,单击已购套餐右侧的“付费管理”,可以查看余额,如图1所示。
系统声音和Flexus声音免费使用。第三方声音的计费方式,详见购买出门问问套餐包。 标准版视频制作:必须使用标准版形象,声音不支持使用Flexus声音。 按视频制作时长计费,计费项为“分身数字人视频制作”,详见计费说明。 系统声音免费使用。第三方声音的计费方式,详见购买出门问问套餐包。 视频制作任务 视
系统声音和Flexus声音免费使用。第三方声音的计费方式,详见购买出门问问套餐包。 标准版视频制作:必须使用标准版形象,声音不支持使用Flexus声音。 按视频制作时长计费,计费项为“分身数字人视频制作”,详见计费说明。 系统声音免费使用。第三方声音的计费方式,详见购买出门问问套餐包。 父主题: 使用限制
视频制作19.9元60分钟体验包的作用? 19.9元60分钟的视频制作体验包,仅支持新用户购买。满足下述任一条件的,都不算新用户。 购买过MetaStudio资源。 开通过按需计费。 该套餐仅支持视频制作,不支持训练形象。用户可以在MetaStudio控制台服务概览页面,看到购买
购买语音包后试听一直转圈圈是为什么? 多语言的计费规则? 如何查看已购声音套餐明细? 分身形象或声音制作的不好,可以使用原有资源重新制作吗? 形象制作和声音制作支持退订吗? 制作好数字人后,可以不购买路数进行直播吗? 已购买包年/包月直播套餐,未到期为啥扣费? 为什么会欠费? 资产管理的计费标准? 购买页的置灰资源如何购买?
speechRecognized的流式返回是覆盖式返回。后一条通知中的text字段值包含前一条通知的内容。例如:第一条通知的text值为“你吃”,第二条新识别了“饭了么”,则第二条text值为“你吃饭了么”。 semanticRecognized的流式返回是分段式返回。后一条通知中的text字段值
5号 算法基本原理 分身数字人驱动算法是指通过深度学习生成数字人驱动模型,模型生成后,输入音频来合成数字人视频的一种技术。 其基本情况包括: 输入数据:真人视频、音频。 算法原理:通过深度学习算法来学习真人视频,生成驱动该真人形象的数字人模型。通过该模型输入音频,合成数字人视频。
机录制音频。 具体的录音注意事项,如表2所示。 表2 录音注意事项 录音事项 说明 话筒间距 调整与麦克风之间的距离,以一拳距离为宜。不宜离麦太近,防止喷麦或录入呼吸声。 录音内容 每句文案起始数字编号无需阅读。 示例:4. 它不仅拥有出色的功能,还具备卓越的性能,序号4无需阅读。
声音制作 真人声音录制 声音录制指导文档下载 创建声音制作任务(自研模型) 创建声音制作任务(第三方模型) 查看声音 声音更新记录 购买声音套餐 文案样例(基础版) 文案样例(进阶版) 文案样例(高品质)
19种语言的声音制作。 音频总时长,建议5分钟;单段不低于5秒 如果剩余次数为0,可单击“立即购买”,参考购买出门问问小语种克隆套餐的操作流程购买小语种克隆套餐包。 请完善声音信息 输入声音名称。 示例:欢快女声。 请制作声音 界面提供录音指导,需要按照指导录制1分钟的长音频WA
声音和形象模型支持在其他平台使用吗? 用户在MetaStudio制作的模型,仅支持在本服务内使用。 声音和数字人模型文件不支持导出和下载,且声音和数字人模型不是通用模型,不与第三方服务兼容。 父主题: 声音和形象制作
数字人是一种以数字形式存在于数字空间中的虚拟人物,它具有拟人或真人的外貌、行为特点,并具备一定的智能和情感,可以进行交互和表达。数字人也可以被称之为虚拟形象、数字虚拟人、虚拟数字人等。数字人的核心技术主要包括计算机视觉、计算机图形学、动作捕捉和驱动、图像渲染和人工智能等。 服务型数字人是利用深度神经网络进行
选择“换气”或者停顿的时间,也支持自定义停顿时长。 连读 选中需要连读的文本内容,单击“连读”。 多音字 选中文本中的多音字,单击“多音字”,在弹出的提示框中,选择正确的发音或者自定义发音。 须知: 这里设置的多音字,仅对当前视频制作剧本有效,如需全局生效,可参考配置特殊词表配置。
获取。 响应消息头中X-Subject-Token的值。 Authorization 否 String 使用AK/SK方式认证时必选,携带的鉴权信息。 X-Sdk-Date 否 String 使用AK/SK方式认证时必选,请求的发生时间。 格式为(YYYYMMDD'T'HHMMSS'Z')。
获取。 响应消息头中X-Subject-Token的值。 Authorization 否 String 使用AK/SK方式认证时必选,携带的鉴权信息。 X-Sdk-Date 否 String 使用AK/SK方式认证时必选,请求的发生时间。 格式为(YYYYMMDD'T'HHMMSS'Z')。
形象制作与视频直播是两个独立的功能,需各自计费。可通过包周期或按需计费方式购买路数。 视频直播间的场景布置好之后,可以通过捕捉网页画面或RTMP推流的方式向第三方直播平台传输画面。MetaStudio控制台的场景布置是免费的,生成并输出直播画面是付费的。且MetaStudio服务