检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
请求Header参数 参数 是否必选 参数类型 描述 X-Request-Id 否 String 请求requestId,用来标识一路请求,用于问题跟踪定位,建议使用uuId,若不携带,则后台自动生成 X-Auth-Token 否 String 用户Token。使用Token鉴权方式时必选。
第三方用户ID。不允许输入中文。 表3 请求Body参数 参数 是否必选 参数类型 描述 name 是 String 主题。 answer 是 String 问题答案。 skill_id 是 String 技能ID。 question_list 是 Array of KnowledgeQuestionCreateInfo
请求Header参数 参数 是否必选 参数类型 描述 X-Request-Id 否 String 请求requestId,用来标识一路请求,用于问题跟踪定位,建议使用uuId,若不携带,则后台自动生成 X-Auth-Token 否 String 用户Token。使用Token鉴权方式时必选。
查询智能直播剧本详情 功能介绍 该接口用于查询智能直播剧本详情。 调用方法 请参见如何调用API。 URI GET /v1/{project_id}/smart-live-rooms/{room_id} 表1 路径参数 参数 是否必选 参数类型 描述 project_id 是 String
定制声音 在“华为模型”页签,配置声音制作参数。 界面操作详情,如表1所示。 表1 界面操作说明 区域 说明 声音制作方式 MetaStudio提供下述声音制作方式: 基础版声音制作:需整段录制生成一个WAV或MP3格式的音频文件,时长3~10分钟,建议5分钟。 进阶版声音制作:需
视频制作界面 在画布区域,设置角色、背景、贴图、视频等内容。 详细操作请参见视频制作素材操作详情。 画布制作完成后,再制作语音。 选择“文本驱动”的方式。在文本输入框中,输入文本内容,以生成音频,如图2所示。 文本示例:今天是9月26日,星期二,天气晴朗,欢迎大家到访。我们精心布置了现场,
新闻播报风格英文文案 China is the first country in the world with over three million valid domestic invention patents. China's number of valid invention
查询数字人智能交互任务 功能介绍 该接口用于查询数字人智能交互任务。 调用方法 请参见如何调用API。 URI GET /v1/{project_id}/digital-human-chat/smart-chat-rooms/{room_id}/smart-chat-jobs/{job_id}/state
查询智能直播间互动规则库列表 功能介绍 该接口用于智能直播间互动规则库列表。 调用方法 请参见如何调用API。 URI GET /v1/{project_id}/smart-live-interaction-rule-groups 表1 路径参数 参数 是否必选 参数类型 描述 project_id
创建智能直播间 功能介绍 该接口用于创建智能直播间。 调用方法 请参见如何调用API。 URI POST /v1/{project_id}/smart-live-rooms 表1 路径参数 参数 是否必选 参数类型 描述 project_id 是 String 项目ID,获取方法请参考获取项目ID。
系统声音和Flexus声音免费使用。第三方声音的计费方式,详见购买出门问问套餐包。 标准版视频制作:必须使用标准版形象,声音不支持使用Flexus声音。 按视频制作时长计费,计费项为“分身数字人视频制作”,详见计费说明。 系统声音免费使用。第三方声音的计费方式,详见购买出门问问套餐包。 父主题:
场景二:用户使用第三方语言模型,自主开发API实现与数字人对话场景。 开发者基于智能交互服务定义的API接口结构,自主开发第三方语言模型API,对接第三方语言模型到智能交互服务,实现智能交互能力。操作请参考创建智能交互数字人(第三方语言模型)。 场景三:用户使用智能交互API或SDK,自主开发实现与数字人对话场景。
音频制作区域,可选择下述1种方式生成音频。 文本驱动:通过输入文本的方式生成音频。文本支持插入停顿、调整语速,如果是多音字可设置正确的发音,还可以选择不同的声音,试听生成的音频效果。支持开启字幕展示功能。 音频驱动:从本地上传音频文件,作为视频的语音。音频驱动方式,仅支持中文普通话的场景下能开启字幕。
营销宣传风格文案 在这个快速变化的世界里,技术已经成为我们生活中不可或缺的重要元素。 它不断推动着我们的社会进步,改变着我们的生活方式。 家用机器人,是一款集合了众多顶尖科技的全新智能设备。 它不仅拥有出色的功能,还具备卓越的性能。 让您可以轻松体验畅快无比的运行速度和极致的使用感受。
订单支付页面 按照界面提示,选择您的付款方式,完成支付即可。 订单支付成功后,进入如图4所示的界面。 图4 订单支付成功 购买出门问问小语种克隆套餐包 如果用户需要使用“出门问问声音制作”方式自定义生成声音,需要在云商店购买出门问问小语种克隆套餐包。 访问云商店语音合成商品页面,进入云商店商品“语音合成”的购买页面。
说明 用户账号 需要接收资产的租户,其所在Region的项目ID,获取方法请参见获取项目ID。 备注 转移资产的备注信息。 接收方式 租户接收资产的方式。 包含如下设置: 资产转移后用户自动接收:建议勾选,这样资产转移后,租户无需再执行接收资产的操作,否则需要参考接收资产进行操作。
如果华为云账号无法满足用户的使用诉求,可参考创建用户并授权使用MetaStudio,创建IAM用户,进行精细化的权限管理。 推荐浏览器 推荐使用Chrome浏览器访问MetaStudio控制台。
无障碍研究会,为听障人士打造分身数字人,让声音重现焕发新生,助力让每个人都能通过科技平等享受现代文明。聋哑画家史晓慧,通过数字分身以有声的方式解读作品背后的故事,让更多人能够听懂无声世界的斑斓。 我国有4.91亿乡村人口从事农产品生产,有10万多个特色小宗类乡土产业。“土特产”背
科大讯飞星火交互大模型及AIUI 能力开放可集成 智能交互端侧Web SDK 形象驱动API 数字人大脑API 数字人能力开放,多种合作模式灵活选择 实名安全认证后,可使用控制台在线自助完成内容制作。 集成数字人API、SDK至企业自建平台。 联合专业直播服务伙伴,定制场景化解决方案,实现数字人直播系统交付和运营专业支持。
文本驱动SSML定义 MetaStudio语音驱动采用语音合成标记语言(SSML,Speech Synthesis Markup Language)来控制数字人的行为,包括动作、情绪以及TTS语音合成的多音字、停顿等。 SSML基础定义可参考语音合成标记语言版本 1.0。Meta