检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
响应Body参数 参数 参数类型 描述 asset_list Array of DigitalAssetSummary objects 资产列表。 表6 DigitalAssetSummary 参数 参数类型 描述 asset_id String 资产ID。 asset_name String
响应Body参数 参数 参数类型 描述 resources Array of ResourceUsageInfo objects 资源用量列表 表6 ResourceUsageInfo 参数 参数类型 描述 resource_type String 资源类型。详见资源类型。 business_type
PhotoVideoConfig object 视频输出配置。 shoot_scripts 是 Array of ShootScriptItem objects 剧本列表。照片数字人仅支持传入一个剧本shoot_script,剧本参数仅支持shoot_script.script_type、shoot_script
objects 自定义读法。 表5 VocabularyConfig 参数 参数类型 描述 id String id key String 原始词 value String 设置的自定义读法 create_time String 创建时间。 update_time String 更新时间。
figure:读数值 telephone:读电话 英文的读法包括: spell:读字母 english:读单词 key 否 String 原始词。 value 否 String 自定义读法。其中,音标的读法请参考词典。 响应参数 状态码:200 表4 响应Body参数 参数 参数类型
VideoConfig object 视频输出配置。 shoot_scripts Array of ShootScriptItem objects 拍摄脚本列表。 background_music_config BackgroundMusicConfig object 背景音乐配置 表6 OutputAssetInfo
视频输出配置。 voice_config_list Array of SmartChatVoiceConfig objects 语音配置参数列表。 chat_video_type String 智能交互对话端配置。 COMPUTER: 电脑端 MOBILE: 手机端 HUB: 大屏
多语言的计费规则? 文本转语音是以字数来计费的,多语言不是计费项,无需另外付费。 自研声音目前只有中英文,声音合成按需计费标准为:¥200.00/百万字,可以在MetaStudio服务概览页面的“声音合成”卡片中查看,如图1所示。 图1 声音合成计费项 第三方声音的计费标准,详见云商店语音合成商品页面的价格表。
创建智能交互数字人(SDK+API场景) 介绍如何在MetaStudio平台创建智能交互数字人,实现用户和数字人对话。相应的场景说明,请参考场景说明。 操作步骤 登录MetaStudio控制台,单击“智能交互”。 在智能交互编辑页面,依次设置角色和背景。 查看界面右侧的“互动问答”页签,如图1所示。
视频输出配置。 voice_config_list Array of SmartChatVoiceConfig objects 语音配置参数列表。 chat_state Integer 数字人智能交互对话的状态。 0: 等待建链 1: 等待关闭链路 2: 建链成功 3: 进入休眠 4:
PPT如何转为PDF文件? 支持在视频制作界面,导入本地PPT作为视频素材使用。有时PPT的字体、公式、图表等不支持在MetaStudio控制台展示,建议将PPT转存为PDF文件后,在导入本地PPT的位置,重新导入PDF文件,进行视频制作。 MetaStudio平台仅支持上传通过
功能特性 数字内容生产线Metastudio通过AI学习真人形象和声音,来生成数字人模型,相应功能为形象制作、声音制作和Flexus分身数字人。再将模型用于音视频内容的创作,相应功能为视频制作、视频直播和智能交互,主要是生成画面内容。也可以直接通过静态的人脸照片生成视频,对应功能为照片数字人。
VideoConfig object 视频输出配置。 shoot_scripts 否 Array of ShootScriptItem objects 拍摄脚本列表。 output_asset_config 否 OutputAssetConfig object 输出资产信息配置。 background_music_config
wasmData.js:语音唤醒的算法资源文件。 modelData.js:语音唤醒的模型资源文件。 SDK内置默认唤醒模型,支持定制唤醒词,并更新本地模型,详见Web语音唤醒。 【请求参数】 表8 ResourcePath 参数 是否必选 默认值 类型 描述 wasmPath 是
快速入门 环境要求 Web SDK运行环境要求,如表1所示。 表1 环境要求 环境项 使用限制 开发工具 Microsoft Visual Studio Code、WebStorm或其他Web IDE开发工具。 语言 Javascript或Typescript。 编译环境 建议Node
直播业务媒体流如何应对防火墙限制? 分身数字人直播业务使用SparkRTC方式收流,其信令和媒体访问方式为“IP+端口”或“域名+端口”,防火墙需要放开如下限制: 解除所有IP访问的限制。 在客户端防火墙配置SparkRTC端口和域名白名单。 配置SparkRTC端口的防火墙白名单,如表1所示。
智能交互驱动WebSocket接口 终端节点获取方式 智能交互驱动WebSocket接口终端节点的获取方式,如表1所示。 表1 终端节点获取方式 场景 获取方式 未通过WEB SDK调用场景 终端节点地址从接口启动数字人智能交互任务的响应参数chat_access_address中获取。
制作照片数字人视频 支持上传正面清晰的人像照片,生成会说话的照片数字人视频。 操作限制 照片数字人视频制作限制,如照片数字人限制所示。 操作步骤 登录MetaStudio控制台。 在“工作台”界面,单击“照片数字人”,进入照片数字人制作页面,如图1所示。 界面左侧展示配置项,右侧展示预览效果。配置操作,请参考表1。
稿三:杭州西湖简介 杭州西湖,以其秀美的湖光山色和深厚的文化底蕴,被誉为“人间天堂”。作为世界文化遗产,西湖不仅是自然美景的宝库,也是中国园林艺术和历史文化的杰出代表。 湖光山色 西湖的美,在于山水的和谐共生。湖面碧波荡漾,山色空蒙,四季景色各异。春天,苏堤春晓,桃花盛开,垂柳依
商品管理 分身视频直播首页面的“商品管理”页签,支持新增商品。商品会自动展示在直播间的“商品”页签中,供直播间添加使用。 操作步骤 登录MetaStudio控制台。 在“工作台”界面,单击“分身视频直播”下方的“开始创建”,进入分身数字人直播首页面。 单击“商品管理”,进入如图1所示的页面。