检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
参数解释: 组件名称。 约束限制: 不涉及。 取值范围: 字符长度1-256位。 默认取值: 不涉及。 component_type String 参数解释: 组件类型。 约束限制: 不涉及。 取值范围: 字符长度1-256位。 默认取值: 不涉及。 component_desc
登录奇妙问,左侧导航栏中,选择“会话记录”,如图1所示。 会话记录页面会展示所有角色的历史会话记录。 图1 会话记录 支持对会话进行如下操作。 可以通过项目名称、会话开始时间、会话结束时间,快速查询或者导出需要查看的角色会话信息。其中项目名称与角色名称相同。 单击每个会话右侧的“查看详情”,弹出“会话详情”对话框,如图2所示。
主要功能如下所示,详见功能特性。 数字内容生产线Metastudio通过AI学习真人形象和声音,来生成数字人模型,相应功能为形象制作、声音制作和Flexus分身数字人。再将模型用于音视频内容的创作,相应功能为视频制作、视频直播和智能交互,主要是生成画面内容。也可以直接通过静态的人脸照片生成视频,对应功能为照片数字人。
华为云盘古数字人大模型,赋能千行百业数字化营销新模式 MetaStudio服务依托华为云基础设施、海量算力(CPU/GPU/NPU)、全球一张网(算网融合、超低时延),通过华为云盘古数字人大模型,训练生成数字人、数字物、数字空间,实现数字人视频制作、直播、智能交互和数字人IP代言等场景。 数字人升级迭代快,提升产品竞争力
查询音色ID 支持在MetaStudio控制台或通过API接口查询音色ID,详情如下所示: 在控制台查询音色ID(方式一):仅支持查询自定义音色ID。 在控制台查询音色ID(方式二):支持查询全量音色ID。 使用接口查询音色ID:支持查询全量音色ID。 在控制台查询音色ID(方式一)
、支持并保障您行使访问、复制、更正、删除等个人信息主体权利。 由于您是通过客户应用使用数字人智能交互Web SDK和服务,如果您希望访问、复制或更正与数字人智能交互Web SDK和服务相关的个人信息,您应通过客户应用提供的路径实现您的个人信息主体权利。 为保障您访问、复制、更正和
CBS服务 单击“对话机器人服务 CBS”,进入控制台页面,如图2所示。 请确认当前页面,是否包含问答机器人列表。 如果包含,直接执行4。 如果不包含,请参考下述操作,购买问答机器人。 单击界面右上方的“购买问答机器人”,进入“购买问答机器人”页面。 请根据实际情况,输入问答机器人名称
创建一次性鉴权码 功能介绍 该接口用于创建一次性鉴权码,有效期5分钟,鉴权码只能使用一次,每次使用后需要重新获取。 接口只能通过第三方后台调用,不能在浏览器前台直接调用,否则会有跨域问题。 调用方法 请参见如何调用API。 URI POST /v1/{project_id}/di
每个单场景上传音频的时长需大于1分钟,大小不超过100M。 视频格式 视频支持的格式为:MP4、M4V、MKV、MOV、FLV、3GP、WMV和AVI。 说明: 在直播间制作界面,如果添加视频,且视频格式为FLV、3GP、WMV、AVI时,无法展示视频播放效果,仅能图片展示。这是浏览器不兼容导致的,但是不
传等。 通过分身数字人进行教育宣传和教育资源推广,进行线上教学和培训,不仅可以大幅节约师资成本,还可以提升教学质量。通过减少对人力的依赖,使教育机构可以将更多精力投入到创新和教学内容的优化上,从而实现更高效的教育体系。 医疗健康 医学科普是近年来政策倡导的一大方向。通过医学科普,
直播任务管理 用户创建的直播间会以列表的形式,展示在分身视频直播首页面的“直播任务管理”页签中。支持通过直播任务进入直播间,修改直播内容后,重新开播。 操作步骤 登录MetaStudio控制台。 在“工作台”界面,单击“分身视频直播”下方的“开始创建”,进入分身数字人直播首页面。
语音上传:本地录制音频后上传。音频格式需要为WAV或MP3格式,音频大小不超过20MB,时长不超过5分钟。 在线录音:在线录制音频。录音时长不能超过5分钟,为保证音频生成的效果,请保持录音环境安静无噪音。支持试听录制生成的语音。 文本驱动:通过输入文本,选择声音的方式,生成播报内容。不能超过2000字。
用户与数字人进行智能交互问答时,支持展示如下格式的富媒体: 图片:JPG、PNG、BMP、GIF、SVG。 视频:MP4。 导入富媒体操作 支持通过问答库导入富媒体。以奇妙问知识库为例,参考新增知识库,补充富媒体知识,示例如表1所示。 如果使用服务提供SDK默认样式,受限于浏览器的CS
激发公众参与环境保护的热情, 并通过民间组织、学校和媒体等渠道促进信息的传播与共享。 各国通过国际组织、跨国合作机制和多边环境协议等平台加强合作与协调, 共同制定环境保护政策、分享经验和技术,并解决跨国界环境问题。 国际社会关注灾害风险管理, 通过建立早期预警系统、加强应急响应和灾后重建等措施,
语音上传:本地录制音频后上传。音频格式需要为WAV或MP3格式,音频大小不超过20MB,时长不超过5分钟。 在线录音:在线录制音频。录音时长不能超过5分钟,为保证音频生成的效果,请保持录音环境安静无噪音。支持试听录制生成的语音。 文本驱动:通过输入文本,选择声音的方式,生成播报内容。不能超过2000字。
分钟,否则审核会不通过。 说明: 通过该地址上传时,需设置content-type为application/octet-stream audio_upload_url String 音频数据训练上传URL。该url在文件上传成功后失效,只能上传一次 说明: 通过该地址上传时,需设
选择一张已授权的人像照片作为输入。 输入的人像照片经过安全过滤,判断是否通过安全筛选,若不通过则不进行数据生成和结果返回操作。 将人像照片输入至算法模型中,通过特征提取、人脸重建、素材特征匹配等进行人头重建,生成3D人头模型。 生成的人头模型通过配上默认身体素材配件,形成完整的3D数字人模型,并返回结果。
参数解释: 组件名称。 约束限制: 不涉及。 取值范围: 字符长度1-256位。 默认取值: 不涉及。 component_type String 参数解释: 组件类型。 约束限制: 不涉及。 取值范围: 字符长度1-256位。 默认取值: 不涉及。 component_desc
建议使用对应版本预置的文案样例:文案样例(基础版)、文案样例(进阶版)、文案样例(高品质)。 支持自定义文案,单句文案长短需和样例相当。 不建议临场即兴发挥录制,避免出现较多嗯、啊等语气词,影响连贯性。 进阶版 高品质 专业录音棚+高保真MIC录制。 开始录音 必须录制单人高质量
6所示。 用户凭证的查询方式,如获取第三方声音使用凭证所示。 图16 更新凭证 单击“确认修改”,界面提示“修改成功”。 修改成功后,自动生效,无需重新激活第三方声音。 父主题: 购买声音套餐