检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
违反法律法规的内容: 涉黄、涉赌、涉毒、涉诈、侵权内容 盗版游戏/软件/盗版视频 P2P类金融诈骗信息 彩票类信息 违规医院和药品类信息 无法正常访问或内容不含有任何实质信息 可第一时间拨打华为云电话、提交工单,或者直接在举报中心举报违规内容。我们收到用户反馈后,会立即响应处理,共同维护合法合规的安全环境。
创建声音制作任务(第三方模型) MetaStudio已经预置了各种类型的声音,可以在视频制作界面或视频直播界面查看。如果预置声音仍无法满足用户需求,可使用第三方模型“出门问问”自定义生成声音。第三方模型“出门问问”的详细说明,如下所示: 输入的语言不受限制。默认支持19种输入语言
也可以不看提词器自由发挥,通常自由演讲能够获得更好的拍摄效果。在演讲过程中,可以做一些自然的手部动作,但是不能做一些有明确含义的动作,比如数字手势、挥手、握拳等。同时,也不能做大幅度的手势动作,比如将手超过肩部,或将手挡住脸部。每次动作完成后,需要把手放回到初始位置后再做下一个动
文本驱动方式的要求如下所示: 文本输入长度不超过2000字。 通过文本合成的音频时长不能超过5分钟。 在照片数字人制作页面,选择“文本驱动”方式驱动照片说话时,需要输入文本并选择音色,再单击“试听”预估音频时长。如果超过5分钟,会导致照片数字人制作失败。 父主题: 使用限制
fail_type String 失败原因。 AUTOMATIC_REVIEW_REJECT:自动审核失败 MANUAL_REVIEW_REJECT:人工审核失败 默认取值: AUTOMATIC_REVIEW_REJECT reason String 冻结/解冻/失败 原因。 tags Array
任务ID。 state String 任务的状态。 WAITING:等待 PROCESSING:处理中 SUCCEED:成功 FAILED:失败 CANCELED:取消 error_info ErrorResponse object 错误信息。 create_time String
标签关系 可以包含文本,不可以包含其他标签。 备注 1 <prosody rate="50">大家好,我是MetaStudio数字人</prosody> word标签 描述 <word></word>:设置选中文字为连读模式。选中文字只能包含文字,不能有标点符号或者空格等字符。
照片建模 照片建模任务创建失败是什么原因? 照片建模任务出现异常问题怎么办? 风格化照片建模的照片有什么要求? 风格化照片建模生成的模型文件是什么格式? 表情驱动数据格式如何定义? 肢体驱动数据格式如何定义?
GENERATING:字幕文件生成中。 GENERATE_SUCCEED:字幕文件生成成功。 GENERATE_FAILED:字幕文件生成失败。 subtitle_file_download_url String 字幕文件下载链接。 subtitle_file_upload_url
AssetActionResult 参数 参数类型 描述 ret_status String 处理状态。 SUCCESS:成功 FAILED:失败 asset_ids Array of strings 资产ID列表 error_info ErrorResponse object 错误信息
激活资源 目前支持购买的资源类型,如表1所示。 需激活“一次性计费”产品后使用,必须在一年内激活,否则无法再激活使用。从激活日期开始计算,产品有效期为一年。 按需套餐包和包年/包月产品,可直接使用,无需激活。必须在有效期内使用完成,超出有效期后,自动失效。 表1 资源类型 服务类型
视频直播 直播剧本保存失败怎么办? 提示模板不可用怎么办? 直播业务媒体流如何应对防火墙限制? 第三方平台的直播画面不清晰怎么办? 第三方平台的直播画面突然中断是怎么回事? 第三方平台的直播画面没有声音怎么办?
结果。也可以在MetaStudio控制台的“我的创作 > 资源 > 已激活”页签,查看上传的资产文件。 图4 接口页面 常见错误 上传资产失败的常见错误,如下所示: 2中file_md5输入错误,因为文件的MD5计算错误,且没有进行Base64编码。 3中可能错误,如下所示: C
onceCode 是 - string 一次性鉴权码,获取方式请参见创建一次性鉴权码。 说明: CreateOnceCode接口需要在后台调用,不能在浏览器直接调用,否则有跨域问题。 serverAddress 是 - string 智能交互服务端地址。 不同Region的取值如下所示:
超过20MB,时长不超过5分钟。 在线录音:在线录制音频。录音时长不能超过5分钟,为保证音频生成的效果,请保持录音环境安静无噪音。支持试听录制生成的语音。 文本驱动:通过输入文本,选择声音的方式,生成播报内容。不能超过2000字。 单击声音图标,会弹出声音对话框,可以选择需要使用的声音。
commond_result String 命令执行结果。 EXCUTE_SUCCESS: 命令提交成功 EXCUTE_FAILED: 命令提交失败 attachment_upload_url Array of strings 附件上传地址 multipart_data Array of
任务ID。 state String 任务的状态。 WAITING: 等待 PROCESSING: 处理中 SUCCEED: 成功 FAILED: 失败 CANCELED: 取消 BLOCK: 冻结 start_time String 数字人名片制作开始时间。 end_time String
富的文化底蕴。 科技方面: 华为发布了鸿蒙操作系统,适用于各种设备,如手机、电视、手表和物联网设备。 这个系统有分布式架构,能让设备间无缝连接和协同工作。 AI在医疗领域的应用发展迅速。 比如,AI图像识别技术可以帮助医生提高疾病诊断的准确性和效率,也可以帮助医疗机构改善资源利用和服务质量。
证底噪不能太大,且不能有其他人声出现,尤其是被拍摄模特正在说话的时候。 模特形象 分身数字人不支持替换衣服,因此,您在录制时的着装会决定您的数字人穿着。 在拍摄前,我们建议参照如下条目,对您的形象进行检查。 着装要求 避免任何会和背景融为一体的衣服颜色。如绿幕背景下,不能穿绿色的衣服或者含有任何绿色图案的衣服。
智能交互支持富媒体吗? 支持的富媒体格式 用户与数字人进行智能交互问答时,支持展示如下格式的富媒体: 图片:JPG、PNG、BMP、GIF、SVG。 视频:MP4。 导入富媒体操作 支持通过问答库导入富媒体,示例如表1所示。以奇妙问知识库为例,可以通过新增知识库来补充富媒体知识。