检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
创建照片检测任务 GET /v1/{project_id}/photo-detection/{job_id} 查询照片检测任务详情 智能直播间管理 表8 智能直播间管理接口 接口 说明 POST /v1/{project_id}/smart-live-rooms 创建智能直播间
创建照片分身数字人视频制作任务 5次/秒 3次/秒 3次/秒 查询照片分身数字人视频制作任务详情 20次/秒 10次/秒 10次/秒 取消等待中的照片分身数字人视频制作任务 5次/秒 3次/秒 3次/秒 创建照片检测任务 5次/秒 3次/秒 3次/秒 查询照片检测任务详情 20次
例如:第一条通知的text值为“你吃”,第二条新识别了“饭了么”,则第二条text值为“你吃饭了么”。 semanticRecognized的流式返回是分段式返回。后一条通知中的text字段值与前一条通知的内容是上下衔接关系。
照片建模的含义:根据单张照片自动生成3D风格化基础模型。 按需计费 按需预付费套餐包 语音驱动 按照输入文本或语音驱动数字人口型、表情等动作的时长进行计费。 计费时优先使用套餐包中的额度,该额度使用完后,转按需付费。
MODELING_3D:3D照片建模 VDS_3D:3D视觉驱动 TTSA_3D:3D语音驱动 FLEXUS_2D:FLEXUS版本资源 sub_resource_type String 子资源类型。
表4 SpeechRecognitionInfo 参数 类型 描述 text string 识别结果文本。 resultId number 识别流式响应时返回的各包顺序序号。 isLast boolean 是否是最后一条识别结果。
分身数字人 分身数字人形象制作 一次性计费 分身数字人视频制作 按需计费 按需套餐包 一次性计费 声音制作 分身数字人声音制作基础版 分身数字人声音制作进阶版 分身数字人声音制作高级版 一次性计费 分身数字人视频直播 按需计费 包年/包月 分身数字人视频直播行业版 按需计费 包年/包月 照片数字人视频制作
MODELING_3D:3D照片建模 VDS_3D:3D视觉驱动 TTSA_3D:3D语音驱动 FLEXUS_2D:flexus版本资源 sub_resource_type String 子资源类型。
MODEL:通过分身数字人模型生成视频 PICTURE: 通过单张照片生成视频 说明: 该参数已废弃,照片数字人视频制作使用“创建照片分身数字人视频制作任务”接口。 human_image String 人物照片,需要Base64编码。
MODELING_3D:3D照片建模 VDS_3D:3D视觉驱动 TTSA_3D:3D语音驱动 FLEXUS_2D:FLEXUS版本资源 resource_expire_start_time 否 String 资源过期时间段 开始时间。
图2 制作名片 表1 参数说明 区域 参数 说明 请填写数字人信息 上传头像 需提前准备一张正面清晰且无遮挡的数字人形象照片,并满足如下要求: 图片格式:png、jpg、jpeg、webp。 单击“查看示范”,查看正确示范和错误示范。
ID asset_type String 资产类型 ANIMATION:动作 MATERIAL:素材 cover_url String 封面图URL 表8 StyleExtraMeta 参数 参数类型 描述 picture_modeling_enable Boolean 是否支持照片建模
尾静音时长 系统会对用户的提问音频进行检测,如果一句话末尾的静音时长超过500ms,会结束语音识别。 建议取值大于500ms。 热词 数字人与用户进行智能交互对话时,语音识别不准确的专业词汇,可以作为热词反馈到语音模型,以提高语音识别的准确率。
租户名称:输入自定义租户名称,方便SP用户识别租户身份。 图2 关联租户 单击“创建”,租户创建完成,如图3所示。 图3 租户列表 如需取消关联,可单击右侧的“取消关联”,在弹出的“取消关联租户提示”对话框中,单击“确定”。 租户取消成功后,租户未使用的资源将被收回。
为方便识别和记忆,两边的技能名称可以设置成一样的。 技能标识:技能标识。必须与科大讯飞创建的技能标识,保持一致,如在科大讯飞创建同名技能后,导入技能文件所示。否则用户命中问题,也无法获取到对应的答案。 支持用户最多创建100个技能。
为了提供交互功能,SDK会通过您主动点击聊天按钮申请客户应用或浏览器的麦克风权限,在您同意客户应用使用麦克风之后,将您的音频数据或文本数据上传到客户指定的第三方系统或模型,用于识别语义并做出应答,给您提供交互功能。
展开“语音识别”下方的“高级设置”,如图9所示。 图9 应用配置 在“识别热词”区域,单击“下载热词模板”,将模板下载至本地。
家用机器人还具备语音识别和语音回应功能,让您能够与机器人进行流畅的对话和交流。 164. 视觉交互:家用机器人配备了先进的摄像头和视觉传感器,可以通过图像识别和视觉感知与您进行交互。 165. 例如,机器人可以识别家庭成员的面孔、手势和身体姿势,并做出个性化的反应和服务。
展开“语音识别”下方的“高级设置”,如图15所示。 图15 应用配置 在“识别热词”区域,单击“下载热词模板”,将模板下载至本地。
说明: 通过该地址上传时,需设置content-type为application/octet-stream id_card_image1_upload_url String 身份证正面照片上传URL。该URL在文件上传成功后失效,只能上传一次。