• 实时语音识别

    实时语音识别 实时语音识别 实时语音识别(Real-time ASR),将连续的音频流实时转换成文本,语音识别更快。可应用于直播实时字幕、会议实时记录、即时文本生成等场景。 实时语音识别(Real-time ASR),将连续的音频流实时转换成文本,语音识别更快。可应用于直播实时字幕、会议实时记录、即时文本生成等场景。

  • 录音文件识别

    针对专业词汇,支持上传至热词表,增加专业词汇的语音识别准确率 针对专业词汇,支持上传至热词表,增加专业词汇的语音识别准确率 多模型多音频格式 提供对话、银行、保险等多种领域模型,支持8种以上音频格式的转写,适配场景广泛 提供对话、银行、保险等多种领域模型,支持8种以上音频格式的转写,适配场景广泛 支持质检参数分析

  • 一句话识别

    一句话识别 一句话识别 一句话识别将口述音频转换为文本,通过API调用识别不超过一分钟的不同音频源发来的音频流或音频文件。适用于语音搜索、人机交互等语音交互识别场景。 一句话识别将口述音频转换为文本,通过API调用识别不超过一分钟的不同音频源发来的音频流或音频文件。适用于语音搜索、人机交互等语音交互识别场景。

  • 证件类 OCR

    证件类 证件类 证件类OCR(Card OCR),支持身份证识别、行驶证识别、驾驶证识别、护照识别、银行卡识别、营业执照识别、名片识别、车牌识别、VIN码识别、道路运输证识别、道路运输从业资格证识别等卡证图片上有效信息的自动识别和关键字段结构化提取。 证件类OCR(Card OC

  • 语音合成

    语音合成 TTS 语音合成服务提供在线语音合成能力,支持将文本信息实时转化为近似的真人发声,支持多语言多音色语音在线合成。支持客户的个性化语音定制化需求。 语音合成服务提供在线语音合成能力,支持将文本信息实时转化为近似的真人发声,支持多语言多音色语音在线合成。支持客户的个性化语音定制化需求。

  • ocr概览页

    一桔科技 一桔科技是湖南达智科技有限公司旗下品牌之一,提供高职院校产教融合整体解决方案。 使用了华为云文字识别技术构建了在线课堂实名认证系统,精准实时判断学生在线课堂出勤情况,帮助教育机构有效提高教学管理效率。 查看详情 九州通医药集团 九州通是一家以西药、中药、器械为主要经营产品

  • 语音交互服务

    立即参与 产品列表 实时语音识别 RASR 实时语音识别(Real-time ASR),将连续的音频流实时转换成文本,语音识别更快。可应用于直播实时字幕、会议实时记录、即时文本生成等场景。 实时语音识别(Real-time ASR),将连续的音频流实时转换成文本,语音识别更快。可应用于直

  • 视频标签

    VCT 视频标签(简称VCT),基于深度学习对视频进行场景分类、人物识别、语音识别、文字识别等多维度分析,形成层次化的分类标签。 视频标签(简称VCT),基于深度学习对视频进行场景分类、人物识别、语音识别、文字识别等多维度分析,形成层次化的分类标签。 服务咨询 智能客服 产品优势

  • 人脸识别服务FRS

    人员,进行安全监控。 表情识别 身份验证 考试防作弊 人脸闸机 电子考勤 园区出入管理 表情识别 文档与学习成长 快速入门 快速入门 如何在线调试人脸识别服务? 调用API实现人脸检测功能 调用SDK实现人脸检测功能 查看更多 API参考 API参考 如何调用API 动作活体检测API

  • 华为云hilens

    到多种端侧计算设备运行和在线管理。 华为HiLens为端云协同AI应用开发与运行管理平台,支持部署华为云ModelArts平台训练的模型,提供云上管理平台、丰富的技能市场和开发者工具与插件,帮助用户高效开发AI应用,并将其部署到多种端侧计算设备运行和在线管理。 公告:HiLens基础版即将下线。

  • 视频编辑

    视频编辑 VCP 视频编辑 VCP 视频编辑(Video Content Processing)服务,基于对视频的整体分析,提供封面、拆条、摘要等能力 视频编辑(Video Content Processing)服务,基于对视频的整体分析,提供封面、拆条、摘要等能力 智能客服 服务咨询

  • SparkRTC社交语聊房解决方案

    支持花式玩法,覆盖多种文娱场景,社交“零距离”,共享音频交流新时代。 支持花式玩法,覆盖多种文娱场景,社交“零距离”,共享音频交流新时代。 立即申请 满足多种场景 满足多种场景 1v1语音 语聊房 在线 KTV 在线相亲 在线电台 语音社交应用,实现 1v1 通话或者随机匹配语音聊天,寻找心仪的男神女神畅聊。

  • 人证核身 IVS

    承诺不保存服务过程数据和用户隐私数据 权威数据源 服务数据来源于国家权威机构 提交合作咨询 应用场景 应用场景 金融在线开户和交易 银行、互联网金融、证券公司等金融机构对用户身份真实性要求高,使用华为云人证核身服务可有效实现在线核验,支持远程开户、大额交易等业务,大幅减少人力成本,增强用户体验。 保险人脸核身

  • 华为云会议SmartRooms智能会议室

    Camera 200 查看推荐配置 大型会议室满足高规格正式会议场景需求,基于华为专业视讯终端,结合华为云会议为企业提供便捷的团队协作体验,语音识别、4k远程共享,面画清晰不卡顿,让大型会议多端远程交流更顺畅 使用场景: 行政会议、全员会议 会议室容量:16-25人 推荐配套终端: 华为CloudLink

  • sis

  • 华为云实时音视频

    文娱互动 在线教育 办公协作 在线金融 文娱互动 零距离互动新玩法,助力业务创新、流量变现 • 支持主播跨房 PK ,PK 时延低于200ms。支持观众与主播连麦,平滑上下麦,互动零距离 • 优质音效,音频降噪,原生高保真 • 1080P、美颜,让互动直播更精彩 在线教育 丰富的

  • 对话机器人服务 CBS

    型对话、多轮对话、表格问答、自动文本生成、多模态等多种对话机器人能力的AI助手,赋能不同行业客户。 应用场景 在线客服 大屏语音助手 视频客服 数字员工 在线客服 在线客服 智能客服场景中,使用智能问答机器人来自动回答客户对于产品售后支持,使用方法,疑难解答等问询,显著降低企业人力成本

  • 票据类 OCR

    票据类 票据类 票据类OCR(Receipt OCR),支持增值税发票识别、定额发票识别、出租车发票识别、火车票识别、飞机行程单识别、机动车销售发票识别、车辆通行费发票识别以及发票验真,支持图片及PDF、OFD文档上有效信息的自动识别和结构化提取。 按次计费,提供多种规格的预付费套餐包。

  • 智能语音助手

    拥有众多有经验的人工智能算法专家和架构师,通过算法和工程解决问题的能力突出 语音交互 打通语音交互能力,一个接口搞定语音识别和对话能力 打通语音交互能力,一个接口搞定语音识别和对话能力 敏捷构建 敏捷构建知识图谱,首先实现最小功能集使用场景,再不断更新迭代 敏捷构建知识图谱,首先实现最小功能集使用场景,再不断更新迭代

  • AI平台ModelArts资源

    海量资源助力开发者与华为云共建应用 开发工具 获取海量开发者技术资源、工具 开发者计划 使能开发者基于开放能力进行技术创新 开发支持 专业高效的开发者在线技术支持服务 开发者学堂 云上学习、实验、认证的知识服务中心 开发者活动 开发者实训、热门活动专区 社区论坛 专家技术布道、开发者交流分享的平台