检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
中国-东盟(华为)人工智能创新中心在通过与达译的多轮深度沟通后,协助达译制定了达译东南亚小语种在线翻译平台的设计方案,集合机器翻译、语音识别与合成、拍照翻译等功能,以适应市场发展的客观需求。项目开发的过程中将会遇到图像识别开发、计算集群搭建以及模型准确提升等难点。
方案概述 应用场景 随着全球化的发展,字幕翻译已经成为了跨越语言和文化的重要工具。该解决方案基于华为云函数工作流 FunctionGraph无服务器架构,集成自然语言处理 NLP文本翻译功能,帮助用户完成从源语言到目标语言的字幕文件多语言翻译。
图片读取韩文 扫描识别图片 扫描识别图片指将图片、扫描件或PDF、OFD文档中的打印字符进行检测识别成可编辑的文本格式。
机器翻译 NLPMT:机器翻译(Machine Translation)致力于为企业和个人提供不同语种间快速翻译能力,通过API调用即可实现源语言文本到目标语言文本的自动翻译。
pdf转图片方法 # -*- coding: utf-8 -*- import os import base64 import fitz import io from PIL import Image from glob import glob class CovertPdfToJpg
华为云文字识别服务 文字识别OCR提供在线文字识别服务,将图片、扫描件或PDF、OFD文档中的文字识别成可编辑的文本。OCR文字识别支持证件识别、票据识别、定制模板识别、通用表格文字识别等。
实施步骤 准备工作 快速部署 开始使用 快速卸载
文档翻译任务创建 功能介绍 由于文档翻译会需要较长的时间,因此翻译是异步的,也即接口分为创建翻译任务和查询任务状态两个接口。 创建翻译任务接口创建任务完成后返回,然后用户通过调用查询任务状态接口来获得翻译状态和临时URL。
图片翻译集成文本检测、OCR文本识别、机器翻译、图片修复、图片合成等技术,将图片中的文字内容翻译替换成指定语种的文本。并提供在线编辑平台,可以对翻译后的图片背景以及文字内容进行高自由度的编辑。
文字识别OCR服务只支持调用一次接口识别一张图片,批量识别需要进行二次开发,编码循环调用API,实现批量调用服务识别图片。
提取图片中的文字暗水印 功能介绍 对已嵌入文字暗水印的图片进行水印提取,用户以formData的格式传入待提取水印的图片,DSC服务以JSON的格式返回从图片里提取的出的文字暗水印。
应用场景 图片处理支持用户在云端对图片进行简单的缩略、剪切、压缩等操作,不需下载占用空间巨大的本地图片处理软件即可直接在线对图片进行处理。 例如,可以随时随地在线对在云相册中的图片进行效果、缩略设置后,即刻在线将图片分享给好友、同事等。
翻译菜单用于翻译人员完成翻译任务,不同的翻译人员进入翻译菜单,所看到的翻译任务是不同的。 场景描述 本节介绍的是在应用内配置翻译任务,您还可以在管理中心进行配置,相关操作请参考翻译处理。
修订记录 表1 参数说明 发布日期 修订记录 2023-10-30 第一次正式发布。 2024-10-30 适配EventGrid触发器。
在线预览图片 KooDrive支持用户在线查看云空间中多种格式图片文件的缩略图。 操作步骤 登录KooDrive服务业务面。 目前仅支持使用华为账号登录KooDrive服务业务面。 进入任意文件列表页。 如果文件为图片文件,“文件名”列展示图片缩略图和文件名。
该解决方案会创建两个OBS桶,命名方式为{obs_bucket_name}-source(用于上传需要翻译的字幕文件)、{obs_bucket_name}-result(用于存放翻译后的字幕文件)。
提取图片中的图片暗水印 功能介绍 对已嵌入图片暗水印的图片进行水印提取,用户以formData的格式传入待提取水印的图片,DSC服务以图片二进制流的格式返回从图片里提取的出的图片暗水印。
图3 上传文件 查看图片压缩效果 压缩后的图片存放在piccomp-output桶的output文件夹中。如图4所示,图片大小均有变小,实现了对图片的压缩。
基于安全合规要求,华为云对象存储服务OBS禁止通过OBS的默认域名(桶访问域名或静态网站访问域名)在线预览桶内对象,即使用上述域名从浏览器访问桶内对象(如视频、图片、网页等)时,不会显示对象内容,而是以附件形式下载。 设置在线预览请参见如何在浏览器中在线预览OBS中的对象。
立即使用 在线体验 展开详情 免费试用 免费 不限新老用户,在线图片转文字免费试用 组合折上折 推荐 基于业务场景,为您推荐合适的产品组合 图片转文字 功能介绍 通用表格识别 提取表格内的文字和所在行列位置信息,适应不同格式的表格。同时也识别表格外部的文字区域。