检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
自然语言处理包含如下子服务。 自然语言处理基础(Natural Language Processing Fundamentals),为用户提供包括分词、命名实体识别、关键词提取、短文本相似度等自然语言相关的API,可用于智能问答、对话机器人、内容推荐、电商评价分析等场景中。 语言生成(Language
用户需要具备编程能力,熟悉Java、Python编程语言。 NLP服务需要用户通过调用API接口,将需要文件识别成可编辑的文本,然后返回JSON格式的识别结果,用户需要通过编码将识别结果对接到业务系统或保存为TXT、Excel等格式。 首次使用NLP 如果您是首次使用NLP的用户,建议您学习并了解如下信息:
包含分词、多粒度分词、依存句法分析、命名实体识别、文本相似度和句向量、实体链接、关键词抽取、事件抽取接口等。 语言生成接口 包含文本摘要、诗歌生成接口。 语言理解接口 包含情感分析、文本分类、意图理解接口。 机器翻译接口 包含文本翻译、语种识别接口。
事件抽取 2020-07-06 修改 命名实体识别(领域版) 2019-12-13 新增 诗歌生成 4.2.4-文本生成(即将下线) 意图理解 文档翻译任务创建 文档翻译状态查询 配置OBS访问权限 2019-08-05 新增 命名实体识别(领域版) 4.3.4-意图理解(废弃) 删除
实体链接 功能介绍 针对通用领域的文本进行实体链接分析,识别出其中的实体,并返回实体相关信息。 具体Endpoint请参见终端节点。 调用华为云NLP服务会产生费用,本API以定制版API定价按需计费,不支持使用套餐包,使用时请在自然语言处理价格计算器 按需计费-自然语言处理定制版API中查看费用详情。
功能介绍 文档分类接口对用户输入的文本自动分类,给文本具体的分类。用户只要提供待处理的文本,而不用关注具体实现。主要应用场景:新闻内容分类,广告识别等。 具体Endpoint请参见终端节点。 调用华为云NLP服务会产生费用,本API支持使用基础套餐包,购买时请在自然语言处理价格计算器中
中的示例。 句向量 将语句映射至固定维度的实数向量。详细内容请参见句向量接口参考中的示例。 实体链接 针对通用领域的文本进行实体链接分析,识别出其中的实体,并返回实体相关信息。 父主题: 基本概念
一致。例如开通服务时所在区域为“华北-北京四”,“Region”需设置为“华北-北京四”。 填写待分词的文本数据。 单击“调试”按钮,获取识别结果。 图1 调试结果 父主题: 调用API
文本长度超过400个字符时,只检测前400个字符。 type Integer 否 取值如下,默认值为0: 0:自适应领域,根据输入内容自动识别适应领域。 1:电商领域,适用于电商领域评论。 2:汽车领域,适用于汽车领域评论。 响应消息 响应参数如表3所示。 表3 响应参数 参数名
请参见计费项。 运维成本:使用自然语言处理NLP过程中产生的人力成本。 华为云成本中心可以帮助您更高效地管理资源成本,但运维成本需要您自行识别、管理和优化。 成本分配 成本管理的基础是树立成本责任制,让各部门、各业务团队、各责任人参与进来,为各自消耗云服务产生的成本负责。企业可以
自然语言处理基础服务接口说明 分词 多粒度分词 依存句法分析 命名实体识别(基础版) 命名实体识别(领域版) 文本相似度(基础版) 文本相似度(高级版) 句向量 实体链接 关键词抽取 事件抽取 成分句法分析 父主题: API
按需计费:自然语言处理基础版API 多粒度分词 免费调用 依存句法分析 免费调用 命名实体识别(基础版) 免费试用:免费试用套餐包 包年包月:基础套餐包 按需计费:自然语言处理基础版API 命名实体识别(领域版) 包年包月:领域套餐包 按需计费:自然语言处理领域版API 文本相似度(基础版)
自然语言处理基础版接口和领域版接口所支持的计费模式也有所区别,详情请见计费说明。 表1 区分基础版和领域版的接口 接口类型 接口 自然语言处理基础服务接口 命名实体识别(基础版) 命名实体识别(领域版) 文本相似度(基础版) 文本相似度(领域版) 语言生成服务接口 文本摘要(基础版) 文本摘要(领域版) 语言理解服务接口
机器翻译服务接口说明 文本翻译 语种识别 文档翻译任务创建 文档翻译状态查询 父主题: API
java”文件中函数的“AK”和“SK”的值。 图3 AK/SK认证鉴权 步骤3:调用分词服务 执行Demo,控制台输出状态码“200”即表示程序执行成功。 分词识别的返回结果为JSON格式,如下所示。 { "words": [ { "content": "今天"
周期进行扣除。只有调用成功才会计算调用字符数,未用完的免费调用字符数不流转到下一个月。字符数以翻译的源语言字符长度为标准计算。一个汉字、英文字母、标点符号等,均计为一个字符。一个自然月后调用次数清零重新累积。 变更配置后对计费的影响 如果您在购买按需计费后变更了配置,购买了折扣套
请求消息体通常以结构化格式发出,与请求消息头中Content-type对应,传递除请求消息头之外的内容。如果请求消息体中参数支持中文,则中文字符必须为UTF-8编码。 每个接口的请求消息体内容不同,也并不是每个接口都需要有请求消息体(或者说消息体为空),GET、DELETE操作类
'性价比','能耗'】 “手机领域”:【'整体','内存','外形设计','屏幕','性价比','拍照','散热','电池','信号','指纹识别','音质','握持手感','活动配件赠品','防水','客服','物流派送','包装'】 label integer 文本关于属性类别的情感标签。
egion要和请求服务的region保持一致,region不一致则OBS不可用,即使obs是公开访问权限。存放在OBS的文档文件名必须是英文字母。 from String 是 翻译原语言,文档翻译服务当前仅支持中英互译。 to String 是 翻译目标语言,文档翻译服务当前仅支持中英互译。