检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
Language Processing,简称NLP)是一款基于人工智能技术,针对各类企业及开发者提供的用于文本分析及挖掘的云服务。自然语言处理提供分词、命名实体识别、关键词提取、文本相似度等自然语言相关的API,可用于智能问答、对话机器人、内容推荐、电商评价分析。 在开通NLP之前,可进入体
、密码及NLP服务部署的区域“cn-north-4”,如下图所示,其中: “user”里的“name”表示准备工作中获取的IAM用户名,“password”表示用户密码。 “domain”里的“name”表示准备工作中获取的账号名。 “project”里的“name”表示区域名,如“cn-north-4”,终端节点。
务,然后通过API的方式使用自然语言处理服务。 前提条件 已注册华为账号并开通华为云,并完成实名认证,账号不能处于欠费、冻结、被注销等异常状态。 开通服务操作 进入自然语言处理基础官网,单击“立即使用”,进入自然语言处理控制台。 在“总览”页面,选择需要使用的服务,在操作列单击“开通服务”。
多粒度分词 功能介绍 给定一个句子输入,输出不同粒度的所有单词的层次结构。 以“华为技术有限公司的总部”为例,多粒度分词得到的层次结构如下图所示。其中白色圆形节点为字符单元,蓝色圆角矩阵节点为词汇单元。 图1 多粒度分词 本API免费调用,调用限制为2次/秒。 调试 您可以在API
人工智能技术,针对各类企业及开发者提供的用于文本分析及挖掘的云服务,旨在帮助用户高效地处理文本,常用于智能问答系统、文本分析、内容推荐、翻译等场景。 NLP服务需要用户通过调用API接口,将需要文件识别成可编辑的文本,然后返回JSON格式的识别结果,用户需要通过编码将识别结果对接
是否开启词性标注功能,1为开启,0为关闭,默认为关闭。 lang String 否 支持的文本语言类型,目前支持中文(zh)和英文(en),默认为中文。 criterion String 否 支持的分词规范。 中文分词标准目前支持PKU(北大分词标准)、CTB(宾州中文树库标准),默认为PKU。 英文分词标准默认为Penn
NLP资源到期后的状态说明,请参见到期后影响。 续费相关的功能 NLP折扣套餐包续费相关的功能如表1所示。 表1 续费相关的功能 功能 说明 手动续费 资源即将到期时,已经购买NLP套餐包的客户,可执行手动续费操作,以延长资源包的有效期。 自动续费 开通自动续费后,系统将在资源到期前自动续费,无需客户再手动操作。
还费用。扣费时调用次数会先在套餐包内进行抵扣,抵扣完后的剩余调用量默认转回按需计费方式。对于长期使用者,推荐该购买方式。 按需计费:一种后付费模式,即先使用再付费,指按照API调用次数阶梯价格计费。 表1列出了三种计费模式的区别。 表1 计费模式 计费模式 免费试用 折扣套餐包 按需计费
String 否 支持的文本语言类型,目前只支持中文(zh),默认为中文。 响应消息 响应参数如表3所示。 表3 响应参数 参数名 参数类型 说明 similarity Float 相似度得分,范围在0~1,默认小数点后保留8位。 error_code String 调用失败时的错误码,具体参见错误码。
文档翻译状态查询 免费试用:免费试用套餐包 变更配置 NLP默认使用按需计费。您也可以根据您的实际情况购买资源包,购买后对应区域的资源将自动转为包年包月计费方式。如果超出当前已购买资源包的额度,超出部分将自动转为按需计费。 欠费 按需购买的接口是按照API调用次数阶梯价格计费,当余额不足,
String 否 计算句向量时使用的模型名,目前只支持general,默认为general。 响应消息 响应参数如表3所示。 表3 响应参数 参数名 参数类型 说明 vectors Array of floats 句向量结果列表,按输入句子顺序返回句向量,句向量维度默认为100。 error_code
手动续费后,自动续费仍然有效,在新的到期时间前的第7天开始扣款。 自动续费的到期前7日自动扣款属于系统默认配置,您也可以根据需要修改此扣款日,如到期前6日、到期前5日等等。 本章节主要介绍如何开通NLP折扣套餐包的自动续费功能,更多关于自动续费的规则介绍请参见自动续费规则说明。 前提条件
String 否 支持的文本语言类型,默认为“zh”。目前支持中文和英文,对应的“lang”输入分别为“zh”,“en”。 响应消息 响应参数如表3所示。 表3 响应参数 参数名 参数类型 说明 similarity Float 相似度得分,范围在0~1,默认小数点后保留8位。 error_code
String 否 支持的文本语言类型,目前只支持中文(zh),默认为中文。 响应消息 表3 响应参数 参数名 参数类型 说明 result Result object 调用成功时的返回意图信息。 调用失败时无此字段。 请参见表4。 error_code String 调用失败时的错误码。具体参见错误码。
limit integer 否 返回关键词的最大数量,默认为5。 如果请求文本的词汇数量小于该值,则返回实际词汇数量。 如果词汇数量为浮点数,则limit取该浮点数向下取整的结果。 lang String 否 支持的文本语言类型,目前只支持中文(zh),默认为中文。 响应消息 响应参数如表3所示。
是 存放在OBS的文档文件路径,私密文件推荐使用临时授权URL调用服务,如何获取OBS文件URL和临时授权URL请参见配置OBS访问权限。OBS的region要和请求服务的region保持一致,region不一致则OBS不可用,即使obs是公开访问权限。存放在OBS的文档文件名必须是英文字母。
float 生成摘要的长度限制。 length_limit > 1,则为摘要的具体字数。 0 <= length_limit <= 1,则为生成摘要占原文长度的百分比。 默认数值为0.3。 type 否 Integer 支持的领域类型,取值如下(目前只支持通用领域),默认为通用领域: 0:通用领域
{ "content":"浑浑噩噩的头脑、失魂落魄的身体…" } Python3语言请求代码示例(分析用户评论为“浑浑噩噩的头脑、失魂落魄的身体…”的情感) # -*- coding: utf-8 -*- # 此demo仅供测试
true:为藏头诗 false:为非藏头诗 默认取值为false。 响应消息 响应参数如表3所示。 表3 响应参数 名称 参数类型 说明 poem Array[String] 根据文本请求体,返回生成的诗歌。 error_code String 调用失败时的错误码,具体参见错误码。 调用成功时无此字段。
String 否 支持的文本语言类型,目前只支持中文(zh),默认为中文。 响应消息 响应参数如表3所示。 表3 响应参数 参数名 参数类型 说明 entities Array of entities 实体链接结果,请参见表4。 error_code String 调用失败时的错误码,具体参见错误码。