-
字符串相似度 - AI开发平台ModelArts
字符串相似度 概述 支持cosine、levenshtein、jaccard、最长公共子序列、minhash_sim、ssk、simhash_hamming_sim七种方法计算字符串的相似度。 输入 参数 子参数 参数说明 inputs dataDF inputs为字典类型,da
-
字符串标签化 - AI开发平台ModelArts
字符串标签化 概述 对数据集的指定列进行StringIndexer编码,即标签编码。 输入 参数 子参数 参数说明 inputs dataframe inputs为字典类型,dataframe为pyspark中的DataFrame类型对象 输出 数据集 参数说明 参数 子参数 参数说明
-
字符串相似度topN - AI开发平台ModelArts
inputs为字典类型,dataDF是输入字符串集合,数据类型是pyspark中的DataFrame类型对象 inputs paramDF paramDF是输入的被映射的字符串集合,数据类型是pyspark中的DataFrame类型对象 输出 DataRame 参数说明 参数名 参数类型 是否必选 参数含义
-
创建超参搜索作业 - AI开发平台ModelArts
合的超参,提高模型精度和收敛速度。 表1 搜索指标参数 参数 说明 名称 搜索指标的名称。需要与您在代码中打印的搜索指标参数保持一致。 优化方向 可选“最大化”或者“最小化”。 指标正则 填入正则表达式。您可以单击智能生成功能自动获取正则表达式。 设置自动化搜索参数 从已设置的“
-
查看服务详情 - AI开发平台ModelArts
USER_NAME 调用预测请求的用户名。 USER_ID 调用预测请求的用户ID。 “#”表示引用变量,匹配的字符串需要用单引号。 #{内置变量} == '字符串' #{内置变量} matches '正则表达式' 示例一: 当调用预测请求的账号名为“zhangsan”时,匹配至指定版本。 #DOMAIN_NAME
-
词频统计 - AI开发平台ModelArts
词频统计 概述 词频统计是指统计一个字符串中,出现了多少个单词以及这些单词出现的次数。该算子一般接在分词算子后面,用以统计分词后各个单词的出现次数。 输入 参数 子参数 参数说明 inputs dataframe inputs为字典类型,dataframe为pyspark中的Da
-
常用操作的样例代码 - AI开发平台ModelArts
f: file_bytes = f.read() 以二进制模式打开的文件也支持读取一行或者读取所有行,用法不变。 将字符串写入一个文件。 例如将字符串“Hello World!”写入OBS文件“obs://bucket_name/obs_file.txt”中。 1 2 import
-
创建数据集 - AI开发平台ModelArts
包含表头。 如果您的原始表格中已包含表头,开启时,会将导入文件的第一行(表头)作为列名,无需再手动修改Schema信息。 如果您的原始表格中没有表头,需手动关闭该开关,并更改Schema信息中的“列名”为attr_1、attr_2、……、attr_n,其中attr_n为最后一列,代表预测列。
-
数据增强(图像生成) - AI开发平台ModelArts
数据增强(图像生成) 图像生成算子概述 图像生成算子利用Gan网络依据已知的数据集生成新的数据集。Gan是一个包含生成器和判别器的网络,生成器从潜在空间中随机取样作为输入,其输出结果需要尽量模仿训练集中的真实样本。判别器的输入则为真实样本或生成网络的输出,其目的是将生成网络的输出从
-
文本分类 - AI开发平台ModelArts
标签名是由中文、大小写字母、数字、中划线或下划线组成,且不超过32位的字符串。 开始标注 登录ModelArts管理控制台,在左侧菜单栏中选择“数据管理> 数据集”,进入“数据集”管理页面。 在数据集列表中,基于“标注类型”选择需要进行标注的数据集,单击数据集名称进入数据集概览页。
-
查询算法详情 - AI开发平台ModelArts
描述 name String 指标名称。 mode String 搜索方向。 max 指定时表示指标值越大越好; min 指定时表示指标值越小越好。 regex String 指标正则表达式。 表17 search_params 参数 参数类型 描述 name String 超参名称。
-
命名实体 - AI开发平台ModelArts
实体命名标签名是由中文、大小写字母、数字、中划线或下划线组成,且不超过32位的字符串。 开始标注 登录ModelArts管理控制台,在左侧菜单栏中选择“数据管理> 数据集”,进入“数据集”管理页面。 在数据集列表中,基于“标注类型”选择需要进行标注的数据集,单击数据集名称进入数据集概览页。
-
创建算法 - AI开发平台ModelArts
name 否 String 指标名称。 mode 否 String 搜索方向。 max 指定时表示指标值越大越好; min 指定时表示指标值越小越好。 regex 否 String 指标正则表达式。 表16 search_params 参数 是否必选 参数类型 描述 name 否 String
-
更新算法 - AI开发平台ModelArts
name 否 String 指标名称。 mode 否 String 搜索方向。 max 指定时表示指标值越大越好; min 指定时表示指标值越小越好。 regex 否 String 指标正则表达式。 表16 search_params 参数 是否必选 参数类型 描述 name 否 String
-
直方图 - AI开发平台ModelArts
string_bucket_show_num - 如果选择列为字符串列,该参数表示条形图显示的条的数量 numerical_bucket_show_num - 如果选择列为数值列,该参数表示条形图显示的条的数量 numerical_interval - 如果选择列为数值列,该参数表示特征值的区间长度 样例 inputs
-
ModelArts - AI开发平台ModelArts
ModelArts是面向开发者的一站式AI开发平台,为机器学习与深度学习提供海量数据预处理及半自动化标注、大规模分布式Training、自动化模型生成,及端-边-云模型按需部署能力,帮助用户快速创建和部署模型,管理全周期AI工作流。 图说ModelArts 图说ModelArts 立即使用
-
命名实体 - AI开发平台ModelArts
过1024位的字符串。 开始标注 登录ModelArts管理控制台,在左侧菜单栏中选择“数据管理> 数据标注”,进入“数据标注”管理页面。 数据管理模块在重构升级中,对未使用过数据管理的用户不可见。如果要使用数据管理相关功能,建议提交工单开通权限。 在标注作业列表右侧“所有类型”
-
缺省值填充 - AI开发平台ModelArts
缺省值填充 概述 通过给定一个缺省值的配置表,来实现将输入表的缺省值或固定值填充为定义的值。 将数值型的空值替换为最大值,最小值,均值或者一个自定义的值。 将字符串类型、日期类型的空值、或者固定值,替换为一个自定义的值。 数值型替换可以自定义,也可以直接选择替换成数值最大值,最小值或者均值。
-
数据集选择列 - AI开发平台ModelArts
select_columns_str - 将选择的列名按照逗号分隔形成的字符串,例如:"column_a" 或者 "column_a,column_b,column_c" 样例 inputs = { "dataframe": None # @input {"label":"dataframe"
-
查询算法列表 - AI开发平台ModelArts
描述 name String 指标名称。 mode String 搜索方向。 max 指定时表示指标值越大越好; min 指定时表示指标值越小越好。 regex String 指标正则表达式。 表19 search_params 参数 参数类型 描述 name String 超参名称。