AI开发平台MODELARTS-过滤式特征选择:参数说明

时间:2024-04-30 17:04:14

参数说明

参数

是否必选

参数说明

默认值

feature_columns_str

特征列列名,支持多列用','分隔

"”

label_column

标签列列名

""

discretization_columns_str

需要进行离散化特征列列名,支持多列用','分隔

""

method

过滤选择的方法,取值如下:

  • IV:根据IV值计算特征的重要性,注:IV法仅支持2分类;
  • Gini增益:根据Gini增益计算特征重要性;
  • 信息增益:根据信息增益计算特征重要性;
  • Lasso:采用Lasso回归计算特征重要性;

""

select_feature_num

选择的TopN个特征,如果大于输入特征数,则输出所以特征

None

discretization_method

离散化连续特征方法,取值如下:

  • equidistant division:根据特征的最小、最大值等距离分隔

""

discretization_bin_num

离散化连续特征区间数量

None

is_sparse

是否是K:V的稀疏特征

False

kv_col

稀疏特征列名

""

item_spliter

K:V特征中每个item之间的分隔符

","

kv_spliter

K:V特征中每个key与value之间的分隔符

":"

support.huaweicloud.com/devtool-modelarts/devtool-modelarts_0254.html