|
@@ -79,24 +79,15 @@ test_data = lgb.Dataset(X_test, label=y_test, reference=train_data)
|
|
|
|
|
|
print("数据集创建成功")
|
|
|
# 设置模型的参数
|
|
|
-# params = {
|
|
|
-# 'objective': 'binary', # 指定二分类任务
|
|
|
-# 'metric': 'binary_logloss', # 评估指标为二分类的log损失
|
|
|
-# 'num_leaves': 31, # 叶子节点数
|
|
|
-# 'learning_rate': 0.05, # 学习率
|
|
|
-# 'bagging_fraction': 0.9, # 建树的样本采样比例
|
|
|
-# 'feature_fraction': 0.8, # 建树的特征选择比例
|
|
|
-# 'bagging_freq': 5, # k 意味着每 k 次迭代执行bagging
|
|
|
-# }
|
|
|
params = {
|
|
|
- 'objective': 'binary',
|
|
|
- 'metric': 'binary_logloss',
|
|
|
- 'num_leaves': 20, # 减少叶子节点数
|
|
|
- 'learning_rate': 0.1, # 增大学习率
|
|
|
- 'bagging_fraction': 0.95, # 略微增加抽样比例
|
|
|
- 'feature_fraction': 0.95, # 略微增加特征抽样比例
|
|
|
- 'bagging_freq': 0, # 减少bagging频率
|
|
|
- # 'boosting_type': 'hist', # 使用基于直方图的快速方法
|
|
|
+ 'objective': 'binary', # 指定二分类任务
|
|
|
+ 'metric': 'binary_logloss', # 评估指标为二分类的log损失
|
|
|
+ 'num_leaves': 31, # 叶子节点数
|
|
|
+ 'learning_rate': 0.05, # 学习率
|
|
|
+ 'bagging_fraction': 0.9, # 建树的样本采样比例
|
|
|
+ 'feature_fraction': 0.8, # 建树的特征选择比例
|
|
|
+ 'bagging_freq': 5, # k 意味着每 k 次迭代执行bagging
|
|
|
+ 'num_threads': 4 #
|
|
|
}
|
|
|
|
|
|
# 训练模型
|