2 anos atrás · 4cecfa5c0c
--- a/main.py
+++ b/main.py
@@ -79,24 +79,15 @@ test_data = lgb.Dataset(X_test, label=y_test, reference=train_data)
 
				 
			
 
				 print("数据集创建成功")
			
 
				 # 设置模型的参数
			
 
				-# params = {
			
 
				-#     'objective': 'binary',  # 指定二分类任务
			
 
				-#     'metric': 'binary_logloss',  # 评估指标为二分类的log损失
			
 
				-#     'num_leaves': 31,  # 叶子节点数
			
 
				-#     'learning_rate': 0.05,  # 学习率
			
 
				-#     'bagging_fraction': 0.9,  # 建树的样本采样比例
			
 
				-#     'feature_fraction': 0.8,  # 建树的特征选择比例
			
 
				-#     'bagging_freq': 5,  # k 意味着每 k 次迭代执行bagging
			
 
				-# }
			
 
				 params = {
			
 
				-    'objective': 'binary',
			
 
				-    'metric': 'binary_logloss',
			
 
				-    'num_leaves': 20,  # 减少叶子节点数
			
 
				-    'learning_rate': 0.1,  # 增大学习率
			
 
				-    'bagging_fraction': 0.95,  # 略微增加抽样比例
			
 
				-    'feature_fraction': 0.95,  # 略微增加特征抽样比例
			
 
				-    'bagging_freq': 0,  # 减少bagging频率
			
 
				-    # 'boosting_type': 'hist',  # 使用基于直方图的快速方法
			
 
				+    'objective': 'binary',  # 指定二分类任务
			
 
				+    'metric': 'binary_logloss',  # 评估指标为二分类的log损失
			
 
				+    'num_leaves': 31,  # 叶子节点数
			
 
				+    'learning_rate': 0.05,  # 学习率
			
 
				+    'bagging_fraction': 0.9,  # 建树的样本采样比例
			
 
				+    'feature_fraction': 0.8,  # 建树的特征选择比例
			
 
				+    'bagging_freq': 5,  # k 意味着每 k 次迭代执行bagging
			
 
				+    'num_threads': 4  #
			
 
				 }
			
 
				 
			
 
				 # 训练模型