lightgbm-binary

基于 LightGBM 训练二分类模型。使用的数据集是 adult

🚀 本仓库的亮点：

使用 Optuna 做超参数寻优
使用 Treelite 做推理加速
使用 Graphviz 做决策树模型可视化
使用 scale_pos_weight 参数，解决样本不均衡问题
对标签概率生成标签的阈值寻优 (y_pred -> y)，详见 util.gen_threshold
编写 自适应学习率衰减函数 提高 AUC，详见 util.AdaptiveLearningRate
编写一站式评估函数，可一次性输出多种指标，包括 accuracy, precision, recall, f1_score, auc, cross-entropy loss, confusion matrix，详见 util.eval_binary

✨ 感谢 Kimi 在学习过程中提供的无私帮助～

Note: requirements.txt 文件列出了当前依赖的部分库版本。

如果你在运行过程中遇到了错误，可以尝试执行以下命令，使用指定库版本：
pip install -r requirements.txt

一、数据可视化

Name		Name	Last commit message	Last commit date
Latest commit History 22 Commits
data		data
.gitignore		.gitignore
1.数据可视化.ipynb		1.数据可视化.ipynb
2.预处理与特征选择.ipynb		2.预处理与特征选择.ipynb
3.超参数微调.ipynb		3.超参数微调.ipynb
4.训练与评估.ipynb		4.训练与评估.ipynb
5.加速推理.ipynb		5.加速推理.ipynb
6.部署.ipynb		6.部署.ipynb
7.模型可视化.ipynb		7.模型可视化.ipynb
README.md		README.md
merge.sh		merge.sh
requirements.txt		requirements.txt
util.py		util.py
汇总.ipynb		汇总.ipynb