【Demo】基于CNN实现对人脸的性别和年龄预测（2023.10.10 更新）

训练, 离线评估, 在线推理相关命令见 ./scripts/ 目录下的脚本
使用的 IMDB-WIKI(wiki_crop.tar) 数据集可由此下载; 该链接指向的数据集文件已经是 IMDB-WIKI 数据集团队官方按照人脸区域裁剪过的了, 因此不需要进一步裁剪, 详细说明可移步数据集主页
安装所需的第三方库 pip install -r requirements.txt -i https://pypi.tuna.tsinghua.edu.cn/simple
将 wiki_crop.tar 解压到任意目录下, 然后使用脚本 ./preprocess/prepare_dataset.py 来准备训练所需的相关文件

注: ResNet-50 已替换为 Swin-Small, Conv1 和 Conv2 已替换为 MLP. 训练加载了 timm库提供的 ImageNet-21k 预训练权重

由于使用了完整的原始的 wiki_crop 数据集, 而从数据集主页可见下图:

该图曲线说明数据集中图片主体的年龄集中在 30 岁左右 (数据不均衡), 所以训练的模型 (更何况存在过拟合的模型) 会倾向于将年龄预测为该时间段。

解决思路为: 将年龄模型和性别模型分开，训练年龄模型时：对 30 岁左右的样本欠采样, 对剩余年龄段过采样

训练过程的记录, 从曲线上可以发现模型训练到后面显然已经过拟合了 :), 不过由于使用的权重保存策略是 val_loss 最低点, 所以无伤大雅 (不想重新训练一遍了)

这是对一张组合图像的处理结果（组合的四张图片选自 IMDB-WIKI 数据集的原始图像）

Name		Name	Last commit message	Last commit date
Latest commit History 17 Commits
data/wiki		data/wiki
middle		middle
preprocess		preprocess
samples		samples
scripts		scripts
.gitattributes		.gitattributes
.gitignore		.gitignore
README.md		README.md
datasets.py		datasets.py
evaluate.py		evaluate.py
haarcascade_frontalface_default.xml		haarcascade_frontalface_default.xml
inference.py		inference.py
model_summary.txt		model_summary.txt
models.py		models.py
requirements.txt		requirements.txt
train.py		train.py
utils.py		utils.py

NICE-FUTURE/predict-gender-and-age-from-camera