【犀牛鸟实战issue】overfitting fail by wktomo · Pull Request #107 · Tencent-Hunyuan/Hunyuan3D-2.1

wktomo · 2025-07-16T04:51:12Z

任务说明：在小数据集上过模型效果不佳，在小数据集上模型能很好地解决
方案：模型会快速记住所有数据，但继续训练会导致优化器震荡，损失不降反升，从而形成“过结果效果不佳”，减少步数，增加正则化，降低学习率和提高数据增强性能，采用一下方式来检验：
1.观察训练损失：应快速恢复到接近0。
2.观察验证损失（如果有）：应快速上升（过精致的标志）。
3.生成样本：检查模型是否能完美重建训练数据。
完成修改dit_asl.yaml和train_mini_overfit.py是相应的模型权重训练和代码，提高了在迷你数据集上的过精致性能，降低了相应的损失度

wktomo added 2 commits July 15, 2025 11:59

Add files via upload

9ac636b

Add files via upload

aa95384

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

【犀牛鸟实战issue】overfitting fail#107

【犀牛鸟实战issue】overfitting fail#107
wktomo wants to merge 2 commits intoTencent-Hunyuan:mainfrom
wktomo:main

wktomo commented Jul 16, 2025

Uh oh!

Reviewers

Assignees

Labels

Projects

Milestone

Development

Uh oh!

1 participant

Conversation

wktomo commented Jul 16, 2025

Uh oh!

Reviewers

Assignees

Labels

Projects

Milestone

Development

Uh oh!

1 participant