我使用的是赛博炼丹炉。炼制方法如下:
先使用dadaptation优化器constant调度器,学习率调为1,文本学习率调到0.5。在炼制一会儿后去查看日志的最佳训练值。
得到训练值后换成lion优化器跑,使用得到学习率的1/3,文本学习率是1/10。
就这样的流程跑完以后,然后去看日志,发现loss值不能在0.8左右稳定住,在快要跑完的时候会降到0.6,0.7左右去。
都说0.8左右比较好,想问问各位平时是怎么训练lora的?

先使用dadaptation优化器constant调度器,学习率调为1,文本学习率调到0.5。在炼制一会儿后去查看日志的最佳训练值。
得到训练值后换成lion优化器跑,使用得到学习率的1/3,文本学习率是1/10。
就这样的流程跑完以后,然后去看日志,发现loss值不能在0.8左右稳定住,在快要跑完的时候会降到0.6,0.7左右去。
都说0.8左右比较好,想问问各位平时是怎么训练lora的?
