使用ehartford/based與JosephusCheung/GuanacoDataset等數據集微調
目前只有0.4B的rwkv-world模型
有合併lora的權重
未合併的lora權重
loss值=5
在1.39gb的多數據集混和的數據集上微調
Inference Providers NEW
This model isn't deployed by any Inference Provider. 🙋 Ask for provider support
使用ehartford/based與JosephusCheung/GuanacoDataset等數據集微調
目前只有0.4B的rwkv-world模型
有合併lora的權重
未合併的lora權重
loss值=5
在1.39gb的多數據集混和的數據集上微調