我是真喜欢你这种明明够吧不懂,却还要装的很懂的样子




自己带节奏之前能不能先百度一下模型蒸馏是什么?不会真以为模型蒸馏就跟蒸馏水一样吧?



模型蒸馏的本质含义是用大的教师模型去教导小的学生模型,从而达到在尽可能少的损失精度的前提下,降低运算的时间和算力占用。
叫蒸馏纯粹的翻译问题,更确切来说应该叫教师学生神经网络,懂了没?
其次openai自己的大模型都没开源,deepseek拿头去蒸馏openai的模型?
如果openai开源了模型,那deepseek凭什么不能蒸馏你的模型?
最后,我建议openai在告别人之前先把自己的训练语聊公开一下,看看openai非法爬取了多少家企业的数据用来做训练语聊。



看看会不会他刚公布,就有一堆公司起诉他。