但是为什么DeepSeek蒸馏其他模型的数据会招很多国人骂呢?
Claude“偷数据”其实主要两件事:
盗版书库训练
Anthropic 从盗版网站 Library Genesis 扒了700多万本受版权保护的电子书训练 Claude,被作家集体起诉,2025年赔了15亿美元和解。法官都说了:用版权书训练算合理使用,但下载盗版来拿数据不行——等于承认他们“偷”了来源。
背刺用户隐私
之前说自己“绝不用用户数据训练”,结果2025年8月突然改政策,默认把你和Claude的聊天记录拿去训练,不手动关就等于同意,数据保留期还从30天拉到5年。被用户骂“说一套做一套”。
最搞笑的是,Anthropic 自己还到处指控别人“蒸馏”它的模型,马斯克直接一句怼回去:“你偷来的东西被偷了?”。
Claude“偷数据”其实主要两件事:
盗版书库训练
Anthropic 从盗版网站 Library Genesis 扒了700多万本受版权保护的电子书训练 Claude,被作家集体起诉,2025年赔了15亿美元和解。法官都说了:用版权书训练算合理使用,但下载盗版来拿数据不行——等于承认他们“偷”了来源。
背刺用户隐私
之前说自己“绝不用用户数据训练”,结果2025年8月突然改政策,默认把你和Claude的聊天记录拿去训练,不手动关就等于同意,数据保留期还从30天拉到5年。被用户骂“说一套做一套”。
最搞笑的是,Anthropic 自己还到处指控别人“蒸馏”它的模型,马斯克直接一句怼回去:“你偷来的东西被偷了?”。