• 本站招聘各个版块版主共同发展,有意可私聊站长

claude用盗版书籍训练数据国人不说话

Telegram账号购买找【ITCRY】-顶级号商 https://itcry.com/

起名太难了

Active member
Lv0
Lv1
Lv2
10
消息得分
注册
2025-06-11
消息
1,348
反馈评分
0
但是为什么DeepSeek蒸馏其他模型的数据会招很多国人骂呢?



Claude“偷数据”其实主要两件事:


盗版书库训练

Anthropic 从盗版网站 Library Genesis 扒了700多万本受版权保护的电子书训练 Claude,被作家集体起诉,2025年赔了15亿美元和解。法官都说了:用版权书训练算合理使用,但下载盗版来拿数据不行——等于承认他们“偷”了来源。



背刺用户隐私

之前说自己“绝不用用户数据训练”,结果2025年8月突然改政策,默认把你和Claude的聊天记录拿去训练,不手动关就等于同意,数据保留期还从30天拉到5年。被用户骂“说一套做一套”。



最搞笑的是,Anthropic 自己还到处指控别人“蒸馏”它的模型,马斯克直接一句怼回去:“你偷来的东西被偷了?”。
 
后退
顶部