AMT|智造云|世界先进制造技术论坛,领先的高科技先进制造产业服务平台

发表于 2026-3-18 14:16:13 | 显示全部楼层 |阅读模式

好家伙,这回真的是看乐子了。

3月17日,日本楽天(Rakuten)集团高调发布了一个叫 Rakuten AI 3.0 的模型。宣传文案写得那叫一个漂亮——“日本国内最大规模的高性能AI模型”,参数量约7000亿,专门为日语优化,还拿了日本经济产业省和NEDO的GENIAC项目补助。

结果呢?

发布不到12小时,网友直接把它的底裤扒了个精光。

image.png

01 一个config.json引发的血案

这事儿的发现过程,简单到没有任何技术含量。

Rakuten AI 3.0发布后,模型权重照例会传到Hugging Face(全球最大的模型托管平台)的楽天官方仓库。任何一个懂点AI的人,点进去,打开那个叫 config.json 的配置文件,都能直接傻眼。

architectures(模型架构)那一栏,赫然写着一行英文:DeepseekV3ForCausalLM。

model_type那一栏,更干脆:deepseek_v3。

懂行的朋友看到这儿已经笑了——这不是“参考”DeepSeek,不是“借鉴”DeepSeek,这是直接把DeepSeek V3的“身份证”亮出来了。

image.png

往下翻,参数配置更是对得严丝合缝:hidden_size是7168,intermediate_size是18432,num_hidden_layers是61,n_routed_experts是256,vocab_size是129280。

这些数字,和DeepSeek V3的原版配置一模一样。

难怪楽天敢号称“参数量约7000亿”——因为DeepSeek V3本来就是6810亿参数。改名归改名,参数又不能凭空变多。

更搞笑的是,Hugging Face的模型页面上,标签栏甚至直接挂着“deepseek_v3”的标签。这不是网友手动后加的,是模型上传时系统根据config自动生成的。

演都不演了属于是。

02 楽天:我说的是“基于开源社区优秀成果”,有错吗?

楽天自己的说法是什么?

他们在官方新闻稿里写的是:“基于开源社区最优秀的模型开发”。

这句话写在新闻稿里,写在模型卡片里,也写在PR Times的新闻通稿里。

从技术角度讲,这句话确实没有说谎。

DeepSeek V3本来就是开源的,许可证(MIT协议)允许商业使用、允许修改、允许二次发布。楽天在此基础上用日语双语数据做了微调和优化——这在业界确实是常见操作,叫微调(fine-tuning)。

但问题来了:楽天在所有对外宣传中,从头到尾没提过“DeepSeek”这三个字。

新闻稿里没有,模型描述里没有,接受媒体采访时也没有。

这就好比你去米其林餐厅点了一份和牛,结果后厨端出来的是街边牛肉干,只不过撒了点黑胡椒。老板还说:“我这是基于市面上最优质的肉类资源开发的菜品。”——话是没错,但你为什么不直接告诉客人这肉是哪来的?

所以当网友把config.json的截图贴到X(原Twitter)上时,评论区的画风就很微妙了。

有个叫Ryu的日本用户写了一句:“日本终于到了用中国AI冒充日本产AI的时代了吗?”

底下的日语评论基本都在骂街,中文评论都在看乐子。场面一度十分热闹。

03 把中国AI比作“黑船”,然后自己偷偷用?

这事儿最讽刺的地方在这儿。

2025年DeepSeek刚火起来的时候,日本媒体给它起了个外号,叫 “AI界的黑船事件” 。

image.png

“黑船”是什么?是1853年美国海军准将佩里率舰队强行叩开日本国门的历史事件。在日语里,这个词专门用来形容外来力量对日本造成的巨大冲击。

把一个中国的AI产品比作“黑船”,这个措辞本身就说明了很多问题。

日本政府的反应也确实很快。

2025年2月初,日本数字大臣平将明公开表态:在安全疑虑消除之前,日本公务员应避免使用DeepSeek,使用时要格外谨慎。

随后日本政府向各省厅发出警告,要求不要在政府设备上使用DeepSeek。

企业层面的动作更直接:丰田明确禁止员工使用,理由是“信息安全考虑”;三菱重工同样实施禁令;软银则限制了公司内部对DeepSeek的访问。

结果呢?

一边喊着“黑船来了快防御”,一边拿着政府补贴的算力,在中国开源的DeepSeek V3上做微调,然后贴上自己的牌子当“日本国产AI”发布。

这个画面,真的很难忍住不笑。

04 到底谁尴尬?

严格来说,楽天没有违反任何规则。

DeepSeek V3的开源许可允许商业使用,在开源模型基础上做微调也确实是行业通行做法。楽天甚至可以说:“我们用的是自己的日语数据,做了大量优化,这就是我们的模型。”

但问题是——这事儿真的体面吗?

想象一下这个场景:

日本政府警告公务员别用DeepSeek,怕数据泄露到中国。日本企业纷纷跟进封杀。结果楽天这个拿了政府补贴的“国产AI标杆”,发布当天就被扒出底层就是DeepSeek V3。

那些用Rakuten AI 3.0的用户,输入的数据最终会流向哪里?模型的推理请求会打到谁的服务器?

如果DeepSeek本身“不安全”,那基于DeepSeek微调的模型怎么就突然“安全”了?

如果中国AI是“黑船”,那开着这艘黑船、插上日本旗、号称“国产最大”的行为,算不算自己把船开进了港口?

image.png

05 这事儿还没完

现在的情况是:

DeepSeek V3的幻觉率确实不低,楽天拿它微调后能不能优化好,还是个未知数。

日本政府刚发了警告,结果自己资助的项目用的是“被警告对象”的技术——这事儿后续怎么圆,也是个问题。

最逗的是,DeepSeek现在已经更新到V3.2了。楽天发布的V3版本,严格来说已经是“上一代”的技术了。


写到这儿,我突然想到一个问题:

如果哪天你发现自己花大价钱买的“国产自研”,底子里是别人开源的“进口货”,你是会觉得赚了,还是觉得自己被耍了?




回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册 |

本版积分规则

主题 24 | 回复: 25

QQ|联系我们|法律声明|用户协议|AMT咨询|商务合作|会员入驻|积分充值|积分商城|积分奖励规则|TradEx全球购|加入QQ技术群|添加企业微信|加入微信技术群|智造号|手机版| 世界先进制造技术论坛™(简称AMT™, 智造云™) ( 沪ICP备12020441号-3 )

GMT+8, 2026-4-21 12:59 , Processed in 2.901976 second(s), 48 queries .

论坛声明:AMT-智造云(世界先进制造技术论坛) 属纯技术性论坛,我们严格遵守《中华人民共和国网络安全法》、《个人信息保护法》等国家相关法律法规,请勿发布非法言论、非法广告等信息,多谢合作。
本论坛言论纯属发表者个人意见且会员单独承担发表内容的法律责任,与本论坛立场无关;会员参与本论坛讨论必须遵守中华人民共和国法律法规,凡涉及政治言论、色情、毒品、违法枪支销售等信息一律删除,并将积极配合和协助有关执法机关的调查,请所有会员注意!
本论坛资源由会员在本论坛发布,版权属于原作者;论坛所有资源为会员个人学习使用,请勿涉及商业用途并请在下载后24小时删除;如有侵犯原作者的版权和知识产权,请来信告知,我们将立即做出处理和回复,谢谢合作!

合作联系: 双日QQ客服:3419347041    单日QQ客服:3500763653    电话021-37709287    合作问题投诉:QQ:2969954637    邮箱:info@amtbbs.org    微信公众号:AMTBBS

 

快速回复 返回顶部 返回列表