中国AI太强,Meta工程师吓疯?自曝猖狂熬夜复制
发布时间:2025-01-25 09:01
新智元报道 编纂:编纂部【新智元导读】Meta员工在TeamBlind爆料,扑灭了一把火。自夸开源前锋的Meta,直接被DeepSeek这家中国公司整得汗颜无地。不只工程师分秒必争复现模子,年薪超越DeepSeek练习本钱的高管们,心底也有点虚。 明天,Meta员工在匿名社区TeamBlind上的一个帖子,在业内被传疯了。DeepSeek,实在地给了美国人亿点点「震动」。DeepSeek R1是天下上首个与OpenAI o1比肩的AI模子,并且与o1差别, R1仍是开源模子「Open Source Model」,比OpenAI还Open!更有人曝料,DeepSeek还只是个「副名目」,主业基本不是搞年夜模子! 开展全文 这不,OpenAI还没慌呢,Meta先慌了! 究竟Meta始终自夸开源前锋,但DeepSeek这种水平的开源,直接把它们拍在沙岸上。 更恐怖的是,DeepSeek的本钱也太太太低了,这么比起来,Meta拿着超高估算的团队,就显得很为难。 那些一团体拿的薪资,就超越全部DeepSeek V3练习本钱(仅550万美元)的高管,尤其坐立不安。 依据外部Meta外部人士爆料,DeepSeek客岁的V3,曾经给他们压力了。 当初,Meta的工程师正在放松所有时光,分秒必争地剖析DeepSeek,试图复制此中所有可能的技巧。 从前,是全天下追着美国的年夜模子拿着缩小镜研讨,当初情形竟倒转了过去,美国人也开端逆向工程了。今夕是何夕? 中国年夜模子的狂飙大进,真的让咱们觉得了魔幻事实主义的滋味。 Meta工程师吓疯了 TeamBlind上的帖子,全文曝料如下: 所有源于DeepSeek V3的呈现,它在基准测试中曾经让Llama 4黯然失色。更让人为难的是,一家「仅用550万美元练习估算的中国公司」就做到了这一点。 工程师们正在分秒必争地剖析DeepSeek,试图复制此中的所有可能技巧。这绝非夸大。 治理层正为怎样证实GenAI研发部分的巨额投入而忧愁。当部分里一个高管的薪资就超越练习全部DeepSeek V3的本钱,并且如许的高管另有数十位,他们该怎样向高层交接? DeepSeek R1的呈现让情形愈加严格。详细细节属于秘密,方便流露,不外很快就会公然了。 这本该是一个以工程为导向的精简部分,但由于太多人想要分一杯羹,工资收缩应聘范围,终极招致大家都支付了价值。 所有源于DeepSeek V3的呈现,它在基准测试中曾经让Llama 4黯然失色。更让人为难的是,一家「仅用550万美元练习估算的中国公司」就做到了这一点。 工程师们正在分秒必争地剖析DeepSeek,试图复制此中的所有可能技巧。这绝非夸大。 治理层正为怎样证实GenAI研发部分的巨额投入而忧愁。当部分里一个高管的薪资就超越练习全部DeepSeek V3的本钱,并且如许的高管另有数十位,他们该怎样向高层交接? DeepSeek R1的呈现让情形愈加严格。详细细节属于秘密,方便流露,不外很快就会公然了。 这本该是一个以工程为导向的精简部分,但由于太多人想要分一杯羹,工资收缩应聘范围,终极招致大家都支付了价值。 在本钱上,「一个高管 = DeepSeek V3」,这对给高管们开出天价年薪的硅谷年夜厂们,切实是啪啪打脸。 更是有网友被震动到:「DeepSeek R1在OpenAI、Meta、Grok以及谷歌的屁股下点了一把火,就像Open AI在第一次推出ChatGPT时那样震动。假如去失落人力瓶颈,到达o1级机能真的不须要花太多钱!!」 有网友以为,在此次AI海潮中,Meta确实落伍了。 但也有网友为Meta说明,究竟Meta曾经开端举动了,固然在GenAI范畴确实「僧多粥少」。 乃至,这个来自中国的AI曾经上了美国的消息。说话十分夸大—— 「中国始创企业DeepSeek,要挟了美国AI的主导位置。」 「否定、恼怒、失望、接收,美国人正在停止艰巨的心思重修。这是他们汗青上从未见过的最强敌手。」 不到600万美元的本钱,就能训出一个如斯强的模子,这几乎是彻底扯失落了美国金融业的遮羞布。 AI工业,真的须要动辄数万亿美元的投资么? 连带着,特朗普跟奥特曼搞的5000亿美元星际之门,也一会儿变得可疑了起来。 DeepSeek-R1有多强? 「花小钱办年夜事」,可见DeepSeek团队确实有「独门秘笈」,在技巧上生怕也超出了OpenAI。 DeepSeek还宣布了相干论文,先容了DeepSeek-R1的年夜范围强化进修(RL)练习、未经由监视微调(SFT)作为预处置步调等技巧细节。 论文链接:https://arxiV.org/pdf/2501.12948 这种「技巧自负」,让局部美国网友都开端了「反思」。 为何AI圈,如斯害怕DeepSeek? 来自VB最新一篇独家文章,特地将AI界黑马DeepSeek激发AI界惊动做了片面剖析。 就在多少天前,只有最专业的极客们才据说过DeepSeek。 它是一家建立于2015年幻方量化公司,背地投资者High-Flyer Capital Management。 直到从前多少天,这家公司敏捷成为硅谷最受存眷的推翻者,这重要归功于DeepSeek R1的出生。 不必SFT,仅凭强化进修就让模子推感性能堪比o1,并且在多项基准测试中,R1乃至超出了o1。 令人张口结舌的是,如斯强盛得模子,练习本钱仅500万美金,应用的GPU数目也远远低于OpenAI。 不只如斯,他们直接将其开源,Hugging Face下载量跟活泼度直接爆表。 并且,开辟者能够自在微调练习,API本钱要比等同o1模子低90%还要多。 与OpenAI仅低机能模子上供给网页搜寻差别,DeepSeek直接将R1与搜寻功效深度整合。 在一步一步战略中,这家中国公司完胜了OpenAI。 第一个,但不是最后一个 这也不会是最后一个,挑衅硅谷巨子主导位置的中国AI模子。 近来,字节全新宣布了「豆包1.5 Pro」,在第三方基准测试中,其机能与GPT-4o模子相称,但本钱仅为后者的1/50。前往搜狐,检查更多