这一次,它直接甩出了一份硬核成绩单,在衡量多语言软件工程能力的Multi-SWE-bench榜单中,以仅10B的激活参数拿下了49.4%的成绩,超越了Claude Sonnet 4.5等国际顶尖竞品,拿下全球SOTA。
Vibe Coding这类概念一火,不懂开发的老板就对AI编程产生了不切实际的幻想。有程序员跟我吐槽,他们老板最近开通了Copilot企业账号,转头就把所有项目工期砍到了原来的70%,理由是“AI能帮你写代码”。 别说摸鱼,隐性加班反而更多了,因为不仅开发时限被缩短,还得额外给AI擦屁股,这就要提到Vibe Coding的技术债务问题了。
2025.12.14 晚上发生的 OpenAI "Code Interpreter"(内部代号 ...