天工不止造物，也能修bug：Skywork今+日+资+讯-盒子网

400 多年前，宋应星著成《天工开物》。这是一部写给匠人、也写给未来的书。它让人相信：技术不是死物，而是人与世界持续互动的方式。

如果说「天工」代表了中国古代对「工程」与「制造」的极致理解，那么今天，一个同样以「天工」（即 Skywork）为名的 Agent 智能体，正试图在另一片疆域（代码世界）中，继承这份精神。

这个 Skywork，不是炼铁铸器的匠人，而是自主代码智能体基座模型，要修补的是一种现代最复杂的人造系统：（开源）软件工程。它不握锤凿，而是靠多轮交互、长上下文理解与逻辑推理，在成千上万的 GitHub 项目中识别 issue/bug、定位原因、打补丁，并验证是否真的修好了。故此，它得名 SkyworkSWE。（注：SWE 是指软件工程 / Software Engineering。）

SkyworkSWE 因何而生？

软件智能体面临的困难

在古人的世界里，修一口破鼎、补一段布帛是「匠人精神」的体现。而在今天，最频繁「破裂」的，莫过于代码。

如今，代码系统早已成为现代文明的骨架。它们运行在日常软件、银行服务、交通调度等各式系统中，也支撑着我们所依赖的 AI 算法本身。但和古代器物一样，再精妙的程序也难免出现 bug—— 有些是逻辑失误，有些是环境变迁，有些甚至源于协作失控。比如，就在前几天，AWS、谷歌云、Azure 和 Cloudflare 都发生了中断，连带着 ChatGPT 和 Cursor 等热门 AI 应用也一并短暂失联；而这一事故的原因可能是一次错误的自动配额更新导致谷歌的 API 管理系统出现了故障。

同时，bug 修复也是软件工程中最基础，却也是最复杂、最消耗人力的任务之一。特别是在真实的 GitHub 项目中，修一个 bug 并不是「找到一行错字那么简单」，它常常需要：

读取和理解成百上千个文件；

推演变量在不同模块的流动路径；

阅读前人留下的修复记录与讨论；

理解上下文、猜测意图、编写代码补丁；

最后，还得跑几遍测试，看看是不是真的「已解决」。

那么，我们能否使用 AI 智能体来完成这些任务呢？

当然可以！但我们需要的绝不是传统的用于解决单独编程任务的 AI 编程模型，而是需要像人类开发者一样能够理解历史上下文、进行多轮推理、在模糊与不确定中做决策、具备落地执行的能力的软件工程智能体。

而难题也随之而生：这类任务长期缺乏高质量训练数据。市面上现有的 SWE 数据集，不是验证机制不足，就是训练样本杂乱无章，难以支持模型在真实工程中进化。另外，这些数据集的规模普遍较小，导致数据 Scaling Law 适用性不明确。

正是为了应对这种挑战，昆仑万维推出了自主代码智能体基座模型 SkyworkSWE。它不仅代表一个性能卓越的模型 ——32B 参数量级别的最强开源软件工程智能体，更是一个集数据、验证、推理与修复为一体的完整系统。不仅如此，他们还基于此成功揭示了 LLM 软件工程能力的 Scaling Law。

目前，该模型的技术报告和模型权重都已发布。

天工不止造物，也能修bug：Skywork今+日+资+讯

相关推荐

评论抢沙发

:: 分类

热门标签

盒子财经-关注财经知识的网站

觉得文章有用就打赏一下文章作者

非常感谢你的打赏，我们将继续给力更多优质内容，让我们一起创建更加美好的网络世界！

支付宝扫一扫打赏

微信扫一扫打赏