欢迎光临北京软件和信息服务业协会官方网站
深势科技发布Deploy-Master并上线玻尔,一天内自动化部署5万个Agent-Ready科学工具
发布日期:2026-01-12    来源:深势科技    分享到:

近日,深势科技玻尔(Bohrium)+ SciMaster 团队围绕科研工具大规模自动化部署的研究成果发表于 arXiv。论文报告了一项面向真实开源生态的规模化实践:从 50 万级开源候选仓库出发,系统检索、去重与筛选后,将 5 万余个科研工具候选纳入自动化编译与部署流程,并生成可复现、可验证的运行环境,形成可被科研人员与科研智能体直接调用的 Agent-Ready 工具单元。

Deploy-Master 已在玻尔平台上线并开放使用,面向科研社区提供自动化编译与部署服务:

https://www.bohrium.com/apps/deploy-master

论文地址:

https://arxiv.org/abs/2601.03513


规模化实践:

单日完成52,550次构建尝试,

验证通过50,112个工具

根据论文介绍,在工具发现阶段,系统从 50 万级开源候选仓库出发,经过多轮去重与严格筛选,最终确定 52,550 个具备明确科研工具属性、可进入构建流程的候选对象。随后,系统在单日内对这 52,550 个仓库发起自动化构建尝试,并对产出的运行环境进行最小可执行验证,最终 50,112 个工具验证通过,整体成功率达到 95.36%。 

这意味着,这些工具不仅“存在于仓库中”,还具备了可复现的运行环境与可检查的执行入口,能够被真实使用、复用和自动化调用。

1bdd7e38-873c-4046-b18d-3741555fe692.png

配图 1:5 万+ Agent-Ready 工具覆盖生命科学、化学与材料、物理地学与空间科学、工程系统与科研基础设施等方向。


Deploy-Master如何工作:

智能体独立完成

发现、构建与验证

支撑上述结果的核心系统是 Deploy-Master。Deploy-Master 采用“智能体驱动”的方式,将科研工具从开源仓库自动转化为可运行、可验证的工具能力单元,形成“发现—构建—验证—发布”的自动部署闭环。

在本次实践中,Deploy-Master 主要由两类智能体协同完成任务:

  • 工具发现智能体(Search Agent):面向科学与工程任务,对大规模开源仓库进行系统检索与迭代扩展,并基于明确的科研工具准入标准完成去重与过滤,逐步收敛至可进入构建验证的候选集合;

  • 构建与验证智能体(Build Agent):对入选仓库自动推断构建方式与运行入口,完成环境封装与编译部署,并通过最小可执行命令对工具进行执行验证;验证通过后形成可复用的 Agent-Ready 工具单元,进入统一发布与检索体系。

在这一流程里,核心标准是 “可复现运行环境 + 最小可执行验证”,而非仅依赖文档说明或人工判断。

d14effbc-bf42-43c4-a69a-3b36da5dc05e.png

配图 2:Deploy-Master 通过工具发现智能体与构建验证智能体协同,把仓库转化为 Agent-Ready 的科学能力。

在统一的自动化流程下,系统也得以对大规模部署过程本身进行系统性观察。从实践结果看,大多数工具可以在约 7 分钟内完成构建,但整体分布呈现出明显的长尾特征:一部分工具仅包含轻量级脚本或解释型代码,而另一部分则涉及复杂编译流程、深层依赖以及系统级库配置,其构建时间显著更长。这种差异并不会阻断整体流程,但直接决定了规模化部署下的成本结构。

在成功部署的 50,112 个工具中,工具覆盖 170+ 种编程语言。Python 占比最大(52.3%),其余语言的部署成功率整体保持在较高水平。少数成功率相对较低的情况,主要集中在依赖复杂编译链或系统级库的场景,如 C/C++、Fortran 以及部分 R 工具。这并不意味着这些语言“天生更难部署”,而是反映了其工具链对底层环境的耦合程度更高,从而放大了构建规格中的不确定性。

在 2,438 次失败的构建尝试中,失败原因并非均匀分布,而是高度集中在构建流程与依赖/编译链不匹配等少数类别,明显多于资源不足、网络异常或权限问题。这些失败在规模化条件下反而成为系统暴露问题、持续优化调度策略与隔离机制的重要信号。

e65df7ea-0087-40cd-974a-6221043f332c.png

配图 3:部署实践总结(部署结果、许可证与语言分布、失败类型、应用层级与“语言规模—成功率”关系等)

Deploy-Master为

Agentic Science at Scale 

提供可执行工具底座

长期以来,科研领域并不缺高质量开源软件,但由于编译复杂、依赖链深、环境假设强,许多工具往往只能在特定课题组或特定计算环境中稳定使用。结果是,大多数平台能够长期稳定维护与交付的科研工具规模,常常停留在数百级别,“把工具跑起来”本身就成为科研流程中的隐性成本。

Deploy-Master 所展示的价值在于:当工具的发现、编译、部署与验证能够被自动化、系统化地处理,科研工具次具备了在大规模条件下被持续交付和复用的工程基础。对科研人员而言,这降低了复现与协作的门槛;对科研智能体而言,这意味着可以在统一、可靠的运行环境中调用真实工具,进一步组织与验证科研工作流。

Deploy-Master 并非孤立工作。它与玻尔平台的统一运行环境,以及 SciMaster 引领的科研智能体体系,共同构成了面向未来科研范式的重要基础设施组合:当大规模科研工具能够被稳定执行,当智能体可以调用真实工具并完成闭环验证,科研自动化与智能协作才可能从概念走向持续演进的现实系统。

你知道你的Internet Explorer是过时了吗?

为了得到我们网站最好的体验效果,我们建议您升级到最新版本的Internet Explorer或选择另一个web浏览器.一个列表最流行的web浏览器在下面可以找到.