机械自动化
JetBrains发布AI编码智能体基准测试平台DPAI Arena
日期:2025-11-19 20:13

  JetBrains 也正在关心 Spring AI Bench,以扩展 DPAI Arena 中的 Java 基准测试流,并取该项目标焦点团队慎密合做以鞭策 Java 生态系统中的更多可变性和多径基准测试。

  IT之家 11 月 17 日动静,编程 IDE 开辟商 JetBrains 今日发文,跟着 AI 的兴起,现正在的一项环节挑和是若何权衡 AI 辅帮东西正在现实世界中带来的效率提拔。为了应对这一挑和,JetBrains 决定打制。

  DPAI Arena 是业内首格式、多言语、多框架和多工做流基准测试平台,旨正在权衡 AI 编码智能体正在现实世界软件工程使命中的成效。它环绕矫捷且基于径的架构建立而成,可以或许对各类工做流(例如,修补、bug 批改、测试生成、静态阐发等)进行公允、可沉现的比力。

  DPAI Arena 将可权衡的工做效率带入 AI 辅帮软件开辟范畴。Spring Benchmark是该平台的第一项基准,它带来了针对将来贡献的手艺尺度。起首,它实现了数据集建立原则,并细致申明了支撑的评估格局和一般法则。其次,它为解耦根本架构供给了根本,使任何人都能采用本人的数据集(BYOD 体例)并沉用根本架构进行本人的评估。

  JetBrains 暗示,当前的基准测试所依赖的数据集已过时,涵盖的手艺范畴狭小,而且过于局限地关心问题到补丁工做流。业界仍然缺乏一个中立且基于尺度的框架,用于权衡它们对开辟者工做效率的实正影响。

  JetBrains 打算将此项目献给 Linux Foundation,供其成立多元且包涵的手艺指点委员会,以确定平台的将来成长标的目的。



welcometo888集团官方微信

子公司网址