文爱 app 字节豆包大模子团队开源首个多说话类SWE数据集
发布日期:2025-04-11 14:44 点击次数:199

新浪科技讯 4月10日下昼音书文爱 app,字节进步豆包大模子团队开源首个多说话类 SWE 数据集“Multi-SWE-bench”,可用于评估和晋升大模子“自动修 Bug”才调。在SWE-bench基础上,Multi-SWE-bench初次障翳Python除外的7种主流编程说话,是着实面向栈工程”的评测基准。
骚波妹影视豆包大模子团队但愿,Multi-SWE-bench 能当作大模子在多种主流编程说话与着实代码环境中的系统性评测基准,推进自动编程才调向更实用、更工程化的标的发展。比较于以往聚焦 Python 的单说话任务,Multi-SWE-bench 更面对执行中的多说话拓荒场景,也更能响应面前模子在“自动化软件工程”方朝上的实质才调限度。(张奥)

包袱剪辑:何俊熹 文爱 app