Devstral 2 – Mistral AI开源的新一代编程模型系列

每日快讯 2025-12-10

Devstral 2是什么

Devstral 2 是 Mistral AI 推出的新一代开源编程模型系列,包含 123B 参数的 Devstral 2 和 24B 参数的 Devstral Small 2。Devstral 2 拥有 256K 上下文窗口,SWE-bench 验证准确

率高达 72.2%,性能卓越且成本高效,支持跨文件探索、架构级推理和自动修正等功能,适合企业级开发。Devstral Small 2 轻量级,可在消费级硬件上本地部署,支持多模态输入。两者均通过 Mistral Vibe CLI 提供终端交互式编程辅助,助力开发者高效完成任务,推动开源编程模型的发展。

424e4047923f908f290a6b0e1440a48e.jpg

Devstral 2的主要功能

  • 跨文件代码理解和生成Devstral 2 能理解和生成跨多个文件的代码,支持在大型代码库中进行复杂的代码修改和重构,同时保持架构级的上下文感知,帮助开发者高效处理多文件项目。
  • 架构级推理:模型能跟踪代码库的整体架构,理解框架依赖关系,在进行代码修改时保持整体架构的稳定性,避免因局部修改引发的全局问题。
  • 自动错误检测与修正:Devstral 2 能检测代码中的错误,尝试自动修正,通过多次尝试和验证来确保代码的正确性,在修复遗留系统中的问题时表现出色。
  • 支持多种编程语言:模型对多种主流编程语言有良好的支持能力,能根据需求生成和优化不同语言的代码,满足多样化的开发需求。
  • 高效的代码生成与优化:Devstral 2 能生成高质量、高效的代码,同时优化现有代码的性能,帮助开发者提升开发效率和代码质量。

Devstral 2的测试表现

  • SWE-bench Verified 测试
    • Devstral 2(123B 参数):准确率达到 72.2%,成为目前表现最好的开源模型之一。
    • Devstral Small 2(24B 参数):准确率为 68.0%,性能与体积是其五倍的模型相当。
  • 与竞品对比
    • Devstral 2 与 DeepSeek V3.2 对比:胜率 42.8%,明显优于 DeepSeek V3.2(28.6%)。
    • 对比 Claude Sonnet 4.5(闭源模型)时:Claude Sonnet 4.5 仍更受欢迎,表明 Devstral 2 与顶级闭源模型仍有差距,但已非常接近。


    f832ca910a8999edafb9a344d71bc843.jpg

    Devstral 2项目地址

    • 项目官网:https://mistral.ai/news/devstral-2-vibe-cli
    • HuggingFace模型库:https://huggingface.co/collections/mistralai/devstral-2

    Devstral 2产品定价

    • Devstral 2(123B 参数)目前通过 API 免费提供。免费期结束后,API 定价为每百万输入 / 输出 token 分别为 0.40 美元 和 2.00 美元。
    • Devstral Small 2(24B 参数):API 定价为每百万输入 / 输出 token 分别为 0.10 美元 和 0.30 美元。

    Devstral 2的应用场景

    • 代码生成:Devstral 2 可快速生成多种语言代码,助力开发者高效启动项目。
    • 代码优化模型支持跨文件修改,帮助开发者优化代码,提升性能和可维护性。
    • 错误修复模型自动检测、修正代码错误,节省调试时间,适合遗留系统修复。
    • 企业级应用:模型可定制化微调,支持架构级推理,能满足企业复杂项目需求。
    • 本地部署:Devstral Small 2 能在本地运行,保护数据隐私,适合安全要求高的场景。
    ©️版权声明:若无特殊声明,本站所有文章版权均归AI导航猿和数眼智能原创和所有,未经许可,任何个人、媒体、网站、团体不得转载、抄袭或以其他方式复制发表本站内容。否则,我站将依法保留追究相关法律责任的权利。

    相关文章