Devin:全球首个全自主AI软件工程师智能体
Devin是由人工智能初创公司Cognition推出的全球首个全自主的AI软件工程师智能体,具备强大的编程和软件开发能力,能够在多个方面协助或完全独立地完成软件开发任务。在SWE-bench基准测试中,Devin解决实际问题的表现远超如GPT-4和Claude 2等AI模型。
关于Devin的开发公司Cognition
Cognition的成立时间虽短,但其团队成员拥有丰富的AI前沿工作经验,并且拥有多枚国际信息学奥林匹克竞赛(IOI)金牌。目前已获得彼得·蒂尔的Founders Fund基金领投的2100万美元A轮融资。
Devin的主要功能
- 自主学习新技术:通过阅读文档和代码来学习它不熟悉的技术,扩展其技能集。
- 端到端构建和部署程序:理解整个软件开发流程,从前端设计到后端部署,甚至包括将应用程序发布上线。
- 自主查找并修复Bug:出色的调试能力,发现并修复代码中的错误。
- 训练和微调AI模型:处理常规编程任务,同时帮助训练和微调其他AI模型。
- 修复开源库:理解和解决开源社区中的问题,例如修复已知的bug或实现新的特性请求。
- 对成熟生产库做贡献:修复已知错误或添加新功能。
Devin的性能对比
在SWE-bench基准测试中,Devin能够正确处理13.86%的问题,这一成绩显著高于之前技术水平的1.96%,显示出Devin在理解和解决实际编程问题方面的巨大优势。
与其他AI模型的对比
Devin的表现远远超过了其他知名的AI模型,如GPT-4和Claude 2,这些模型在同样的测试中的正确率通常较低。
如何使用Devin
Devin目前仍在内测中,如需了解更多信息,请访问Cognition官网。想要抢先体验的用户可填写内测申请表。
相关AI网站
暂无评论...