2020-2024年代码生成模型发展全景图:开源与闭源项目的竞赛
2020年
- 10月:
- GPT-C: 最早发布的代码生成模型之一,基于GPT架构。
2021年
- 2月:
- PyMT5: 一个基于MT5架构的代码生成工具。
- 5月:
- CodeGPT: 基于GPT架构的代码生成模型,旨在帮助开发者编写代码。
- 7月:
- GPT-J: 开源的GPT系列模型,适用于多种任务,包括代码生成。
- 9月:
- Codex: OpenAI发布的一款强大的代码生成器,可以理解和编写代码。
- 11月:
- CodeT5: 基于T5模型的代码生成工具,提供更智能的代码补全。
2022年
- 1月:
- JuPyT5: 专为Jupyter环境优化的T5模型。
- 3月:
- AlphaCode: 新型代码生成器,提升了代码质量和生成速度。
- 4月:
- CodeGen: Salesforce推出的一款功能强大的代码生成工具。
- 7月:
- CodeRL, 和其他多个新工具发布。
- 9月:
- CodeGeeX, 和其他多个新工具发布。
2023年
- 1月:
- SantaCoder, 和其他多个新工具发布。
- 自2023年初至今,各大公司如腾讯、华为、Meta等陆续发布了各自的新型代码生成工具:
- 如腾讯的RLTF, Meta的Llama系列以及华为的PanGu-Coder2等。
更近期
每一年都有大量新工具和更新版本发布,如:
- 在2022年11月,OpenAI发布了Codex,这是一款功能强大的代码生成器,在开发者社区引起了广泛关注和应用。 