CodeGeeX2 是多語言代碼生成模型?CodeGeeX?(KDD’23) 的第二代模型。不同于一代 CodeGeeX(完全在國產(chǎn)華為昇騰芯片平臺訓練) ,CodeGeeX2 是基于?ChatGLM2?架構(gòu)加入代碼預訓練實現(xiàn),得益于 ChatGLM2 的更優(yōu)性能,CodeGeeX2 在多項指標上取得性能提升(+107% > CodeGeeX;僅60億參數(shù)即超過150億參數(shù)的 StarCoder-15B 近10%),更多特性包括:
- 更強大的代碼能力:基于 ChatGLM2-6B 基座語言模型,CodeGeeX2-6B 進一步經(jīng)過了 600B 代碼數(shù)據(jù)預訓練,相比一代模型,在代碼能力上全面提升,HumanEval-X?評測集的六種編程語言均大幅提升 (Python +57%, C++ +71%, Java +54%, JavaScript +83%, Go +56%, Rust +321%),在Python上達到 35.9% 的 Pass@1 一次通過率,超越規(guī)模更大的 StarCoder-15B。
- 更優(yōu)秀的模型特性:繼承 ChatGLM2-6B 模型特性,CodeGeeX2-6B 更好支持中英文輸入,支持最大 8192 序列長度,推理速度較一代 CodeGeeX-13B 大幅提升,量化后僅需6GB顯存即可運行,支持輕量級本地化部署。
- 更全面的AI編程助手:CodeGeeX插件(VS Code,?Jetbrains)后端升級,支持超過100種編程語言,新增上下文補全、跨文件補全等實用功能。結(jié)合 Ask CodeGeeX 交互式AI編程助手,支持中英文對話解決各種編程問題,包括且不限于代碼解釋、代碼翻譯、代碼糾錯、文檔生成等,幫助程序員更高效開發(fā)。
- 更開放的協(xié)議:CodeGeeX2-6B 權(quán)重對學術研究完全開放,填寫登記表申請商業(yè)使用。
數(shù)據(jù)統(tǒng)計
數(shù)據(jù)評估
關于CodeGeeX特別聲明
本站AI工具箱提供的CodeGeeX都來源于網(wǎng)絡,不保證外部鏈接的準確性和完整性,同時,對于該外部鏈接的指向,不由AI工具箱實際控制,在2023年 8月 5日 14:10收錄時,該網(wǎng)頁上的內(nèi)容,都屬于合規(guī)合法,后期網(wǎng)頁的內(nèi)容如出現(xiàn)違規(guī),可以直接聯(lián)系網(wǎng)站管理員進行刪除,AI工具箱不承擔任何責任。