(资料图)
大型语言模型 (LLMs) 最近在代码层面的一系列下游任务中表现十分出彩。通过对大量基于代码的数据 (如 GitHub 公共数据) 进行预训练,LLM 可以学习丰富的上下文表征,这些表征可以迁移到各种与代码相关的下游任务。但是,许多现有的模型只能在一部分任务中表现良好,这可能是架构和预训练任务限制造成的。 从架构的角度来看,现有的 LLMs 通常采用纯编码器或纯解码器的模型,这些模型通常只在一些理解或生成任务上执行的效果出色。纯编码模型通常适用于理解文本、代码检索之类的任务,而生成代码类的生成任务用纯解码器模型能有更出色的性能表现。并且,最近的一些模型用编码器 - 解码器这种更统一的架构来应对不同的任务。虽然这些模型可以同时支持理解型、生成型任务,但在特定任务中没法达到最佳性能。在检索和代码完成任务上,编码器 - 解码器模型还是不如最先进 (SOTA) 的纯编码器和纯解码器基线。单模块架构虽然通常可以适用于所有任务,但它的局限性也会导致编码器 - 解码器模型的不足。总之,先前的方法在设计时并没有考虑如何让单个组件可以被激活以更好地适应不同类型的下游任务。 从学习对象的角度来看,目前的模型通常采用一组有限的预训练任务。由于预训练和微调阶段的差异,这些预训练任务会使一些下游任务性能下降。例如,基于 T5 的模型通常以跨度去噪目标进行训练。然而,在代码生成等下游任务中,大多数最先进的模型都是用下一个 token 预测目标进行预训练的,该目标可以逐 token 自回归地预测处理。学习对比代码表征对于理解文本、代码检索等任务至关重要,但许多模型没有接受过这一方面训练。尽管近期一些研究尝试引入对比学习任务来缓解这个问题,但这些方法忽略了文本和代码表征之间的细粒度跨模态对齐。 为解决上述限制,来自 Salesforce 的研究者提出了「CodeT5+」—— 一个新的基础 LLM 系列编码器 - 解码器,可用于广泛的代码理解和生成任务。 项目地址:/salesforce/CodeT5/tree/main/CodeT5%2B CodeT5 + 是基于编码器 - 解码器的模型,但可以灵活地在纯编码器、纯解码器以及编码器 - 解码器模式下操作,来适应不同的下游应用。总体架构如下图 1: 这种灵活性是基于预训练任务实现的,包括代码数据上的跨度去噪和因果语言建模 (CLM) 任务,以及文本 - 代码对比学习、匹配和文本 - 代码数据上的 CLM 任务。如此广泛的预训练任务可以帮助在代码和文本数据中学习丰富的表征,并弥合各种应用中的预训练 - 微调差距。研究者发现,将匹配任务与对比学习相结合,对于捕捉细粒度的文本 - 代码对齐和提高检索性能至关重要。 通过利用现成的 LLM 代码来初始化 CodeT5 + 的组件,用高效计算的预训练策略来扩展 CodeT5 + 的模型大小。CodeT5 + 采用了「浅编码器和深解码器」架构,其中编码器和解码器都从预训练的 checkpoints 中进行初始化,并由交叉注意力层连接。此外,该研究还冻结了深度解码器 LLM,只训练浅层编码器和交叉注意力层,从而大大减少了有效调优的可训练参数数量。最后,受 NLP 领域的启发,研究者开始探索 CodeT5 + 在指令调优上的效果,以更好地使模型与自然语言指令保持一致。 该研究在 20 多个与代码相关的基准测试中对 CodeT5 + 进行了广泛的评估,包括零样本、微调和指令调优。结果表明,与 SOTA 基线相比,CodeT5 + 在许多下游任务上有着实质性的性能提升,例如,8 个文本到代码检索任务 (+ avg. MRR), 2 个行级代码补全任务 (+ avg. Exact Match) 和 2 个检索增强代码生成任务 (+ avg. BLEU-4)。 在 MathQA 和 GSM8K 基准上的两个数学编程任务中,低于十亿参数大小的 CodeT5 + 模型明显优于许多多达 137B 参数的 LLM。特别是,在 HumanEval 基准上的零样本文本到代码生成任务中,指令调优后的 CodeT5+ 16B 与其他开源代码 LLM 相比,达到了新的 SOTA 结果,为 % pass@1 和 % pass@10,甚至超过了闭源 OpenAI code- cusherman -001 模型。最后,该研究发现 CodeT5 + 可以无缝的看作半参数检索增强生成系统,在代码生成方面明显优于其他类似方法。所有的 CodeT5 + 模型都将开源,以支持研究和开发者社区。 本文开发了 CodeT5+,一个新的开源代码大型语言模型家族,用于代码理解和生成任务。基于编码器 - 解码器架构,CodeT5 + 通过本文提出的在单模态和双模态数据上混合预训练目标的方式,增强了在不同下游任务中以不同模式运行的灵活性。 在单模态预训练阶段,研究者使用大量的代码数据,用计算高效的目标预训练模型。在双模态预训练阶段,继续用较小的具有跨模态学习目标的代码 - 文本数据集预训练模型。对于每个阶段,使用相同的权重联合优化多个预训练目标。 研究者发现这种分阶段训练方法可以有效地让模型接触更多样化的数据,以学习丰富的上下文表征。此外,他们探索了用现成的代码 LLM 初始化 CodeT5+,以有效地扩展模型。最后,CodeT5 + 中的模型组件可以动态组合以适应不同的下游应用任务。 研究者实现了一系列 CodeT5 + 模型,模型大小从 220M 到 16B 不等。 CodeT5+ 220M 和 770M 采用与 T5 相同的架构,并从头开始进行预训练,而 CodeT5+ 2B、6B、16B 采用「浅层编码器和深层解码器」架构,编码器分别从 CodeGen-mono 350M 初始化,解码器从 CodeGen-mono 2B、6B、16B 初始化。研究者将 CodeT5 + 与 SOTA 代码模型进行了比较,这些 LLM 可以分为 3 种类型:纯编码器、纯解码器和编码器 - 解码器模型。 在给定自然语言规范的情况下,研究者评估了模型在零样本设置下生成 Python 代码的能力,通过在单元测试中测试生成的代码来评估模型性能。表 2 中展示了合格率 pass@k。 研究者同时考察了其他代码生成任务,特别是两个数学编程基准 MathQAPython 和 GSM8K 。如表 3 所示,CodeT5 + 取得了显著的性能提升,超过了许多更大规模的代码 LLM。 图 6 展示了通过 MathQA-Python 上数学编程问题的复杂性来分析模型性能。对于每个问题,提取解决问题所需的推理步骤数。与 CodeT5 相比,CodeT5 + 对问题的复杂性 (即所需的推理步骤数量) 更鲁棒。 代码摘要任务旨在将代码片段总结为自然语言文档字符串。研究者使用了六种编程语言的 Clean 版本的 CodeSearchNet 数据集来评估这项任务的模型。 从表 4 中可以发现,编码器 - 解码器模型 (CodeT5 和 CodeT5+) 的性能通常优于纯编码器模型、纯解码器模型以及 UniLM-style 的模型 UniXcoder 。 研究者通过 line-level 补全任务评估了 CodeT5 + 仅解码器的生成能力,旨在根据上下文完成下一行代码。 如表 5 所示,CodeT5+(在纯解码器的模式下) 和纯解码器模型 (top block) 的性能都明显优于编码器 - 解码器模型(the middle block),验证了纯解码器的模型可以更好地适应代码补全任务。 研究者还通过跨多个 PL 的文本到代码检索任务评估 CodeT5 + 的代码理解能力。 从表 6 中可以看出,CodeT5+ 220M 明显优于所有现有的纯编码器 / 纯解码器模型 (顶部块) 和编码器 - 解码器模型 (中间块)。 ©THE END
转载请联系本公众号获得授权
投稿或寻求报道:content@
推荐内容
-
世界讯息:Salesforce推出基于LLM的Code T5+编码器解码器
-
中国的激光武器有多厉害?沙特曾用它击落13架无人机,一战成名!
-
iPhone充电电伤引争议_全球新视野
-
直播上课:天涯旧人|世界观热点
-
荣耀X50手机官宣:十年登峰之作
-
中国电信这么多中高层领导同时现身天翼云大会 原来定下了惊人计划-世界新要闻
-
甘肃省发布强对流黄色预警_当前视讯
-
十大空调排名品牌价格(十大空调排名)
-
【世界热闻】《装甲核心6》新演示展示了机甲战斗 机动方式!
-
特斯拉和Rivian合作,2025年起支持特斯拉充电标准
-
小米10至尊纪念版倍数_全球热头条
-
天天最新:联想高级副总裁关伟擅长供应链管理 还曾当过奥运火炬手挺有趣
-
放弃iPhone的人,越来越多_每日视点
-
2022年光刻机市场:ASML占82%,日系占18%,国产为0?
-
聚焦:E3 2024/2025已取消?官方称尚未做出最终决定
-
坐姿也能影响心情
-
2023淳安县交通发展投资集团有限公司招聘公告(年龄)
-
新华社送你一本 22 城文化指南-天天讯息
-
新资讯:长沙经开区政务服务大厅实行休息时间“零打烊” 今年已为企业办件1541次
-
伤物语百度云全集(伤物语百度云)
-
【世界新要闻】依然倒二!5月家具零售总额115亿元,同比增长5%
-
模拟山羊3颤金盾牌获取流程视频攻略
-
模拟山羊3背景检查器获取流程视频攻略
-
费卢杰六日腰射使用有什么技巧-环球微动态
-
费卢杰六日M16使用有什么技巧 每日速讯
-
焦点速讯:你关心的都在这!2023年高考志愿填报十问十答来了
-
怀孕3-4天有什么反应_怀孕3-4天有感觉吗|天天观焦点
-
今年全国快递业务量已达600亿件 每日视点
-
中成药全国集采“厮杀”激烈:15家企业降价超六成,每年节约药费超45亿
-
环球最新:青岛劳务外包公司排名_青岛劳务外包
-
ChatGPT:茅台酒为什么这么贵?-每日速递
-
华为618脱销的智能手表,无创测血糖还差临门一脚-IOTE物联网展
-
米家旅行箱:一场说走就走的旅程,极限收纳让旅途更无忧!-世界即时看
-
【环球聚看点】端午出行必备,魅族20超强信号体验让你“粽”享欢乐
-
Acer游戏本13代HX处理器,RTX4060,7499元_天天时讯
-
别让这些骗术伤害你!中国电信贴心总结“高考录取防骗指南”
-
华为运营商BG总裁李鹏曾在非洲和西欧都待过 贡献挺大
-
ChatGPT也涨不动了_天天日报
-
当前动态:芜湖公积金,新增2项跨省通办业务
-
环球关注:金观平:毫不动摇严守耕地红线
-
今日热门!南京端午假期客流量超262万人次 实现销售额8.9亿元
-
林允儿新剧开播,33岁依然像刚成团一样甜美可人,一点不显老|环球今头条
-
天天头条:费卢杰六日武器瞄准敌人有什么技巧
-
天天微速讯:缺氧翠绿星体是什么
-
每日头条!黎明前20分钟新手无限死在第一次缩圈的那个boss怎么办
-
世界时讯:缺氧荒芜之地是什么
-
2023珠海香洲区公办幼儿园拟录取名单查询时间及入口|每日速递
-
青藏铁路西格段复兴号动车组开始试运行
-
车险手续费“价格战”消费者获利了吗?
-
尚太科技(001301.SZ):预计三季度将保持较高的开工率_环球短讯
-
中华石龙子怎么养_中华石龙子如何养 视讯
-
焦点关注:手机QQ支持绑定微信号:微信可直接登录QQ
-
一名博士生如何欠openai五千美元的故事
-
2D异质结构分离CO2和H2 天天快讯
-
《碟中谍7:致命清算(上)》7月14日内地上映 天天观热点
-
即时看!影驰发布HOF EXTREME 50S PCIe 5.0 SSD:数据传输速度提升至12.4GB/s
-
观速讯丨江苏省2023年普通高校招生第一阶段录取控制分数线
-
东易日盛副总经理刘勇本科毕业做业务员?薪酬68万比李双侠少
-
金融壹账通连年亏损 CFO罗永涛称2024年将盈亏平衡 能做到吗? 当前速看
-
2023年高考志愿填报十问十答
-
棋子湾PK琼中养老哪个好?海南棋子湾哪里买房适合养老?
-
中国石油天然气集团有限公司原副总经理徐文荣接受审查调查
-
卫星化学257亿元投建延伸产业链,比尔·盖茨看多,科威特政府基金加仓|环球关注
-
Swift:5月人民币保持全球第五大最活跃货币_快资讯
-
网游“过脸”当生意,触犯刑律担责
-
ASML说,建立全自主芯片产业链不太可能,但中国就想试试
-
黎明前20分钟开局前期要去找敌人吗
-
缺氧低温盐泥泉有什么用
-
模拟山羊3水手获取流程视频攻略
-
黎明前20分钟可视范围有什么用
-
新疆6个节能减碳类项目获国家支持
-
【速看料】泰国娱乐圈年度盛典MayaTVAwards2023揭晓:James Jirayu和Pinkploy夺得最佳男女主演奖
-
全球快报:24家渝企组团“出海” 赴哈萨克斯坦、白俄罗斯等国拓展市场
-
感受光影里的城市魅力 湖里区第六届胶片电影露天放映大会开幕|全球热资讯
-
lol周杰伦直播首秀_在哪里能看重播 每日关注
-
认真聊一下,恒大北极星的5个领取方案 热点聚焦
-
癌症药物在对抗疟疾方面显示出潜力 天天简讯
-
天天短讯!从2999元跌至1859元,12GB+256GB+IMX800+曲面屏,售价更亲民了
-
每日资讯:新型农业经营主体服务系统免费试用
-
深度解读:黑洞需要多长时间才能蒸发完毕,超乎我们想象!|热文
-
HKC 2k 240Hz OLED显示器 4699元开卖
-
3款ChatGPT浏览器插件优化-快播报
-
拿出6.26亿元!宁德时代:拟为员工提供无息借款买房,借款期限不超十年
-
一线城市房地产投资吸引力依然领先|今日关注
-
揭秘三大通信运营商规模最大的5家地市分公司:广东就有4家
-
网易有道副总罗媛毕业后就加入 却不在上市公司高管名单中?_世界今亮点
-
广汽埃安副总肖勇搞销售出身 公司高管谈销量目标口气一个比一个大 世界快播
-
速读:普里戈任与白俄总统达成协议 同意停止在俄领土行动
-
9省区市将现35以上高温 内蒙古局地可达40 世界快资讯
-
联想y470启动盘-(联想y470u盘启动怎么弄) 头条焦点
-
细细密密的光丨第三十一章 不可回首(下)
-
动态焦点:磐安冷水镇:第二届老年人运动会兜球比赛收官
-
视讯!泰晤士:曼城改善给B席的续约报价,瓜帅希望留住他
-
环球最新:你关心的都在这!2023年高考志愿填报十问十答来了
-
天天快看:这个夏天,全球共享广东荔枝
-
不花一分钱!一个软件让你看遍全网付费资源,爽爆了-世界动态
-
安卓手机误拨紧急求救电话数激增,多国呼吁用户关闭此功能
-
美国宣布成立新 NIST 人工智能公共工作组,应对生成式人工智能风险_全球观天下
-
农作物被外来基因“五马分尸”,减产灭种何来高产 ? 全球关注
-
华北黄淮等地高温天气将有所减弱 江南华南降雨26日后减弱