(资料图片仅供参考)
大型语言模型 (LLMs) 最近在代码层面的一系列下游任务中表现十分出彩。通过对大量基于代码的数据 (如 GitHub 公共数据) 进行预训练,LLM 可以学习丰富的上下文表征,这些表征可以迁移到各种与代码相关的下游任务。但是,许多现有的模型只能在一部分任务中表现良好,这可能是架构和预训练任务限制造成的。 从架构的角度来看,现有的 LLMs 通常采用纯编码器或纯解码器的模型,这些模型通常只在一些理解或生成任务上执行的效果出色。纯编码模型通常适用于理解文本、代码检索之类的任务,而生成代码类的生成任务用纯解码器模型能有更出色的性能表现。并且,最近的一些模型用编码器 - 解码器这种更统一的架构来应对不同的任务。虽然这些模型可以同时支持理解型、生成型任务,但在特定任务中没法达到最佳性能。在检索和代码完成任务上,编码器 - 解码器模型还是不如最先进 (SOTA) 的纯编码器和纯解码器基线。单模块架构虽然通常可以适用于所有任务,但它的局限性也会导致编码器 - 解码器模型的不足。总之,先前的方法在设计时并没有考虑如何让单个组件可以被激活以更好地适应不同类型的下游任务。 从学习对象的角度来看,目前的模型通常采用一组有限的预训练任务。由于预训练和微调阶段的差异,这些预训练任务会使一些下游任务性能下降。例如,基于 T5 的模型通常以跨度去噪目标进行训练。然而,在代码生成等下游任务中,大多数最先进的模型都是用下一个 token 预测目标进行预训练的,该目标可以逐 token 自回归地预测处理。学习对比代码表征对于理解文本、代码检索等任务至关重要,但许多模型没有接受过这一方面训练。尽管近期一些研究尝试引入对比学习任务来缓解这个问题,但这些方法忽略了文本和代码表征之间的细粒度跨模态对齐。 为解决上述限制,来自 Salesforce 的研究者提出了「CodeT5+」—— 一个新的基础 LLM 系列编码器 - 解码器,可用于广泛的代码理解和生成任务。 项目地址:/salesforce/CodeT5/tree/main/CodeT5%2B CodeT5 + 是基于编码器 - 解码器的模型,但可以灵活地在纯编码器、纯解码器以及编码器 - 解码器模式下操作,来适应不同的下游应用。总体架构如下图 1: 这种灵活性是基于预训练任务实现的,包括代码数据上的跨度去噪和因果语言建模 (CLM) 任务,以及文本 - 代码对比学习、匹配和文本 - 代码数据上的 CLM 任务。如此广泛的预训练任务可以帮助在代码和文本数据中学习丰富的表征,并弥合各种应用中的预训练 - 微调差距。研究者发现,将匹配任务与对比学习相结合,对于捕捉细粒度的文本 - 代码对齐和提高检索性能至关重要。 通过利用现成的 LLM 代码来初始化 CodeT5 + 的组件,用高效计算的预训练策略来扩展 CodeT5 + 的模型大小。CodeT5 + 采用了「浅编码器和深解码器」架构,其中编码器和解码器都从预训练的 checkpoints 中进行初始化,并由交叉注意力层连接。此外,该研究还冻结了深度解码器 LLM,只训练浅层编码器和交叉注意力层,从而大大减少了有效调优的可训练参数数量。最后,受 NLP 领域的启发,研究者开始探索 CodeT5 + 在指令调优上的效果,以更好地使模型与自然语言指令保持一致。 该研究在 20 多个与代码相关的基准测试中对 CodeT5 + 进行了广泛的评估,包括零样本、微调和指令调优。结果表明,与 SOTA 基线相比,CodeT5 + 在许多下游任务上有着实质性的性能提升,例如,8 个文本到代码检索任务 (+ avg. MRR), 2 个行级代码补全任务 (+ avg. Exact Match) 和 2 个检索增强代码生成任务 (+ avg. BLEU-4)。 在 MathQA 和 GSM8K 基准上的两个数学编程任务中,低于十亿参数大小的 CodeT5 + 模型明显优于许多多达 137B 参数的 LLM。特别是,在 HumanEval 基准上的零样本文本到代码生成任务中,指令调优后的 CodeT5+ 16B 与其他开源代码 LLM 相比,达到了新的 SOTA 结果,为 % pass@1 和 % pass@10,甚至超过了闭源 OpenAI code- cusherman -001 模型。最后,该研究发现 CodeT5 + 可以无缝的看作半参数检索增强生成系统,在代码生成方面明显优于其他类似方法。所有的 CodeT5 + 模型都将开源,以支持研究和开发者社区。 本文开发了 CodeT5+,一个新的开源代码大型语言模型家族,用于代码理解和生成任务。基于编码器 - 解码器架构,CodeT5 + 通过本文提出的在单模态和双模态数据上混合预训练目标的方式,增强了在不同下游任务中以不同模式运行的灵活性。 在单模态预训练阶段,研究者使用大量的代码数据,用计算高效的目标预训练模型。在双模态预训练阶段,继续用较小的具有跨模态学习目标的代码 - 文本数据集预训练模型。对于每个阶段,使用相同的权重联合优化多个预训练目标。 研究者发现这种分阶段训练方法可以有效地让模型接触更多样化的数据,以学习丰富的上下文表征。此外,他们探索了用现成的代码 LLM 初始化 CodeT5+,以有效地扩展模型。最后,CodeT5 + 中的模型组件可以动态组合以适应不同的下游应用任务。 研究者实现了一系列 CodeT5 + 模型,模型大小从 220M 到 16B 不等。 CodeT5+ 220M 和 770M 采用与 T5 相同的架构,并从头开始进行预训练,而 CodeT5+ 2B、6B、16B 采用「浅层编码器和深层解码器」架构,编码器分别从 CodeGen-mono 350M 初始化,解码器从 CodeGen-mono 2B、6B、16B 初始化。研究者将 CodeT5 + 与 SOTA 代码模型进行了比较,这些 LLM 可以分为 3 种类型:纯编码器、纯解码器和编码器 - 解码器模型。 在给定自然语言规范的情况下,研究者评估了模型在零样本设置下生成 Python 代码的能力,通过在单元测试中测试生成的代码来评估模型性能。表 2 中展示了合格率 pass@k。 研究者同时考察了其他代码生成任务,特别是两个数学编程基准 MathQAPython 和 GSM8K 。如表 3 所示,CodeT5 + 取得了显著的性能提升,超过了许多更大规模的代码 LLM。 图 6 展示了通过 MathQA-Python 上数学编程问题的复杂性来分析模型性能。对于每个问题,提取解决问题所需的推理步骤数。与 CodeT5 相比,CodeT5 + 对问题的复杂性 (即所需的推理步骤数量) 更鲁棒。 代码摘要任务旨在将代码片段总结为自然语言文档字符串。研究者使用了六种编程语言的 Clean 版本的 CodeSearchNet 数据集来评估这项任务的模型。 从表 4 中可以发现,编码器 - 解码器模型 (CodeT5 和 CodeT5+) 的性能通常优于纯编码器模型、纯解码器模型以及 UniLM-style 的模型 UniXcoder 。 研究者通过 line-level 补全任务评估了 CodeT5 + 仅解码器的生成能力,旨在根据上下文完成下一行代码。 如表 5 所示,CodeT5+(在纯解码器的模式下) 和纯解码器模型 (top block) 的性能都明显优于编码器 - 解码器模型(the middle block),验证了纯解码器的模型可以更好地适应代码补全任务。 研究者还通过跨多个 PL 的文本到代码检索任务评估 CodeT5 + 的代码理解能力。 从表 6 中可以看出,CodeT5+ 220M 明显优于所有现有的纯编码器 / 纯解码器模型 (顶部块) 和编码器 - 解码器模型 (中间块)。 ©THE END
转载请联系本公众号获得授权
投稿或寻求报道:content@
推荐内容
快资讯丨Salesforce推出基于LLM的Code T5+编码器解码器
1.06亿人次出游!端午节假期国内旅游收入373.10亿元
江西进贤县农民反映稻田疑被投毒:近30亩枯死,警方介入|环球热头条
当前速看:香港财政司司长:与人民银行就数字人民币跨境零售支付合作进入第二阶段测试
天天亮点!全球最大水光互补电站雅砻江柯拉光伏电站投产发电
百所高校今开咨询会,考生“手握”分数心里更有底
苹果 Vision Pro 头显特性:可在厨房家电“身上”设置倒计时
厦门今明多发局部性雷阵雨 中考生要注意防范
当前快讯:驾乘人员意外伤害保险和座位险区别是什么?选哪个好?
世界头条:奔驰C200运动版4MATIC怎么样及斯柯达柯珞克多少钱
2023年广西高考本科录取分数线出炉,分数线是多少
高管离职、IDG事业群收缩,卷入大模型之战后,百度自动驾驶让出C位
普里戈任称瓦格纳集团车队停止行进 调转方向返回营地
环球讯息:梁山三网融合服务,乡村振兴新赛道越走越带劲儿
瓦格纳撤军 停止在俄境内活动 基本信息讲解
清商怨·昆河[清商怨]
热搜上的“哈尔滨私拆承重墙”事件:为什么说愚蠢的人最可怕?
马蜂窝端午旅游大数据报告:亲子游、毕业游热度大涨,避暑胜地搭配清凉玩法受关注 世界通讯
南召县太山庙乡:光荣在党五十年 见证初心与信仰
见梅西一面,需要付出什么?
全球微动态丨俄罗斯最大国有商业银行:照常营业 提现和外汇需求没有增加
臭蛋对人体有哪些伤害(臭蛋)
17岁女孩边充电边玩iPhone遭电击,苹果客服回应
当前资讯!【原耽双男主小说推荐】《藏起来》by阿阮有酒txt
Excel之PowerQuery 行转列动态表头
当前滚动:高二学生呼吸心脏骤停,3小时跨省转运至上海,移植心脏起死回生
卓创资讯:需求淡季到来 棉花产业链将呈“花强纱弱”特征-环球播资讯
信息:国资委:东北地区国企改革签约投资预计超五千亿
一汽奔腾拟引入外部投资者加快转型
天天要闻:安全生产月期间,“火焰蓝+志愿蓝”齐上阵护平安
天天实时:江西产业链创新链高效融合
谷歌已开始推出使用人工智能工具协助用户形成短信的功能
焦点快播:直击渝企出海拓市场 | 从重庆到阿斯塔纳 内陆开放的“双向奔赴”
快看点丨解析《闭嘴跳舞》运镜被嘲
蛇泡酒泡了三年没死还咬死个人(蛇泡)
世界速读:手机如何连接电视机播放直播_手机如何连接电视
端午假期 兰州高星酒店预订量增长超19.5倍-今日播报
自动驾驶到底需要多少个传感器?
持股达 0.37% 滴滴科技入股爱驰汽车
全球时讯:卡萨帝冰箱618:24小时破亿!刷新高端单品纪录
世界微头条丨5月最畅销游戏:腾讯《王者荣耀》创收入新纪录
广东省2023年普通高校招生录取最低分数线公布
2023版8克熊猫金币价格(2023年06月25日)_天天热资讯
【报资讯】平安银行“换帅” 冀光恒接任行长
柳州鹿寨:推动生态环境持续改善 城区防洪堤变锻炼休闲地
环球看点!莞惠城际暑运列车开行或微调!
excel数据验证在哪里设置的(excel数据验证在哪里)
全球报道:场独立型人格_场独立型
踏浪扬风帆,踏水学校六年级毕业典礼温情满满
要闻:一出两地同台的好戏已经启幕
转型压力下的铸造业如何破局突围
山西师范大学在职研究生毕业后能助力涨工资吗?
十二星座专属动漫情侣头像,水瓶座唐三小舞,金牛座人人喜欢!
中国石油天然气集团有限公司原副总经理徐文荣被查-视焦点讯
当前要闻:博文中学 天津博文中学分数线
亿腾医药五度递表港交所主板
2023端午奇妙游今晚直播,有惊喜活动
香港:收到近一百个全球各地家族办公室查询,三分之一有意在港设立办事处-环球快播报
医保每月交300为什么余额只有80 分析如下
他从普京的心腹,险些成为普京的心腹大患-聚看点
手机流量被限速了,怎么办?
医院召开全面从严治党工作会暨作风提升年活动动员会
最终幻想16是PS5独占吗_最终幻想16PS5独占多久
当前热点-《长风渡》顾九思中解元了吗?
男子每天吃一斤杨梅,狂吃20天突然浑身乏力,到医院化验发现已达到尿毒症期
村书记话家乡新变化丨临沂小山村做活“红绿”融合文旅:人均收入翻倍,农家乐年入将超20万 环球快讯
全球视点!安徽省宿州市埇桥区市场监管局“除患助企”持续推动产品质量安全水平提升
瓦格纳上演了一场悲剧-观热点
医疗事故应如何鉴定其责任方
中国石油天然气集团有限公司原党组副书记、副总经理徐文荣接受审查调查 世界看热讯
每日热门:现实正受到围攻?超三成专家悲观预测数字生活
2023年前4个月,我国肉类及制品累计出口8.73亿美元,同比下降1.18%_全球新资讯
每日快播:「多彩新论」把全面深化改革作为推进中国式现代化贵州实践的根本动力
视频网站创收新方向:YouTube被曝将加载线上游戏 新视野
曝小米14代号后稷和神农!体验、颜值、徕卡为王|天天速递
“穗城源”首届九龙湖龙舟邀请赛开锣
江西进贤县农民反映稻田疑被投毒:近30亩枯死,警方介入|环球热头条
【世界独家】百瑞纪集团与深业泰富集团签署战略合作协议 最新合作项目深业博院在成都签约落地
舞阳县工信局多措并举严拧企业“安全阀”
保定农商银行开展端午节主题活动|速看料
要闻速递:全国首场预制菜装备产业大会将启幕, “政产学研用金”多元要素齐聚珠海
百所高校今开咨询会,考生“手握”分数心里更有底
当前速看:香港财政司司长:与人民银行就数字人民币跨境零售支付合作进入第二阶段测试
遇到这种虫子 千万别挤压!夏季外出应该怎样防虫、驱虫
天天微头条丨性能比肩AMG 比亚迪方程豹首车再曝光
施秉县独木龙舟赛开赛 36支独木龙舟队展开激烈角逐
关注!9个乌克兰旅将参战,全由西方训练
看点:昆山巴城积极探索集宿区社区化管理新路径
2023注册会计师《公司战略与风险管理》必背考点10:产业五种竞争力_今日热门
天天滚动:“科中深化务实合作的新见证”
海南投资房子什么地方好(海南能投资房子买哪里好)
当前焦点!粽叶飘香迎端午 开封市禹王台区人武部积极开展端午节军民共建活动
当前热讯:6月23日至25日 西藏开始高考网上模拟志愿填报
全球讯息:玩法“上新” “暑期档”旅游持续升温
《17岁生日礼物》:年少轻狂的青春,以爱为礼物|焦点速讯
22.4万名考生陆续踏入考场!中考语文卷请考生书写北京|世界快消息
全球即时:突发!飞机坠毁,6人失踪
全球热消息:旅游市场消费潜力持续释放
上海发布儿童玩具抽查情况 18批次产品结构安全不合格
大运会火炬传递在重庆大学举行
天天快看点丨普陀区确权登记中心积极备战首届不动产登记职业技能竞赛
全球视点!为乡村振兴挥洒青春汗水(青春日记)
视点!360彩票网官网下载安装(360彩票网站)
中国信通院公布2023上半年“可信数据库”评测结果,33款产品通过36项测试|当前视讯
科学预防溺水,共青团郑州市委开展防溺水主题教育讲座
童享快乐,爱心义卖
快讯:市场分析:成长行业回落 A股维持震荡
湖南中考统一命题,影响几何|天天聚看点
天天即时:端午假期陕西消费市场持续火热
市场监管行风建设在行动|湖南桂阳:优化行风破解监管服务发展难题
白马井镇最低价看海小区(白马井最便宜的房子)
网剧老炮儿在线观看第一季 老炮儿电影完整免费
环球讯息:梁山三网融合服务,乡村振兴新赛道越走越带劲儿
587分!重庆市2023年中考“联招”统一录取送档线和成绩查询时间公布
当前快讯:驾乘人员意外伤害保险和座位险区别是什么?选哪个好?
公共 | 山东多元文旅消费场景带火端午游
中国女篮再争亚洲杯冠军 全球看点
进口面粉检出农药残留 已销至我国香港|每日速讯
国产飞腾CPU成功为京东618提供了核心算力支撑 每日速读
海外故事|端午节前报喜讯
全球新消息丨滚动:不动声色的拼音(不动声色) 全球时快讯_滚动 通讯
文明旅游 | 你我同行 共建和谐
【美容护理】美容护理双周刊:监管引导之下,家用美容仪市场潜力可观 环球新动态
每日看点!绝口不提AI,但苹果已经成为一家人工智能公司
商圈夏日市集聚齐端午人气_世界快看
地铁列车内的紧急装置,能按吗?_每日速读
构成危险物品肇事罪的处罚是怎样的-每日看点
北京举办端午文化节系列活动 龙舟大赛世园公园上演 每日快讯
热搜上的“哈尔滨私拆承重墙”事件:为什么说愚蠢的人最可怕?
6月25日陕西地区硝酸铵价格暂稳
抖音集团:字节跳动收购消费金融公司传言不实
天天微资讯!苏妲己扮演者张馨予 苏妲己扮演者
韩国市民团体敦促日本政府在陆地保管核污染水
瞄准目标全力拼是件幸福的事儿|天天速讯
U19世界杯小组赛首战不敌法国 赵维伦:有收获 但也有许多不足
不用做任务的传奇手游推荐 十大无任务传奇手游排行榜
重磅!湖南省2023高考录取分数线出炉 当前视点
IPO研究|2022 年我国智能制造系统集成市场规模3,573 亿元|天天快播
广西:扩大保障性租赁住房供给助力新市民、青年人“住有所居”
2023年06月25日05时30分澳大利亚元/人民币汇率最新报价
世界头条:奔驰C200运动版4MATIC怎么样及斯柯达柯珞克多少钱
湖北通报5起供销社系统违纪违法典型案例
80多部影片陆续定档 暑期档推动电影市场回暖_世界通讯
捷豹路虎召回部分汽车:机油可能泄露,增加起火风险 每日热讯
微信申请注册 微信注册时间查询 世界今亮点
环球快资讯:善良之人终有好报,彭清林勇敢跳江救人迎来了桃花运!
端午假期海口旅游总收入3.24亿元-环球即时
遥望科技:在小冰公司技术加持下,虚拟人在互动性和形象动作等方面均取得突破-全球微速讯
外媒:FDIC意外泄露硅谷银行最大客户的详细信息-今日热议
苏州三批供地:保利置业14.82亿元摘斜塘老街地块 配有人才房