首页 > 汽车新闻 > 汽车新闻 > OpenAI 活动第二弹:“强化微调”打造领域专家 AI 模型

OpenAI 活动第二弹:“强化微调”打造领域专家 AI 模型

发布时间:2024-12-07 22:19:44来源: 15210273549

 12 月 7 日消息,OpenAI 启动了为期 12 天的“shipmas”新品发布周期,将推出一系列新功能、新产品以及相关演示。本次活动第二日,OpenAI 推出了强化微调(Reinforcement Fine-Tuning),帮助开发者和机器学习工程师打造针对特定复杂领域任务的专家模型。

该项目通过全新的模型定制技术,让开发者可以使用高质量任务集对模型进行微调,并利用参考答案评估模型的响应,从而提升模型在特定领域任务中的推理能力和准确性。

强化微调简介

IT之家附上官方介绍:开发人员能够使用数十到数千个高质量任务,定制 OpenAI 的模型,并使用提供的参考答案对模型的响应进行评分。官方表示这项技术强化了模型推理类似问题的方式,并提高了其在该领域特定任务上的准确性。

与标准微调不同,RFT 利用强化学习算法,可以将模型性能从高中水平提升到专家博士水平。

RFT 与监督式微调不同,它不是让模型模仿输入,而是教模型以全新的方式进行推理,通过对模型答案进行评分并强化正确的推理路线,RFT 只需少量示例即可显著提高模型性能。

RFT 支持用户利用自己的黄金数据集创建独特的模型,并将其应用于法律、金融、工程、保险等需要专业知识的领域。

强化微调面向群体

OpenAI 励研究机构、高校和企业申请,特别是那些目前由专家领导执行一系列狭窄复杂任务,并且将受益于人工智能协助的机构。

OpenAI 表示强化微调在结果具有客观“正确”答案,且大多数专家会同意的任务中表现出色,因此认为在法律、保险、医疗、金融、工程等领域会有更好的表现。

参与者可提前访问 Alpha 版强化微调 API,并在特定领域任务中进行测试,此外 OpenAI 鼓励参与者分享数据集,共同改进 OpenAI 模型。

OpenAI 预计 2025 年初公开发布强化微调功能。

OpenAI 首席执行官山姆・阿尔特曼(Sam Altman)表示:“强化微调,效果出奇地好;它是我 2024 年最大的惊喜之一。”

汽车新闻更多>>

2024美国车市回暖,本田逆袭Stellantis跻身前五,混动能否再超电动车? 新能源车企2025:盈利之年,谁能率先突围? 充电桩车位长时间占用AI识别系统 电动汽车充电站燃油车占用监测 入门电动车性价比真相:这两款低配真的值得入手吗? 法拉利首款纯电动车型F222有望今年投产 ,预计售价约367万人民币 新能源车2025:盈利与交付双重考验,谁将脱颖而出? 锂矿储量跃升全球第二,新能源车降价五成却没那么简单! 春运高速充电不再难,新能源车主可安心回家过年! 大屏、大空间、大角度后轮转向,领克900将是今年旗舰SUV新标杆? “暖男”相伴,冬天也能轻松露营,深蓝S05了解一下! 东风柳汽2025年合作伙伴大会:全新重卡平台乘龙H7 Pro亮相! 比亚迪智驾看强汉 媒体齐聚2025款汉高快+城区智驾抢先体验营 “油电同智”战略显成效,上汽大众大众品牌年销超114万辆 远程新能源商用车成为第9届亚冬会官方合作伙伴 可醇可电可油! 吉利今年内将推两款全新“超醇电混”产品 吉利控股全面践行《台州宣言》 引领绿色智能通行生态 MX-5最强性能道路版来了,马自达不再保留 领克09产品矩阵单一,搭载2.0T+48V轻混,配置没有明显短板 探店全新宝马5系,颜值高,内饰档次感足,智能化水准提升,真香 体验福特锐际:优惠达4万,全系2.0T+8AT可选四驱,值得购买吗? 比亚迪海豹荣获2024-2025日本年度风云车“十大最佳车型”奖 奥迪式前脸,比亚迪汉同款尾灯!奇瑞风云A8L改款换面大升级 长4米77,配1.4T和10.1英寸大屏!捷达VA7叫板轩逸朗逸能赢吗? 小米YU7最新谍照曝光:前轮后方增设进气口,长后悬设计独树一帜 亦庄牵头申报!京津冀智能网联新能源汽车集群晋级“国家队” 全新亚洲龙逆势热销一涨再涨:成功没有巧合 价值至上是根本 关润再掌棋局:鸿海“抢亲”日产,能否续写汽车业传奇? 赛力斯创始人张兴海做客央视直播间,畅谈问界“新豪华”发展之道 消息称特斯拉正与美国得州进行初步谈判,以实现 Robotaxi 落地 Cybertruck确定入华,1月1日开售,特斯拉:中国官网已上架