|

艺首龙
2000活跃值=1元

首页 > 原创知识 > 原创知识 > 微软推出iPhone能跑的ChatGPT级模型，网友：OpenAI得把3.5淘汰了

微软推出iPhone能跑的ChatGPT级模型，网友：OpenAI得把3.5淘汰了

发布时间：2024-04-23 15:37:06

Llama 3发布刚几天，微软就出手截胡了？

微软推出iPhone能跑的ChatGPT级模型，网友：OpenAI得把3.5淘汰了

刚刚发布的Phi-3系列小模型技术报告，引起AI圈热议。

微软推出iPhone能跑的ChatGPT级模型，网友：OpenAI得把3.5淘汰了

其中仅3.8B参数的Phi-3-mini在多项基准测试中超过了Llama 3 8B。

为了方便开源社区使用，还特意设计成了与Llama系列兼容的结构。

微软推出iPhone能跑的ChatGPT级模型，网友：OpenAI得把3.5淘汰了

微软这次打出“手机就能直接跑的小模型”的旗号，4bit量化后的phi-3-mini在iPhone 14 pro和iPhone 15使用的苹果A16芯片上跑到每秒12 token。

微软推出iPhone能跑的ChatGPT级模型，网友：OpenAI得把3.5淘汰了

这意味着，现在手机上能本地运行的最佳开源模型，已经做到ChatGPT水平。

微软推出iPhone能跑的ChatGPT级模型，网友：OpenAI得把3.5淘汰了

在技术报告中还玩了一把花活，让phi-3-mini自己解释为什么构建小到手机能跑的模型很令人惊叹。

微软推出iPhone能跑的ChatGPT级模型，网友：OpenAI得把3.5淘汰了

除了mini杯之外，小杯中杯也一并发布：

Phi-3-small，7B参数，为支持多语言换用了tiktoken分词器，并额外增加10%多语种数据。

Phi-3-medium，14B参数，在更多数据上训练，多数测试中已超越GPT-3.5和Mixtral 8x7b MoE。

（大杯他们目前不打算做）

作者阵容一看也不简单，一眼扫过去MSRA和MSR雷蒙德团队都投入了不少人。

微软推出iPhone能跑的ChatGPT级模型，网友：OpenAI得把3.5淘汰了

那么，Phi-3系列到底有什么独特之处呢？

根据技术报告中披露，其核心秘诀就在于数据。

去年团队就发现，单纯堆砌参数量并不是提升模型性能的唯一路径。

反而是精心设计训练数据，尤其是利用大语言模型本身去生成合成数据，配合严格过滤的高质量数据，反而能让中小模型的能力大幅跃升。

也就是训练阶段只接触教科书级别的高质量数据，Textbooks are all you need。

微软推出iPhone能跑的ChatGPT级模型，网友：OpenAI得把3.5淘汰了

Phi-3也延续了这一思路，这次他们更是下了血本:

投喂了多达3.3万亿token的训练数据（medium中杯是4.8万亿）
大幅强化了数据的”教育水平”过滤
更多样化的合成数据，涵盖逻辑推理、知识问答等多种技能
独特的指令微调和RLHF训练，大幅提升对话和安全性

举个例子，比如某一天足球比赛的结果可能对于大模型是良好的训练数据，但微软团队删除了这些加强知识的数据，留下更多能提高模型推理能力的数据。

这样一来，对比Llama-2系列，就可以用更小的参数获得更高的MMLU测试分数了。

【返回列表】

特别声明：以上内容(如有图片或视频亦包括在内)为“艺首龙用户上传并发布"，本平台仅提供信息存储服务。

下一篇:超过15项升级，iPhone 16全面曝光，网友：等iPhone 17

上一篇:iPhone 14 Plus，是不是史上最差的 iPhone？

原创知识更多>>

谷歌Gemini最“小”的一次迭代，姚顺宇为何高呼“不可阻挡”？佳能EOS R3 Mark II首创双原生分辨率：2400万/5400万像素双模式蔚来单日换电量突破16万次春节假期第三次刷新纪录全民自动驾驶指日可待！特斯拉官宣FSD里程突破128亿公里比人驾更安全已修复：微软承认Exchange/Teams本月误杀合法邮件和链接奥特曼：中国科技进步令人瞩目，ChatGPT将推Instagram式广告消息称三星为防开发泄密，在公司内部上线“加密聊天”通信系统 Go语言1.26版本正式发布：泛型限制放宽亚马逊将启动第二轮大裁员：上万人失业影响云业务等多部门宇树澄清2025年销售数据：人形机器人实际出货量超5500台英特尔Q4营收137亿美元净亏6亿，2026年Q1盈利指引归零小学生组团刷差评竟然惊动千问官方专门开了个会财讯传媒更名BFB HEALTH：市值超12亿，切入远程医疗健康管理赛道苹果首款折叠屏蓄势待发 iPhone Fold模型上手 AI时代的教育差距，体现在资源使用的效率与质量上写在微信15周年：拒绝59秒语音，邮件才是职场文明前OpenAI高管穆拉蒂新公司两位联合创始人离职，转头回老东家 DeepSeek与字节跳动踏进同一条河 “棋圣”聂卫平逝世雷军发文悼念偶像继摩尔、沐曦之后，2026年A股还有令人沸腾的IPO诞生? 国产RISC-V芯片新动向进迭时空融资超6亿元马自达首款自有纯电平台车型“难产”，最早得等到2028年消息称苹果遭遇供应链危机，一块“玻璃布”卡住iPhone 18系列命脉格罗方德将收购Synopsys新思ARC业务，进一步丰富半导体IP产品组合波士顿动力人形机器人CES首秀，计划2028年进厂造车吉大正元：VPN综合安全网关获IPv6认证冯提莫分享减肥后肚皮松弛原因快速减重50斤导致体质变化古力娜扎宣发时跳舞，肩带突然断裂，险些走光，面红耳赤太尴尬 2025内娱“新”面孔之谁是你心中的短国天降紫微星？ “你为什么这么老才生我？”71岁老戏骨发文称被18岁儿子嫌弃，看得人心酸：他用半生演活了别人，却演砸了自己的父亲角色

Copyright 2017-2025 艺首龙版权所有京ICP备17119658号