GPT-5来了马斯克：我不服 - cnBeta.COM 移动版(WAP)

返回上一页首页 | cnbeta报时: 23:37:41

GPT-5来了马斯克：我不服

发布日期:2025-08-10 12:44:48 稿源：科技狐

人工智能巨头 OpenAI 最近终于推出了万众期待的新一代旗舰模型 GPT-5。在发布会上，CEO 山姆·奥特曼用一个颇具戏剧性的比喻来形容它的跃升：“GPT-3 像高中生，偶尔有灵光却缺乏稳定；GPT-4 像大学生，兼具智能与实用；而 GPT-5，则像是与一位博士级专家对话。”

他还自嘲“在 GPT-5 面前一无是处”，吊足了全球用户的胃口。这场等待了两年半的升级，“千呼万唤始出来”。

说起来，GPT-5 的诞生并不容易。背后经历了长达一年的艰难研发，核心团队还被高薪挖角，算力开销大得惊人。

OpenAI 这一路真是走得既焦虑又艰辛。现在，终于把这个“统一系统”搬上了台面，大家都在等它能带来什么新花样。

概括来说，GPT5 最大的变化就是从一个“聊天机器人”进化成了一个真正能干活的“全能助理”。

首先，多模态开挂让这个新助理的“脑子”变好使了。过去你跟它说话、发图都得分开来，现在是“听说读写看”一把抓，你丢给它什么它都能立刻理解。

更关键的是，它学会了“动手”。以前的 GPT 只能给你出主意，现在的 GPT-5 能直接连接你的其他软件，帮你操作Office、在开发工具里写代码，甚至处理工作流程。

为了让这个助理不那么呆板，OpenAI 还给它预设了不同的“人格”，你可以随时把它切换成毒舌的、严谨的或者善解人意的模式。

自从 DeepSeek 开创了“Think 模式”之后，让大模型在回答前先“想一想”似乎成了行业标配，各家都推出了类似的功能。

但 GPT-5 有点不一样，它把这个过程变得更直接了。

你不需要去特意寻找或点击某个按钮，只要在提问时加上一句“认真思考”，系统就会自动为你切换到那个更擅长深度分析的 gpt-5-thinking 模式，用更强的“脑力”来解决你的问题。

接着就是 GPT 传统保留节目：屠榜。OpenAI 甩出了 25 个榜单，密密麻麻的图表告诉你 GPT-5 在各个维度有多牛。

事实性幻觉大幅减少，比 GPT-4o 少了 44%，比 o3 少了 78%，基本上是不胡说八道了。

数学竞赛直接干到了满分，现实世界编程能力新高，人类知识测试新高，多模态能力新高……反正就是新高，新高，全是新高。

发布会一结束，全球的网红和博主们就第一时间冲了进去，开始对 GPT-5 进行五花八门的“极限施压”测试。

其中，50 万粉丝的油管主 Matthew Berman 搞了个大的，他用一个 25 分钟的视频，密集展示了 GPT-5 近 30 个堪称变态的任务。

比如，让 GPT-5 写了个程序，能瞬间生成、打乱甚至复原一个复杂的 20 阶魔方。

更狠的是，它直接在网页里复刻出了 Word 和 Excel 的完整应用。注意，是能用的那个软件，而不是给你画个表格那么简单。

从经典的“生命游戏”3D版，到可以随便调节重力、空气阻力的流体动力学模拟器，GPT-5还真如奥特曼之前比喻的“博士生水平”。

然而，就在开发者们为之狂欢时，另一边的画风却完全不同。

资本市场最先用脚投票，发布当天概念股普遍回调，显然没被这个“博士生”彻底打动。

毕竟，大家等了两年半，期待的是一场石破天惊的革命，结果只等到了一次意料之中的常规升级，失望在所难免。

更何况，如今的 AI 竞赛早已进入了残酷的“春秋战国”时代，各路诸侯的技术差距正在飞速缩小，OpenAI 再想靠常规操作就甩开对手几个身位，已经难上加难。

全球大模型进化的下一个方向，OpenAI的GPT-5做出来了-36氪

在这片喧嚣中，OpenAI 的老冤家马斯克更是第一个站出来唱反调，直接甩出成绩单，表示 GPT-5 还不如他家的 Grok 4。

不仅资本和对手不买账，普通网友的吐槽声也越来越大。

大家最直观的感受是，GPT-5 的“智商”好像是高了，但“情商”却下降了。

很多人反映，现在用它写文案、写话术，感觉文字变得生硬、机械，没了以前那种灵动和自然。

有网友一针见血地调侃：“情绪和逻辑就像跷跷板，你把逻辑这头死死按住，情感那头可不就弹飞了吗？”

难怪不少网友担心自己最顺手的 GPT-4.5 会就此消失，不过很快就有热心网友发现，设置里其实有个开关，过去的模型还是可以切换回来的。

这种感觉，让很多人觉得 AI 似乎真的进入了瓶颈期。

而争议最大的，还是官方每次都吹得最响的编程能力。

很多人第一反应还是：“感觉不如 Claude 好用啊？” 这种“奥特曼式营销”宣传时天花乱坠，实际用起来却有落差，让不少人对榜单上的“新高”打了好几个问号。

不过也有网友反馈开发一个粤语学习应用，让几家大模型都试了试，结果 Claude 和 Gemini 在生成 UI 和精准修改代码时都或多或少出了问题，只有 GPT-5 稳稳地完成了任务，效果还出奇地好。

说到底，GPT-5 给人的感觉，就像一个严重偏科的天才：它的文科一塌糊涂，写不出有温度的文字；但它的理科，尤其是在需要严密逻辑和复杂工程能力的领域，还是十分抗打。

老狐觉得网友的这句话就概括得恰如其分：只是没有预期那么好……但仍旧是当前最能打的大模型。

查看网友评论返回完整版观看

最新资讯

加载中...

微软Xbox部门约1600名员工遭裁员本轮共裁员约4800人

国际足联暂缓美男足前锋红牌禁赛处罚美总统介入引发争议

特斯拉推出加长版Model Y 瞄准家庭SUV市场

韩国内存市场再现涨价潮：三星DDR4价格一月内飙升19% 涨幅超DDR5

应对欧盟“维修权”法案初代任天堂Switch或在欧洲市场面临停产

英特尔拟推双面供电14A Gen2工艺迎战台积电与三星1.4纳米攻势

电动汽车电池行驶数十万英里后性能超出预期

SpaceX公布AI数据中心计划同步推进星链卫星脱轨

卖内存比印钞还快三星今年利润将超越过去40年总和

苹果遭遇史上最严重泄密后 “华强北版”iPhone 18还远吗

宇树科技IPO最新重大进展审核状态变更为注册生效

今日最热

加载中...

没有秘密的苹果，边界正在崩塌

把你的车悄悄弄坏再修好这其实是4S店的基本操作

字节跳动与阿里巴巴暂停拟人化AI代理功能应对新规落地

王力宏演唱会摔倒脸部、耳朵等多处受伤

中国版星链两天两发千帆星座在轨卫星总量突破238颗

TCL回应国家一级文物现其广告：未授权或参与放置任何品牌标识

苹果iPhone Ultra和iPhone 18 Pro Max五大差异曝光

打不过就加入微软Edge 150稳定版正式开放谷歌账号登录

联通移动等回应“老年机信号不佳”：国内2G、3G网基站快消失了

不顾美监管机构反对 NASA局长驾驶70年代老战斗机参加表演

折叠屏iPhone Ultra或将重演iPhone X上市节奏

返回上一页首页 | cnbeta报时: 23:37:41

文字版标准版电脑端

© 2003-2026