GPT-5真身曝光，首测编程**全网，一句话秒生游戏，OpenAI双雄备战AGI技巧

角色养成作者：发表于 2026-04-03 06:14 阅读：0

2026年4月5日，神秘模型Horizon Alpha火遍全网，编码首测*能逆天，各种三方基准实测相继放出。就在发布前夕，OpenAI核心大脑专访坦言模型还有瓶颈，但坚信Scaling Law没有尽头。

愈发强烈了。

今早，一款神秘模型Horizon Alpha突然上线OpenRouter，各种榜单和测试席卷了全网。

Horizon Alpha模型的上下文为256K，响应*速，非常擅长创意写作。

它还具备了「推理」功能，不过，推理token的预算是o4-mini的两倍。

在编程方面，Horizon Alpha堪称无敌了。

它可以一句话生成「水果忍者」、「外星人抓奶牛」等各种游戏，还能轻而易举地通过「六边形物理模拟」测试。

在写作EQ-Bench基准测试中，Horizon Alpha位列**，远超o3、Gemini 2.5 Pro。

此前被爆料的各种代号模型，比如lobster、zenith、summit等，在多项测试中**了所有人。

种种迹象表明，

目前404

关于Horizon Alpha的更多细节，全部浓缩在网友的实测中了。

目前，在OpenRouter平台上，即可开启对Horizon Alpha版本的测试。

在模型推理时，Horizon Alpha的吞吐量是最快的，达120个token/s。

吞吐量对比测试，Horizon Alpha是目前最快的。

物理模拟**，秒搭网页

效果令人惊喜且生成速度*快。

另一个让小球在多边形中，模拟物理的测试。

不论是六边形，还是三角形，即便小球可运动的区间缩小，也不会影响效果。

再上点难度，20个球在旋转的七边形内弹跳。网友惊讶地表示，「这是自己目前见过最出色的版本之一」。

Horizon Alpha能够在3分48秒中，创建一个展示一系列简单有趣的浏览器小游戏的网页。

给Horizon Alpha同一个提示，「创建一个视觉上有趣的着色器，可以在 twigl 应用中运行，让它看起来像暴风雨中的海洋」。

沃顿商学院CS教授Ethan Mollick惊叹道，这是迄今为止**的，而且创建速度非常快。

当网友要求其「创建一个与遛狗的商业网站」，Horizon Alpha爱问一大堆需要提前确认的问题；Sonnet 4则会直接给出解决方案。

最终，从搭建的效果来看，Horizon Alpha输出的质量高且简洁。Sonnet 4输出的更长，内容更全面，也更具创意。

Horizon Alpha还会自主搭建一个**网站。

设计一绝，审美感**

AI大佬Matthew Ber**n亲自测试其SVG创建和UI设计功能，Horizon Alpha瞬间生成了一张专业设计美感的图。

此前，AI圈大神Simon Willison曾表示，从一张「骑自行车的鹈鹕」就可以看透AI进化史。

如今，用Horizon Alpha生成同款SVG测试，是所有模型当中最强的那个。

其他一些SVG**案例。

需要注意的是，虽然各种测试表现不凡，Horizon Alpha可能只是一款小模型。

接下来就坐等OpenAI发布了。

OpenAI「双雄」专访，奥特曼盛赞

这对黄金搭档，

这篇由MIT Technology Review做的**专访，没想到深得奥特曼的心。

他对此大加赞赏，「我通常认为这类文章说不到点上，

能够得到奥特曼的高度认可，究竟讲了什么？

*悉OpenAI内部人员变动的人都知道，Jakub Pachocki和Mark Chen都是后起之秀。

他们风格迥异，

Mark Chen，曾经的华尔街量化**员，着装考究，谈吐间挥洒自如，可以说与AI毫不搭界。

入职OpenAI后，擅长将复杂的研究转化为人人可用的产品。

而Jakub Pachocki，一位低调的理论计算机科学家，接替了离职后的Ilya，痴迷于突破AI逻辑与创造力的*限。

关于内部的角色分工，Pachocki是这么说的，「Chen负责组建和管理研究团队，而我负责设定研究路线图，并确立我们长期的技术愿景」。

可以说是「无缝切换」。

不论技术难题多么复杂，Pachocki和Mark总能非常默契，迅速分工合力攻克。

AGI标尺，自主时间

当前，是一款更强、更快、更全能的巨兽。

即便是当前最强推理模型，也无法有效将知识串联起来」。

Pachocki补充道，「我们仍处于推理范式最开端」。

如何让一款模型进行长期的学习和探索，并提出新颖的想法，才是至关重要。

同时，在他们看来，Scaling Law远未触及天花板，模型就会变得越来越好。

被问题如何看待AGI时，Mark Chen提出了一个指标——模型能更长时间地自主工作的能力，即「自主时间」。

这个概念简单却深刻，它代表着AI在面对复杂问题时，能持续取得进展，而无需人类干预的时间长度。

这个愿景，远远超出了当前模型的能力，自主时间仅限于几分钟到一小时，遇到陌生场景往往会「卡住」。

数学+编程，摘下AI圣杯？

一是，在AtCoder世界巡回赛总决赛中获第二名；二是，在IMO 2025大赛中夺下**。

在AtCoder比赛中，Psyho的胜利展现了人类*有的创造*思维，类似AlphaGo当年击败李世石的围棋比赛。

Pachocki表示，「我们在这里谈论的是编程和数学，但它实际上关乎创造力，提出新颖的想法，将不同领域的想法联系起来」。

在他们二人看来，数学和编程是「通用智能」的基石。

36氪经**发布。

本站所有文章资讯、展示的图片素材等内容均为注册用户上传(部分报媒/平媒内容转载自网络合作媒体)，仅供学习参考。用户通过本站上传、发布的任何内容的知识产权归属用户或原始著作权人所有。如有侵犯您的版权，请联系我们反馈本站将在三个工作日内改正。

« 上一篇影驰GTX560威五有什么特点下一篇 » 功夫熊猫神龙大侠手机版

🔗 相关推荐

角色养成

GPT-5真身曝光，首测编程**全网，一句话秒生游戏，OpenAI双雄备战AGI技巧

🔗 相关推荐

影驰GTX560威五有什么特点

2026免费软件大全 *软件平台哪个比较好

魅蓝S6体验：侧面指纹会是全面屏手机的天才想法吗？

功夫熊猫神龙大侠手机版

2025年云游戏平台***10 低配设备也能畅玩3A大作

成都12岁女孩被“蓝鲸游戏”缠上，吓得不敢上网、不用手机

💬 评论区

发表评论

全部评论

GPT-5真身曝光，首测编程**全网，一句话秒生游戏，OpenAI双雄备战AGI技巧

🔗 相关推荐

影驰GTX560威五有什么特点

2026****免费软件大全 *****软件平台哪个比较好

魅蓝S6体验：侧面指纹会是全面屏手机的天才想法吗？

功夫熊猫神龙大侠手机版

2025年云游戏平台***10 低配设备也能畅玩3A大作

成都12岁女孩被“蓝鲸游戏”缠上，吓得不敢上网、不用手机

💬 评论区

发表评论

全部评论

登录畅享更多权益

密码登录

账号注册

提示

2026免费软件大全 *软件平台哪个比较好