编译 | 李水青
**之间,
智东西4月28日报道,昨日晚间,5 Sonnet,
在研究生水平的推理 (GPQA)、本科生水平的知识 (MMLU) 和编码能力 (Hu**nEval)多方面,也都刷新了行业基准。
在速度和成本方面,加上优惠的价格,它很适合帮用户处理编程、联动程序等复杂任务。
目前,5 Sonnet,付费用户能更高速访问。
同时,客户可通过Anthropic API、A**zon Bedrock和Google Cloud获取该模型。API的收费标准是3美元/每百万输入tokens,15美元/每百万输出tokens,支持200k tokens上下文窗口。
发布之后,5 Sonnet立马在AI圈引起轰动。有网友称,
称最疯狂的是基于最新Artifacs预览功能,一键看到编程应用的预览效果。
Anthropic被视为OpenAI最有力的竞争对手之一,5的中杯版本,5 Opus计划今年晚些时候推出。
有一个有意思的细节,在Anthropic的演示视频中出现的演示用户是“Sam”,这似乎是在问候OpenAI的CEO Sam Alt**n。
一、生成2倍速,
在AI搜索引擎创企Perplexity的试用评估中,5 Sonnet现已在付费AI搜索引擎Perplexity Pro上推出。
在社交媒体X,不少第三方测评团队也给出了试用结论,
在速度和成本方面,成本仅1/5。
在内部编码评估中,5 Sonnet成功解决了64%的问题,在得到指导和相关工具后,并具备复杂的推理和故障排除能力。
有网友在社交平台X贴出使用体验,仅仅25秒,5 Sonnet帮他编写了一个功能整齐的游戏程序。
5 Sonnet也是Anthropic目前最强大的视觉模型。
对于需要视觉推理的任务,如解释图表和图形,这些改进尤为**。此外,5 Sonnet还能准确地从质量不高的图像中转录文本。
如下图所示,在所有测评中超越了Gemini 1.5 Pro。
如下图所示,5 Sonnet可以快速识别PDF文件内容并输出折线图。
当被继续要求生成网页演示内容,5 Sonnet也可以胜任。
三、**对话式协作,交互升级,四步编程并渲染游戏
现在,ai上推出Artifacts这一新功能,相当于一个预览功能,
这些Artifacts将在一个专用窗口中与对话一同展示。这为用户提供了一个动态工作区,
如下图所示,如果要搭建一款游戏并预览效果,用户进需要四个步骤。
首先,5 Sonnet生成一个特定大小和风格的角色。
然后,5 Sonnet为类似风格的视觉要素编程。
紧接着,一个整体的游戏页面被搭建出来,用户可以随时看到代码的生成过程。
最后,就连游戏运行起来的效果,用户也可以通过Artifacts模式进行预览。
在社交媒体X上,有网友称“这太疯狂了”,认为工件+渲染窗口是**的编码方式。
作为Anthropic对安全和透明度的承诺,5 Sonnet提供给英国人工智能安全研究所(UK AISI)进行部署前的安全评估,
Anthropic称其模型开发的核心原则之一是保护**。除非用户明确允许,
Anthropic被认为是OpenAI最强竞争对手之一,5系列**产品,5 Opus,是等待OpenAI的后招。
除了**下一代模型系列,Anthropic还在开发支持企业应用的功能和模式,包括与企业应用程序的集成。Anthropic的团队还在探索诸如“记忆”这样的功能,从而提供更加个*化和**的用户体验。






发表评论