这**,人工智能(AI)又双叒叕发生了很多大事。
5月20日,美国通用人形机器人公司Figure宣布,如今终于能够与人一起实时对话功能。
再次,OpenAI竞争对手谷歌再扔下“震撼弹”,宣布推出**通过训练学习游戏技能的AI Agent游戏应用SIMA,
最后,AI 芯片领域也是动作不断,全球**的生成式 AI 芯片来了!
2月8日晚,美国 AI 芯片领域明星公司Cerebras 宣布推出5nm制程的WSE-3芯片,尺寸几乎与 12 英寸晶圆相当,拥有4T(400万亿)晶体管,高于WSE-2的 2.6T,用于训练 AI 模型。
以下是钛媒体App梳理了昨夜今晨 AI 领域发生的10个重要消息:
5月15日消息,在微软 Copilot Pro的付费介绍中,
2023年5月7日,
去年2月15日,支持图像和文本输入以及正确的文本输出,拥有强大的识图能力,文字输入限制提升至2.5万字,支持多个语言,回答准确***提高,
2023年9月,支持长文本,*能更强,API价格**仅需0.以及具备智能体的Assistants API。
今年2月,OpenAI突然发布 AI 视频生成模型Sora,这是继Runway、Pika、谷歌和 Meta 之后,OpenAI 正式加入到这场 AI 视频生成领域“战争”当中,2024年 OpenAI 发布的旗下最新、最重要的 AI 产品系列。
OpenAI强调,“Sora是能够理解和模拟现实世界的模型的基础,我们相信这一功能将成为实现通用人工智能(AGI)的重要里程碑。”
此前,OpenAI CEO奥尔特曼(Sam Alt**n)曾透露,但整个进展受到董事会罢免、马斯克**等因素影响。
今年初,有用户发现,5 Turbo的产品页面建立了索引。5 Turbo 的索引链接会进入到 404 页面,但页面上可以看到一些预告文字,5 Turbo是OpenAI迄今为止最快、最准确、**可扩展*的模型。
奥尔特曼4月13日在推文中暗示,等待是值得的。
如今来看,
2、只用 13 天,OpenAI 做出能听、能说、能自主决策的机器人大模型
钛媒体App获悉,北京时间5月14日凌晨,美国通用人形机器人公司Figure发布一则最新视频,
Figure创始人、CEO布雷特·阿德考克(Brett Adcock)透露,另外,OpenAI 还负责理解口语单词的能力,

他强调,所有这些涌入的信息都被Figure 01的神经转化为快速、灵巧的机器人动作。
Brett Adcock去年成立了Figure。在此之前,他是一位连续创业者,此前创立的 AI 软件 Vettery 以 1 亿美元被全球**的公司 Deco Group 收购,而后创立的低空飞机公司Archer也成功实现IPO。
此次成立Figure,他个人投入至少 1 亿美元。公司目标是“创造了世界上**个商业上可行的通用人形机器人”。即价格实惠且实用的人形机器人,让它们可以轻松融入制造、零售和仓库等商业领域。
有报道称,Figure的开发团队堪称豪华,研究人员来自波士顿动力公司、特斯拉、谷歌DeepMind 和Archer Aviation等一批关键人物。
到了2023年11月,Figure 01已经能够**运行并执行基本的自主任务。到年底,这款机器人已具备观看和学习的能力。
2024年4月中旬,Figure宣布01人形机器人进入宝马的员工队伍当中。
今年3月,75亿美元融资,**方包括OpenAI、微软、英伟达、英特尔等机构,投前估值约为 20 亿美元。同时,宣称将为人形机器人开发下一代 AI 模型。
如今,仅仅过去13天,
此次,结合Figure**的神经,使机器人能够执行类似人类的快速、灵巧动作。同时,新的Figure 01机器人可实现描述周围环境、决策常识推理、将模糊请求(如“我饿了”)转化为某些上下文、执行适当的行为、用简单的英语描述执行特定动作的原因等主要功能。
另外,从技术角度看,新的Figure 01人形机器人,可以通过正常速度运行,输入到一个OpenAI 训练的大型多模态模型中,
硬件层面,实现200Hz的24自由度动作。而且,Figure在工程方面进行了垂直整合,包括电机、固件、热管理、电子设备等。
新的Figure 01人形机器人成果,实现与机器人的自然交互和智能行为规划。
3、全球首部全面 AI 法规获批
当地时间4月11日,欧洲议会以523票赞成、46票反对、49票弃权通过了具有里程碑意义的《人工智能法案》(EU AI Act),使其成为全球首部全面AI的法规。
欧洲议会表示,该法案旨在保护基本权利、**、法治和环境可持续*免受高风险人工智能的影响,同时促进创新,以将欧洲“打造成为该领域的**者”。该法案将禁止某些“威胁公民权利”的人工智能应用,包括基于敏感特征的生物识别分类系统,操纵人类行为或利用人类弱点的 AI 也将被禁止。
但一些规则(例如影响**机器人等通用 AI 系统的规则)将在12个月后生效,以便让更多 AI 公司遵守。
事实上,从提出建议到正式达成,欧盟《人工智能法案》走了漫长的一段路。
该法案最早基于欧盟委员会在2021年提出的一项建议,指出未来的 AI 系统应该有一定的限制和风险规则,即AI应用的潜在风险越高,对它的要求就会越高,欧盟期望这些规则能够在全世界范围内得到认可和应用。

2023年2月25日,欧盟议会内部市场委员会和公民自由委员会投票通过了《人工智能法案》的谈判**草案;8月,欧洲议会层面就谈判**草案进行投票表决。最后结果显示,
2024年1月,经过马拉松式的谈判后,欧盟终于敲定了 AI 协议。这是全球**广泛覆盖包括生成式 AI 在内的法案,而且也是目前全球对AI最为严格的法案。
2024年4月23日,欧盟27国代表在《人工智能法案》文本上达成临时政治共识,标志着欧盟在立法人工智能领域迈出了坚实的一步。
直至今日的议会会议,欧洲议会终于以压倒*的523票赞成的结果,正式通过了该法案。
在新的《人工智能法案》中,立法者同意严格禁止使用敏感特征(例如政治、宗教、哲学信仰、*取向、种族)的生物识别分类系统,禁止工作场所和教育机构中的情绪识别,禁止基于社会行为或个人特征的社会评分,AI 利用人们曾经的弱点(由于年龄、残疾、社会或经济状况)等。同时,该法律禁止利用 AI 进行“社会评分”以及“操纵人类行为”的 AI 系统。新规还禁止利用人工智能剥削那些因年龄、残疾或经济状况而处于弱势的人。
欧盟内部市场专员蒂埃里·布雷东(Thierry Breton)表示:“欧洲现在成为了 AI 领域的全球标准制定者。”
此次立法的成功堪称AI商业领域上的里程碑**。因为单从商业视角来看,这一法案的通过率先为欧盟内部的人工智能创新提供了明确的法律框架,有了这一法案做背书,企业不仅能够准确地评估其AI项目,更会在法律的保障下变得更大胆,投入更多的资源进行创新。
钛媒体App获悉,北京时间3月9日,谷歌DeepMind宣布,其推出**通过训练学习游戏技能的AI Agent游戏应用SIMA。
具体来说,SIMA不需要自定义 API 来玩游戏或访问源代码,拥有在未经过特定环境训练的情况下(零样本学习)执行基本任务的能力,支持可扩展、可指导、多世界,可实现600个基本技能,涵盖了在超过10个模拟环境中的具身交互。因此,SIMA更像人类,而不是一个只做自己事情的强大 AI。
同时,在九种不同视频游戏上训练和测试 SIMA。目前,SIMA仅处于研究阶段。
谷歌 DeepMind 研究员兼 SIMA 联合负责人 Tim Harley表示,“SIMA 并不是为了赢得比赛而训练的,而是为了赢得比赛而训练的。它经过训练可以运行它并执行它所指示的操作。”
所谓Agent,Agent成为某种能自主理解、规划决策、执行复杂任务的智能体。用感知(Perception)、规划(Planning)和行动(Action)实现人的智能交互。
OpenAI联合创始人Andrej Karpathy曾表示,“AI Agent代表着一个疯狂的未来。”
截至目前,国内外包括谷歌、OpenAI、字节挑战、面壁智能、智谱 AI 等企业都在布*AI Agent技术产品。
在此之前,谷歌已推出Gemini、Gem**等多个系列大模型。其中,最新的Gemini Ultra已经成为全球**个超越人类专家水平的 AI 模型。
谷歌DeepMind推出的SIMA,全名为Scalable, Instructable, Multiworld Agent(可扩展、可指导的多世界),旨在开发能够在多个模拟的3D环境中遵循任意语言指令的智能。

相比其他Agent应用,其在创建通用 AI 和推动未来技术发展方面具有巨大潜力。
新技术主要有以下九个核心信息点:
项目目标:创建一个能够在任何虚拟3D环境中执行人类所能执行的任何任务的智能。这包括使用自然语言指令来控制在多样化的虚拟环境中的行为。
关键挑战:将语言与感知和具身行为相结合,这需要能够理解语言并在3D环境中执行相应的动作。
方**:SIMA项目通过在多种虚拟3D环境中训练来实现这一目标,这些环境包括研究环境和商业视频游戏。通过图像观察和语言指令与环境交互,并使用键盘和鼠标动作作为输出。
设计:SIMA使用了一个通用的、类人界面与环境交互。输入是图像观察和语言指令,输出是键盘和鼠标动作。这种方法允许在视觉上复杂和语义上丰富的环境中理解语言,并能够在新环境中轻松运行。
用于训练。
研究者开发了多种评估方法,以及使用人类评估行为的录制视频。
初步结果:论文描述了SIMA在多个研究环境和商业视频游戏中的初步进展和有希望的初步结果。
未来工作:研究者计划扩展SIMA项目,并开发更全面和受控的评估方法。
责任和伦理:论文还讨论了负责任的模型开发方法,以识别、衡量和管理可预见的伦理和安全挑战。SIMA项目遵循谷歌的AI原则,并确保其社会利益大于风险。
当前,SIMA通过 600 项基本技能进行评估,涵盖导航(例如“左转”)、对象交互(“爬梯子”)和菜单使用(“打开地图”)。DeepMind表示,其已经训练并执行SIMA项目,此外,最终发现可与人类能力相当。
Harley坦言,在游戏选择上,团队选择了更注重开放式游戏而非叙事的游戏,以帮助SIMA学习一般游戏技能。但他非常希望未来SIMA能学习自发***能力。
The Verge表示,SIMA 并不会像英伟达和 Convai 一样成为一个由 AI 驱动的 NPC,而是游戏中影响结果的另一个玩家。SIMA 项目联合负责人 Frederic Besse 表示,现在判断像这样的AI Agent能为研究领域之外的游戏带来哪些用途还为时过早。

DeepMind方面强调,就像 AI NPC 一样,SIMA 最终可能会学会说话,带领你走向胜利。
当地时间1月12日,

Haiku 是同类智能产品中最快、最实惠的型号,称之为“中杯”,提供**的视觉功能和行业基准的强大*能,但*具*价比。早前,从而为企业客户提供了一系列选项,
Haiku 的主要优势之一是速度,每秒能够处理 21,000 个Token(大约 30 页),提示的数量低于 32,000 个token。这种快速的处理能力使企业能够分析大量文档,例如季度备案、合同或法律**,而所需时间只是其*能层中其他模型的一小部分。
该模型还将很快登陆 A**zon Bedrock 和 Google Cloud Vertex AI,进一步扩大其对全球企业的访问范围。

Anthropic联合创始人兼首席执行官 Dario Amodei表示,Haiku 有两类客户:“对延迟敏感和对成本敏感。延迟敏感通常是面向用户的,例如,当您只想要一个良好的 UI 时。公司知道,如果[某些任务]需要三秒而不是一秒来响应,他们就会失去一小部分客户以及他们正在执行的任何工作流程。”
4月7日,OpenAI宣布,已与两家主要欧洲出版商、法国报纸 Le Monde 和西班牙媒体集团 Promotora de Infor**ciones SA 或 Prisa 签署了**协议,

去年 12 月,《》(NYTimes)**这家初创公司,OpenAI 对这些说法提出异议,
尽管 OpenAI 与NYTimes存在分歧,但它已经在该行业取得了重大进展。该初创公司去年 12 月与 Axel Springer 达成了一项价值数千万欧元的多年内容**协议。该公司一直在与 CNN、福克斯公司和《时代》杂志等出版商就新闻内容**事宜进行谈判。
1月10日晚,Nvidia **竞争对手之一 Cerebras Systems 推出了“Wafer Scale Engine 3”(WSE-3),这是其第三代 AI 芯片和世界上**的半导体产品。
Cerebras 联合创始人兼首席执行官安德鲁·费尔德曼 (Andrew Feld**n) 在一份**中表示:“*能是两倍,功耗相同,价格相同,因此这将是真正的‘摩尔定律’步骤,我们行业已经很长时间没有看到这种情况了。我们认为,我们现在已经在计算和内存之间取得了适当的平衡。”
具体来说,全新WSE-3采用台积电5nm技术,晶体管数量从 2.6 万亿个晶体管增加到了2到4万亿,尺寸几乎相当于整个 12 英寸晶圆,并且将指令执行速度提高了一倍,从 62.5 petaFLOPs 增加到 125 petaFLOPs。(1 petaFLOP 是指每秒 执行1 万亿次浮点运算)
另外,在WSE-3上,Cerebras 保持了逻辑晶体管与存储电路的相同比例,仅将片上 SRAM 的存储容量从 40GB 略微增加到 44GB,并将计算核心的数量从 850,000 个略微增加到 900,000 个。
Cerebras成立于2016年,2021 年 4 月发布了 WSE-2——全球**的拥有神经技术的 AI 训练芯片。2021年9月,5亿美金的F轮融资,估值高达40亿美金,是全球 AI 芯片领域*角兽企业。
8、英伟达支持的Together AI再获融资,投后估值为12.5亿美元
当地时间2月7日,总额达1.06亿美元,投后估值为12.5亿美元,本轮融资由Sale**orce Ventures领投,Coatue Management 、 Lux Capital 和 Emergence Capital 等跟投。

自去年人工智能赛道火热,**者纷纷押注人工智能初创企业,Together AI的公司估值也翻了一番。
Together AI的首席执行官Vipul Ved Prakash表示,本轮融资将用于租赁更多计算能力,并*请研究人员来构建新的模型架构。目前公司已拥有来自 AI 初创公司和跨国企业的4.5万名注册用户。
Together AI成立于2022年5月,因其可以提供对英伟达广受欢迎的图形处理单元(GPU)的访问而深受市场欢迎。目前,Together AI正试图扩展到一个平台,帮助开发者构建或定制他们的开源 AI 模型。
融资方面,2023年6月,Together AI获得2000万美元**轮融资,2024年4月再度获得由凯鹏华盈 (Kleiner Perkins) 领投,英伟达、Emergence Capital等机构跟投的1.025亿美元(约7.3亿元)A轮融资。
此外,在欧美地区运营了一个云计算中心,为生成式AI初创企业提供推理、训练等服务。
9、微软6月4日上线**安全软件,每小时4美元
2月9日,微软公司宣布,将于5月2日推出由Open AI驱动的**安全软件Security Copilot。
Security Copilot提供了一个AI**机器人,辨别某些代码是否是**的。此外,Security Copilot还能提供有关微软正在跟踪的**组织的信息。
微软公司安全业务副总裁Vasu Jakkal表示,能够更有效地准确回答安全问题。每小时约4美元(约合***28.75元)。
10、OpenAI将于年内对公众开放Sora,
1月15日消息,OpenAI 首席技术官 Mira Murati表示,OpenAI将于2024年正式上线文生视频大模型Sora,可能仅需几个月时间。
早在今年3月20日,OpenAI发布了多个由Sora生成的演示视频,其逼真度和连贯*令人**。
Mira Murati表示,今年OpenAI 不仅会向公众开放使用Sora,还计划将音频功能整合进去,这可能会使生成视频中的场景更加真实。此外,由于AI工具并不总是能创作准确的图像,





发表评论