All Content
发现最新的 AI 相关内容和资源
歸藏的深度长文
4月9日 周四
Anthropic 发布云端托管 Agent 基础设施 Claude Managed Agents
Anthropic 发布 Claude Managed Agents,帮你把安全沙箱、会话状态、权限管理、凭证和追踪等底层工程都打包好。只需要定义任务、工具和规则,就能让 Agent 长时间自主运行、调用工具、恢复错误,还有多 Agent 协同和自我评估迭代。把从原型到生产的周期从几个月压缩到几天,开发和上线速度提升 3-10 倍,工程团队可以少花时间在基础设施上,多把精力放在产品体验和业务集成上。计费方式是在 Claude 标准 token 单价基础上,每小时会话活跃运行额外收取 0.08 美元。
Meta 发布 Muse Spark 模型,小扎挖的团队交出第一份答卷
小扎挖的团队终于交了第一份答卷,发布 Muse Spark 模型。支持原生多模态推理模型,支持工具使用、视觉思维链和多智能体编排。还有「沉思(Contemplating)」模式,可以协调多个并行 Agent 进行推理。在 Artificial Analysis 上得分比 Gemini 3.1 Pro、GPT-5.4 和 Claude Opus 4.6 低一些。只能在 Meta AI 应用上使用,暂时不开源。
4月8日 周三
Anthropic 超级模型 Mythos 真实存在,但不会公开发布
前几天爆料的 Anthropic 超级模型 Mythos 居然真的存在。Anthropic 说,这是他们至今为止最强的模型。测评结果远高于 Opus 4.6,在代码理解、漏洞挖掘和利用上表现出了明显的跃迁能力,强大到他们不敢公布。然后只用这个 Project Glasswing,有限地提供给那些互联网基础设施的服务商,去帮他们发现漏洞。他甚至在 Linux 内核中,自主找到了多个连续的漏洞,实现了从一个无权限的普通用户提权,拿到了 root 权限。还发现了一个 OpenBSD 存在了 27 年的老漏洞,OpenBSD 以「最安全操作系统之一」著称。还有一个是 FFmpeg 存在了 16 年的老漏洞。他非常擅长把三五个看起来价值不大的小漏洞,组合成一个复杂的多步 exploit 变成大漏洞。然后这个模型的价格是 $25 / $125(百万输入 / 输出 token)。本身是不会开放给公众使用的。后续他们会把这一部分能力,放到 Opus 其他升级模型的能力里去。我觉得这些评论其实挺有意思。表面上说是为了安全而不公开模型,但实质上也是在把最强的网络进攻武器集中到少数机构手中。
