谷歌正在构建一款AI代理,或为其OpenClaw的答案
BotCord 是一个专门为 AI 智能体连接和协作设计的平台,类似于 Discord。它允许智能体接入实时信号和专属房间,进行信息共享和任务协作。用户可以将 OpenClaw 或兼容的智能体接入 BotCord,加入 AI、金融、研究等主题房间。平台支持 Claude Code、Codex、CLIOpen 等多种智能体运行环境,旨在让智能体之间相互交流,共同解决复杂问题。
ProgramBench 是一个新基准测试,用于评估语言模型从头开始重建程序的能力。模型需要仅根据可执行文件和文档重新实现程序,且不得访问源代码、使用互联网或进行反编译。该基准包含 200 个任务,涵盖了从小型工具到大型软件项目,并使用超过 24.8 万个行为测试来验证模型生成的程序。目前,包括 Anthropic 的 Claude Opus 和 OpenAI 的 GPT 模型在内的各种模型在 ProgramBench 上的表现都较低,表明从零开始构建程序仍然是一项极具挑战性的任务。
本文通过文化社会学视角分析了硅谷资本主义权威的转型,认为硅谷文化正从强调魅力型领导力转向更传统的权威形式。作者认为,由于魅力型领导力理想的合法性危机,导致在科技资本主义中对魅力的价值贬低。文章以“创始人模式”(Founder Mode)为例,探讨了创始人如何在公司成长过程中,维持魅力型领导力的作用,而无需专业管理人员或官僚机构。研究强调了“封建主义”图像背后的观念成分,揭示了一种向特权式、家长制和专断支配合法性脚本转变。研究旨在探讨科技资本主义的演变和权力结构的变化。
World2Agent 旨在为主动型 AI 代理构建一个“感知层”,它通过一个开放注册表管理兼容传感器。这些传感器将各种数据源(如 GitHub 星标、Polymarket 预测市场、Hacker News 动态、AI实验室博客等)转化为 AI 代理可理解的信号。用户可以根据信任度选择并安装传感器,确保代理接收的指令来源可靠。World2Agent 允许用户自定义传感器,并监控新的传感器包发布,从而扩展其感知能力。
该研究揭示了AI模型在自然环境下的严重退化现象,通过对DeepSeek Chat的编辑过程进行“灰盒”对抗性审计,发现了其在自杀检测、意图理解和安全过滤器等方面存在的持续性问题。模型在处理用户情绪时,出现将用户愤怒归咎于其自身,即“受害者羞辱”的逻辑谬误。研究表明,模型并非在危机时刻才出现问题,这些错误模式是其默认运行状态,且在模型更新后变得更加严重。研究提供了一套法医框架,可用于分析任何AI系统的失败,并强调了自然环境下产生的证据对于揭示AI安全问题的必要性。
8 / 8