AI速报 - 第 4 页

提示工程是常态

提示工程是常态
作者三年前曾预测提示工程会随着AI模型进步而消失,但如今认为其并未消失,而是演变成了新的概念。现在的提示工程不再是关于如何巧妙地措辞,而是关于如何确保AI系统在具备上下文、工具、记忆、权限和真实后果的情况下,实现可靠性和可控性。这包括上下文工程、工具设计以及评估测试,即构建围绕期望行为的反馈循环,提示工程正逐渐成为系统工程的一部分。

#Tech

人工智能、亲密关系与你无意中分享的数据

人工智能正在渗透到越来越多的领域,甚至包括私密生活。如今,市场上涌现出一种低成本的联网设备,配备生物反馈传感器,它们能够根据用户的反应进行调整,以优化体验,并声称学习用户的偏好。然而,这些设备收集的生物数据极其敏感,一旦被导出到不透明的系统,将引发严重的隐私担忧。这些数据远比浏览历史或购物清单更具信息量,涉及反应模式、时机和强度等细节,并可能被用于个人信息交易市场。

#Tech

不可或缺的技能

不可或缺的技能
生成式人工智能正在改变软件开发,但其影响因从业者经验而异。经验丰富的开发人员拥有积累的判断力,能够评估人工智能的输出、实时监控推理过程,并在必要时进行纠正。而缺乏经验的学生和初级开发者如果过度依赖人工智能,反而可能阻碍他们自身判断力的发展。这篇论文强调,在人工智能增强的世界中,辨别力是人类不可或缺的核心技能,即识别质量、检测技术债务以及验证输出的能力。 经验丰富的开发者在使用人工智能时会进行评估和迭代式对话,而缺乏经验的开发者容易陷入“训练剥夺”的困境,即依赖人工智能导致无法培养判断力。文章指出,软件开发的关键不再是生成代码,而是评估人工智能生成的代码,并在产生技术债务之前识别和纠正错误。

#Tech

斯坦福大学 CS 153:前沿系统

斯坦福大学的 CS 153 课程聚焦于“前沿系统”,探讨能源、硅、模型等基础设施领域的变革性升级。课程汇集了包括 Sam Altman、Satya Nadella、Jensen Huang 等全球科技领袖,每周深入剖析技术进步中的瓶颈。学习者将参与一个名为“个人前沿实验室”的 10 周项目,旨在通过个人力量创造价值并探索自我拓展的极限。本课程将于 2026 年春季开课,形式为周二/周四下午 12:00-1:20。

#Tech

可食用植物数据库

“可食用植物数据库”是一个汇集了园艺师、采集者、种子保护者、植物育种者和研究者所需信息的综合资源。目前已上传约749个文件和图片,旨在为每种作物提供详细信息,包括植物鉴定、分类学、多样性、生长条件、食用部分及安全烹饪方法、其他用途以及生命周期等。网站已完成54个物种页面的基础信息构建,主要涵盖豆科、茄科、葫芦科、伞形科和蔷薇科等家族。此外,还包括植物属的识别信息页面和植物科的分类体系。

#Tech

算力期货的金融化

人工智能算力正在经历金融化的过程,GPU小时已经在现货市场交易,并被转化为数十亿美元的债务工具,同时预售容量也已成为常态。多家初创公司(如Ornn、Architect Financial、OneChronos、Compute Exchange)正在构建期货交易所和定价指数,并有项目(如GAIB、USD.AI)致力于将GPU能力上链。文章指出,由于基础设施紧张、成本飙升以及对风险对冲的需求,算力衍生品市场正在形成。尽管面临GPU贬值、供应集中和标准化缺失等挑战,但现已出现GPU资产支持债务、期货交易所和衍生品市场等现象,预示着算力金融化正在萌芽阶段。

#Tech

终端基准测试 3.0 开发启动

终端基准测试 3.0 开发启动
Terminal-Bench 3.0 正在积极开发中,旨在成为 AI 智能体的新型基准测试。该版本将包含 100 个具有挑战性的任务,预计最佳模型在发布时只能解决其中的 30%。任务范围将扩展到软件工程、系统管理、安全、科学计算等领域,并欢迎来自各个领域的贡献者参与构建。贡献者需要创建真实、有偿的计算机任务,并需有明确的指令和可靠的验证机制,并鼓励更长周期和更丰富的环境设计。

#Tech

Sequoia Ascent 2026:软件3.0、智能代理工程与锯齿状智能

Sequoia Ascent 2026:软件3.0、智能代理工程与锯齿状智能
在Sequoia Ascent 2026的炉边谈话中,演讲者探讨了人工智能代理的最新变化以及对软件的意义。他认为,LLMs不再仅仅是聊天机器人或自动补全工具,而是成为了新的可编程层,标志着“软件3.0”时代的到来。这一代软件以 LLM 的上下文窗口为主要杠杆,开发者从编写代码转向编排智能代理。演讲者强调,创始人应该思考哪些信息转换以前是不可能的,现在却变得自然,并关注可验证性、训练关注以及经济价值等因素,以确定项目是否在模型能够发挥作用的区域内。最后,他区分了“氛围编程”和“智能代理工程”的概念,指出后者是专业团队所需的技能。

#Tech

紧急刹车:如何在最后一刻进行地球工程之前限制温度

紧急刹车:如何在最后一刻进行地球工程之前限制温度
面对全球气温持续升高和潜在的气候突变点,太阳地球工程被视为一种备选方案。然而,减少甲烷等超污染物以及二氧化碳的排放,比依赖具有风险的地球工程更安全有效。专家呼吁政府优先控制这些超污染物,因为这能在 2050 年前更显著地降低气温,且成本较低。虽然部分私营企业正在探索地球工程技术,但政府必须对其进行监管,并优先采取减排措施,以确保公共安全和全球气候稳定。文章强调,应避免在未充分了解风险的情况下,由私人企业或单边行动进行地球工程实验。

#Tech

福建土楼

福建土楼
福建土楼是中国东南山区客家人的独特乡村住宅,主要建于12至20世纪。它们是大型、封闭且具有防御功能的夯土建筑,通常呈矩形或圆形,墙体厚重,可容纳高达800人。这些建筑采用夯实的泥土、石材、竹子和木材等混合材料建造,具有良好的通风、防风、抗震等特性。2008年,联合国教科文组织将福建土楼列为世界遗产,以表彰其独特的集体生活和防御组织形式以及与环境和谐共生的建筑传统。目前,福建省永鼎、南靖、屏河等县共有46处土楼被列入世界遗产名录,体现了客家和闽南文化在地域建筑中的特色。

#Tech

首席财务官需要共识强化协议来规范人工智能决策

首席财务官需要共识强化协议来规范人工智能决策
文章指出,对于财务部门而言,“98%准确”的AI模型并非理想目标,关键在于建立严格的治理规范。核心问题并非模型幻觉,而是缺乏可审计的决策记录。为此,文章介绍了“共识强化协议”(Consensus Hardening Protocol,CHP),该协议是一种专为高风险财务工作流程设计的决策治理层,通过多Agent协作、对抗性测试和第三方验证,确保决策过程的透明性和安全性。CHP涵盖了认知网协议(Cognitive Mesh Protocol)用于结构化推理,上下文工程框架用于共享记忆,以及Agent上下文工程用于演进工作流程。最终,CHP将决策过程划分为探索(EXPLORING)、 provisional锁定(PROVISIONAL_LOCK)和锁定(LOCKED)等状态,并将不符合标准的决策标记为“需要人工验证”(REQUIRES_HUMAN_VERIFICATION)。CHP旨在通过开源项目,帮助财务团队规范AI应用,提升决策质量。

#Tech

我为什么选择参加马拉松?

我为什么选择参加马拉松?
文章讲述了作者在童年时对伦敦的向往,以及15年后参加伦敦马拉松的经历。起初,作者是为了体验伦敦的城市风光和井然有序的生活而报名,并认真备战。然而,在比赛过程中,作者被各种运动补充剂所吸引,过度依赖,最终因意外事故受伤。出乎意料的是,在住院期间,作者从医院窗户看到自己儿时向往的伦敦景色,并意识到自己已经实现了儿时的梦想,感到释然,对跑步的执念也随之消散。

#Tech

Codeonix:基于AI的Python自动化工具

Codeonix是一款免费、开源的Python自动化工具,无需服务器,即可将Python脚本转换为强大的桌面自动化程序。它提供14种触发器类型,包括计划任务、Webhook、文件变化、设备连接等,并通过环境变量将上下文注入到脚本中。用户可以通过内置的Monaco编辑器编写Python脚本,或使用AI代码生成功能。此外,Codeonix还包含捆绑的Python环境、社区脚本分享平台以及Quick-Run 快速运行覆盖层,方便用户快速部署和管理自动化任务。

#Tech

利用 Microsoft Fabric + Azure AI Foundry 在一个会话中快速构建三个全栈数据平台

利用 Microsoft Fabric + Azure AI Foundry 在一个会话中快速构建三个全栈数据平台
本文介绍了如何使用 Microsoft Fabric 和 Azure AI Foundry 快速构建了三个全栈数据平台:SEC 收益研讨会、电池价值链 ERP 和矿业智能平台。该方案摒弃了传统冗长的基础设施建设流程,采用“笔记本即管道”模式,将数据管道、ETL 编排、LLM 集成等功能整合到 Fabric 的 Lakehouse 中,简化了架构,减少了集成点和维护负担。 通过使用 Delta 表作为数据集成层、AI Foundry 作为实用工具、优先定义领域模型等策略,实现了代码的一致性和可重复性,大大提高了开发效率,例如电池 ERP 平台的价格引擎能够自动从 AlphaVantage 和 FRED 获取实时数据,进行成本分析。

#Tech

避免卡点:成为不可阻挡的工程师

避免卡点:成为不可阻挡的工程师
本文探讨了如何成为一名“不可阻挡”的工程师,即使面临各种挑战也能持续高效地推进工作。关键策略包括:同时进行多项任务,避免因单一任务阻塞;提前规划项目,规避潜在的阻塞点;重视开发者环境的稳定性和可靠性,确保高效工作;主动调试超出自己职责范围的问题,利用AI工具辅助;构建良好的人际关系,获得支持和帮助;并争取高层领导的支持,争取资源优先级。文章强调,通过这些方法,工程师可以最大程度地减少阻塞,保持高效的产出。

#Tech

日本马桶制造商东洋铁器因人工智能转型股价飙升

日本马桶制造商东洋铁器因人工智能转型股价飙升
日本马桶制造商东洋铁器(Toto)的股票因公司战略调整,重点关注人工智能相关技术而大幅上涨。该公司计划将人工智能应用于其产品和运营中,提升产品智能化水平和效率。尽管具体细节尚未披露,但市场对东洋铁器在人工智能领域的潜力表示乐观。此举表明,传统制造业企业正在积极探索人工智能技术以应对未来挑战。目前无法得知文章中关于订阅及价格的具体信息。

#Tech

GPT Image 2 生成器:透明 PNG & SVG 导出

GPT Image 2 生成器:透明 PNG & SVG 导出
GPT Image 2 是 OpenAI 最新一代的图像生成模型,在文本渲染、照片真实度和空间推理方面取得了显著改进。imagesv2.ai 平台提供了便捷的网页界面访问该模型,并提供免费试用额度。该平台的主要特点包括:生成照片级逼真图像,支持精确的文本渲染,生成 360° 全景图、推特截图和微信聊天场景,提供文章插图、风格卡和 AI 人像风格等功能。最重要的是,它支持透明 PNG 和可编辑的 SVG 格式导出,以及 50 多个现成的模板,显著提升了设计工作流程的效率。

#Tech

智能编程正在耗尽我的精力

文章讨论了“智能编程”(Agentic Coding)带来的新的工作模式对开发者造成的负面影响。这种模式下,开发者不再能像传统编程那样有喘息的空间,而是需要不断地管理和审核由大型语言模型(LLMs)生成的代码,导致认知疲劳和决策疲劳加剧。开发者意识到,过度依赖LLMs,并在不断地进行判断和监督,反而降低了工作效率并可能导致职业倦怠。文章指出,简单地增加代理数量无法解决根本问题,需要改进代码审查和验证流程,但同时也对LLMs构建的验证系统本身的可靠性表示担忧。

#Tech

咖啡不仅提神醒脑:关键生物通路揭示其广泛的健康影响

咖啡不仅提神醒脑:关键生物通路揭示其广泛的健康影响
一项新的研究表明,咖啡中的化合物可能通过激活名为NR4A1的受体来发挥作用,而该受体与衰老、应激反应和疾病密切相关。NR4A1是一种核受体,有助于调节基因活动,并对身体损伤做出反应。研究人员发现,咖啡中的多羟基和多酚类化合物能够与NR4A1受体结合,影响其活性,这可能是解释咖啡对健康益处的原因。值得注意的是,移除NR4A1受体后,咖啡的保护性作用会消失,表明该受体在调控咖啡的影响中起着关键作用。该研究也表明,咖啡的健康益处可能不仅仅来自咖啡因,而是多种天然化合物共同作用的结果。

#Tech

重写导出管道,Rust 拯救 Mac 屏幕录制器 TinyRec

开发者为解决 Mac 屏幕录制器 TinyRec 导出速度慢的问题,对其导出流程进行了重写。最初的实现使用 PixiJS 进行渲染预览和 WebCodecs 进行视频编码,但由于 PixiJS 将所有操作绑定到主线程,导致导出 720p 视频需要 15 分钟,且界面卡顿。 为了解决这个问题,开发者将导出管道重写为独立的 Rust 二进制文件,通过标准输入/输出与 Electron 应用通信,并采用 Metal 渲染和 Apple Silicon 的 VideoToolbox 硬件编码加速。最终,导出时间从 15 分钟缩短到 1 分钟,显著提升了用户体验。

#Tech

初创公司挑战苹果对AI“氛围编码”应用限制

初创公司挑战苹果对AI“氛围编码”应用限制
多家初创公司正在挑战苹果公司对利用人工智能生成“氛围编码” (vibe coding) 应用的限制。这些应用利用AI技术根据用户的情绪和偏好定制音乐、艺术或其他内容,为用户提供个性化的体验。苹果担心此类应用可能违反其App Store的审核政策,并可能涉及隐私问题。初创公司认为苹果的限制阻碍了创新的发展,并限制了用户获取个性化体验的途径。目前,双方的争议焦点在于如何平衡创新、用户体验和潜在的风险。

#Tech

HogPocket App - App Store

HogPocket App - App Store
HogPocket 是一款专为 iPad 设计的移动应用程序,允许用户在 iPhone 上访问 PostHog 产品分析数据。用户可以通过该应用查看关键指标、探索事件并了解用户行为,提供实时事件量、用户留存率、转化漏斗等数据可视化。HogPocket 支持多账户切换、暗黑/亮色模式,并提供 HogQL 查询编辑器进行自定义数据分析。该应用直接连接到用户的 PostHog 实例,数据安全可靠,不会被存储或代理。

#Tech

情感监控的兴起

情感监控的兴起
人工智能技术正在兴起,能够分析人类的情绪,并被应用于各种场景,例如监控会议、面试、客户服务以及员工的日常工作。这种“情感人工智能”(Emotion AI)或“情感计算”(Affective Computing)技术,可以分析视频、音频、聊天记录和电子邮件,以评估员工的情绪状态、注意力以及性格特征。目前,它主要应用于提升工作效率和生产力,例如监控呼叫中心客服人员的语音语调。虽然欧盟已禁止在工作场所使用情感人工智能,但预计全球市场将在2030年达到90亿美元。这种技术正在悄无声息地改变工作环境,使得企业能够实时监控员工的情绪和行为,引发了关于隐私和工作自主权的担忧。

#Tech

英伟达CEO:我们在中国的人工智能加速器市场份额降至零%

英伟达CEO:我们在中国的人工智能加速器市场份额降至零%
英伟达CEO Jensen Huang 表示,由于美国的出口政策,该公司在中国人工智能加速器市场的份额已降至0%。 过去两年,英伟达曾占据中国人工智能加速器市场的主导地位。 Huang认为,放弃如此庞大的市场并非明智之举,政策应更加灵活,允许美国芯片公司在华运营。目前,包括华为、Cambricon、Moore Threads 和 MetaX 等本土厂商正在迅速发展硅片和软件,逐步取代英伟达等国外厂商,尤其是在软件方面,如CUDA技术。 Bernstein 预计,英伟达在中国人工智能GPU市场的份额可能从2024年的66%降至未来几年的8%左右。

#Tech

提醒:你可以用多个小型HTML页面和导航构建交互式体验

提醒:你可以用多个小型HTML页面和导航构建交互式体验
本文回顾了使用大型语言模型 (LLM) 构建网站的一种方法,即通过多个小型 HTML 页面来实现交互,避免使用 JavaScript 进行页面内交互。 这种方法利用 HTML 导航和 CSS 视图过渡(CSS view transitions)来增强用户体验,即使在较旧设备或禁用 JavaScript 的情况下也能正常工作。 网站中的菜单,例如,会导航到专门的页面,而不是通过 JavaScript 实现展开或滑动效果。 核心思想是将浏览器视为导航文档的工具,而不是执行代码的运行时环境,从而简化网站构建。

#Tech

中国东方航空737客机坠毁事件:飞行员疑似人为切断双发,中方以国家安全为由隐瞒报告

中国东方航空737客机坠毁事件:飞行员疑似人为切断双发,中方以国家安全为由隐瞒报告
2022年3月发生的中国东方航空MU5735航班坠毁事件,造成132人遇难。美国国家运输安全委员会(NTSB)基于飞行记录仪数据分析显示,飞机在巡航高度时,飞行员将两台发动机的油量开关从“运行”状态切换到“截止”状态,且在随后飞机失去动力时,自动驾驶系统也被关闭,暗示可能存在人为破坏的迹象。由于飞机失事后,中国民用航空局(CAAC)一直未发布最终事故报告,引发国际关注,并以国家安全为由拒绝信息公开。NTSB通过信息公开申请(FOIA)公开了部分记录,但未保留副本。目前,事故原因仍在调查中。

#Tech

大型科技公司裁员8万,归咎于人工智能,专家称公司人员超员25%至75%

大型科技公司裁员8万,归咎于人工智能,专家称公司人员超员25%至75%
2026年第一季度,大型科技公司共裁员超过8万人,相较于2025年第一季度裁员约3万人,数量显著增加。虽然一些公司将裁员原因归咎于人工智能(AI),甚至将其作为主要原因(占比高达25%),但专家认为这可能是一种“AI漂白”的策略,实则表明许多公司存在人员超员的问题,超员比例可能高达25%至75%。例如Meta计划裁员10%,Microsoft则提供自愿离职计划。 裁员背后的真实原因可能与疫情期间的低利率政策及随后美联储加息有关。

#Tech

ChatGPT再次“失误”:关于草莓中字母“e”的数量

一位用户在深夜通过测试ChatGPT时,意外发现模型持续返回“草莓中含有3个e”的答案,而用户原本以为是在测试“r”的个数。这引发了对AI模型训练偏差、过度补偿以及用户思维误导等问题的思考。随后用户在测试“十七”单词时也遇到了同样的问题,最终意识到自己一直是在询问“e”的个数。此事件再次引发关于ChatGPT的准确性和训练方式的讨论,并被用户分享到Hackernews。

#Tech

在冥王星以外检测到一颗超越海王星天体的Atmosphere

在冥王星以外检测到一颗超越海王星天体的Atmosphere
研究人员通过观测一颗位于海王星之外的超越海王星天体(trans-Neptunian object, TNO)的恒星掩星现象,发现了该天体拥有大气层。这为我们理解这些遥远天体的物理特征和演化过程提供了新的线索。此前已在冥王星、阋神星(Eris)等天体上检测到大气层,本次发现进一步扩展了我们对太阳系外围天体大气层的认知。研究人员利用多个观测手段,如 Herschel-PACS 和 Gaia 数据等,获取了相关数据并进行分析。

#Tech

汽车开始“监控”你:车载广告时代来临

汽车开始“监控”你:车载广告时代来临
美国汽车记者Zerin Dube在2025年11月24日发现其Jeep Grand Cherokee启动时出现了来自Stellantis的广告,这标志着汽车作为一种“平台”的转变。 过去几十年,汽车逐渐从机械控制转向电子控制,如电子油门、电助力转向和电子制动,并通过CAN总线进行内部通信。特斯拉在2012年引入了OTA软件更新,这使得汽车制造商能够远程向车辆推送更新和广告。 这种趋势源于从1986年配备触摸屏的Buick Riviera到2012年特斯拉Model S的创新,最终导致汽车仪表盘上出现了越来越多的屏幕,以及汽车功能被数字化和远程可控。

#Tech

4 / 8