AI速报 - 第 6 页

提示工程是常态

提示工程是常态
作者三年前曾预测提示工程会随着AI模型进步而消失,但如今认为其并未消失,而是演变成了新的概念。现在的提示工程不再是关于如何巧妙地措辞,而是关于如何确保AI系统在具备上下文、工具、记忆、权限和真实后果的情况下,实现可靠性和可控性。这包括上下文工程、工具设计以及评估测试,即构建围绕期望行为的反馈循环,提示工程正逐渐成为系统工程的一部分。

#Tech

人工智能、亲密关系与你无意中分享的数据

人工智能正在渗透到越来越多的领域,甚至包括私密生活。如今,市场上涌现出一种低成本的联网设备,配备生物反馈传感器,它们能够根据用户的反应进行调整,以优化体验,并声称学习用户的偏好。然而,这些设备收集的生物数据极其敏感,一旦被导出到不透明的系统,将引发严重的隐私担忧。这些数据远比浏览历史或购物清单更具信息量,涉及反应模式、时机和强度等细节,并可能被用于个人信息交易市场。

#Tech

不可或缺的技能

不可或缺的技能
生成式人工智能正在改变软件开发,但其影响因从业者经验而异。经验丰富的开发人员拥有积累的判断力,能够评估人工智能的输出、实时监控推理过程,并在必要时进行纠正。而缺乏经验的学生和初级开发者如果过度依赖人工智能,反而可能阻碍他们自身判断力的发展。这篇论文强调,在人工智能增强的世界中,辨别力是人类不可或缺的核心技能,即识别质量、检测技术债务以及验证输出的能力。 经验丰富的开发者在使用人工智能时会进行评估和迭代式对话,而缺乏经验的开发者容易陷入“训练剥夺”的困境,即依赖人工智能导致无法培养判断力。文章指出,软件开发的关键不再是生成代码,而是评估人工智能生成的代码,并在产生技术债务之前识别和纠正错误。

#Tech

斯坦福大学 CS 153:前沿系统

斯坦福大学的 CS 153 课程聚焦于“前沿系统”,探讨能源、硅、模型等基础设施领域的变革性升级。课程汇集了包括 Sam Altman、Satya Nadella、Jensen Huang 等全球科技领袖,每周深入剖析技术进步中的瓶颈。学习者将参与一个名为“个人前沿实验室”的 10 周项目,旨在通过个人力量创造价值并探索自我拓展的极限。本课程将于 2026 年春季开课,形式为周二/周四下午 12:00-1:20。

#Tech

可食用植物数据库

“可食用植物数据库”是一个汇集了园艺师、采集者、种子保护者、植物育种者和研究者所需信息的综合资源。目前已上传约749个文件和图片,旨在为每种作物提供详细信息,包括植物鉴定、分类学、多样性、生长条件、食用部分及安全烹饪方法、其他用途以及生命周期等。网站已完成54个物种页面的基础信息构建,主要涵盖豆科、茄科、葫芦科、伞形科和蔷薇科等家族。此外,还包括植物属的识别信息页面和植物科的分类体系。

#Tech

算力期货的金融化

人工智能算力正在经历金融化的过程,GPU小时已经在现货市场交易,并被转化为数十亿美元的债务工具,同时预售容量也已成为常态。多家初创公司(如Ornn、Architect Financial、OneChronos、Compute Exchange)正在构建期货交易所和定价指数,并有项目(如GAIB、USD.AI)致力于将GPU能力上链。文章指出,由于基础设施紧张、成本飙升以及对风险对冲的需求,算力衍生品市场正在形成。尽管面临GPU贬值、供应集中和标准化缺失等挑战,但现已出现GPU资产支持债务、期货交易所和衍生品市场等现象,预示着算力金融化正在萌芽阶段。

#Tech

终端基准测试 3.0 开发启动

终端基准测试 3.0 开发启动
Terminal-Bench 3.0 正在积极开发中,旨在成为 AI 智能体的新型基准测试。该版本将包含 100 个具有挑战性的任务,预计最佳模型在发布时只能解决其中的 30%。任务范围将扩展到软件工程、系统管理、安全、科学计算等领域,并欢迎来自各个领域的贡献者参与构建。贡献者需要创建真实、有偿的计算机任务,并需有明确的指令和可靠的验证机制,并鼓励更长周期和更丰富的环境设计。

#Tech

调整正弦波:缩放、拉伸与相位移动

本文介绍了如何调整标准正弦波的三个关键参数:振幅(Scaling,由参数控制,影响最大高度)、频率(Stretching,由参数控制,影响周期,周期与频率成反比)和相位(Shifting,由参数控制,影响正弦波的水平位移)。通过改变这些参数,可以分别控制正弦波的振幅大小、重复频率以及起始位置。例如,增加相位值会使正弦波向左移动,而减小相位值则会使其向右移动。 理解这些参数的调整对于控制正弦波的形状至关重要。

#Tech

Sequoia Ascent 2026:软件3.0、智能代理工程与锯齿状智能

Sequoia Ascent 2026:软件3.0、智能代理工程与锯齿状智能
在Sequoia Ascent 2026的炉边谈话中,演讲者探讨了人工智能代理的最新变化以及对软件的意义。他认为,LLMs不再仅仅是聊天机器人或自动补全工具,而是成为了新的可编程层,标志着“软件3.0”时代的到来。这一代软件以 LLM 的上下文窗口为主要杠杆,开发者从编写代码转向编排智能代理。演讲者强调,创始人应该思考哪些信息转换以前是不可能的,现在却变得自然,并关注可验证性、训练关注以及经济价值等因素,以确定项目是否在模型能够发挥作用的区域内。最后,他区分了“氛围编程”和“智能代理工程”的概念,指出后者是专业团队所需的技能。

#Tech

繁星计划:为东亚地区改进数字分组方式

繁星计划:为东亚地区改进数字分组方式
“繁星计划”旨在为使用以万为单位计数体系的东亚语言(如中文、日文、韩文)改进数字分组方式。目前,阿拉伯数字的常用分组方式(每三位加逗号)与东亚的计数习惯不符,导致阅读体验不佳。该计划建议使用下划线(_)作为每四位数字的分隔符,以匹配万、亿、兆等单位。下划线具有易于输入、与逗号区分明显等优点,有望提升东亚地区数字阅读的便捷性和准确性。

#Tech

德国宣称拥有世界上最好的面包

德国宣称拥有世界上最好的面包
为了庆祝5月5日德国面包日,德国人表达了对自家面包的自豪。德国人对面包的热爱甚至超过了度假,他们认为购买面包是家常便饭。总理弗里德里希·默茨曾因在安哥拉找不到“像样的面包”而引发争议,体现了德国人对本地面包文化的执着。在荷兰纪念二战解放的同时,德国人将庆祝这一特殊的面包日。

#Tech

报纸上首次发表的照片:1848年

报纸上首次发表的照片:1848年
据记载,1848年7月,法国周刊《举凡画报》(L’Illustration)刊登了首张新闻照片,描绘了巴黎因工人罢工而造成的路障场景。这与1848年6月起义相关,由于当时新闻采集缓慢且出版周期较长,文章因此延迟至7月才发表。这张照片很可能并非直接印刷,而是基于原始照片制作的油墨雕刻版。 随后,《举凡画报》也宣称是首个发表彩色照片的报纸,虽然这一说法尚未得到证实。 战争报道的推动,尤其是克里米亚战争和美国内战期间的摄影作品,对新闻摄影的兴起起到了重要作用。

#Tech

Introducing grove.el:Emacs 下的 Obsidian 风格笔记模式

作者长期在 Emacs 中寻找合适的笔记工作流,并开发了 grove.el,这是一种旨在简化 Emacs 笔记体验的方案。grove.el 类似于 Obsidian,采用纯 Org 文件存储,无需数据库和外部依赖,避免了复杂的配置和潜在的维护问题。它提供了文件树侧边栏、快速捕捉、维基链接、反向链接、每日笔记、全文搜索和标签搜索等功能,力求提供简单易用、高度灵活的笔记体验,让用户可以自由选择笔记方法,同时保留了 Emacs 的原生感觉。 该项目目前正在 MELPA 审核中,期待在未来提供更完善的功能,例如模板、标签自动完成和交互式图谱视图。

#Tech

通过TLS证书攻破欧洲网络:RIPE NCC RPKI利用链

通过TLS证书攻破欧洲网络:RIPE NCC RPKI利用链
安全研究人员发现了一系列漏洞,可以通过恶意链接攻击欧洲、中东和中亚的网络。攻击者利用跨站脚本(XSS)漏洞,在RIPE NCC网站中注入恶意代码,进而控制路由授权和RIPE数据库对象,可能导致目标网络长时间断网,并可能被用于恶意路由劫持。该攻击利用了对RIPE NCC服务的信任,只需网络工程师点击一个看似无害的链接,就可能导致严重后果。RIPE NCC已修复了这些漏洞,但事件突显了对关键互联网基础设施安全性的关注。

#Tech

ScaleBridge:Withings 与 Garmin 的数据同步互联

ScaleBridge:Withings 与 Garmin 的数据同步互联
ScaleBridge 是一款实用工具,可以自动将 Withings 体脂秤的测量数据转发至 Garmin Connect。用户只需连接一次 Withings 和 Garmin 账户,即可实现数据同步。该工具支持转发体重、体脂率、肌肉量、骨量、补水程度和 BMI 等数据,并提供免费和自动同步两种模式。免费模式为手动同步,自动模式则支持后台自动同步,且所有凭据都经过加密存储,保护用户隐私。

#Tech

瑞士爆发新型诈骗工具:短信批量发送器

瑞士爆发新型诈骗工具:短信批量发送器
瑞士正在面临一种新型的网络诈骗攻击,攻击者使用名为“SMS Blaster”的设备,在车辆上安装,通过批量发送虚假短信欺骗民众。这些短信通常伪装成停车罚单,诱骗受害者点击恶意链接并提供个人信息,导致损失高达数百万瑞士法郎。目前,日内瓦、沃州等多个州都已出现此类案件,警方正在积极调查,并已缴获一批相关设备。攻击者利用短信发送器绕过运营商安全措施,在特定区域内触及数万甚至十万台智能手机,对民众造成威胁。

#Tech

欧洲哨兵-1 星座已满负荷运行,地球观测能力显著增强

欧洲哨兵-1 星座已满负荷运行,地球观测能力显著增强
欧洲的“哥白尼”哨兵-1 雷达任务已实现满负荷运行,第四颗卫星 Sentinel-1D 已完成在轨调试并进入全面运营。该星座由四颗卫星组成,提供全天候、各种天气条件下的合成孔径雷达 (SAR) 影像,用于监测自然灾害、海冰、地表变形、森林砍伐和洪涝等。 哨兵-1 任务将提供长达二十年的雷达观测数据,为环境变化跟踪和气候模型验证提供关键数据。此外,Sentinel-1C 和 Sentinel-1D 采用了旨在减少空间碎片风险的新型分离机制,欧洲空间局(ESA)正在研发下一代哨兵-1 卫星,以确保测量连续性。

#Tech

日本部署廉价纸板无人机用于集群作战

日本部署廉价纸板无人机用于集群作战
日本开始使用AirKamuy公司开发的廉价纸板无人机AirKamuy 150,主要用于作为空中靶标,并计划将其应用于更广泛的军事无人系统部署。这款无人机主体由瓦楞纸板制成,并涂有防水涂层,单机成本仅约2000美元,远低于传统军用无人机的成本。AirKamuy 150的设计理念是极致的经济性和大规模生产,可以快速组装并平摊运输,旨在通过大量无人机进行集群作战,执行侦察、诱饵、电子战等任务。 这种低成本、可牺牲的无人机策略正日益受到各国军事力量的重视。

#Tech

紧急刹车:如何在最后一刻进行地球工程之前限制温度

紧急刹车:如何在最后一刻进行地球工程之前限制温度
面对全球气温持续升高和潜在的气候突变点,太阳地球工程被视为一种备选方案。然而,减少甲烷等超污染物以及二氧化碳的排放,比依赖具有风险的地球工程更安全有效。专家呼吁政府优先控制这些超污染物,因为这能在 2050 年前更显著地降低气温,且成本较低。虽然部分私营企业正在探索地球工程技术,但政府必须对其进行监管,并优先采取减排措施,以确保公共安全和全球气候稳定。文章强调,应避免在未充分了解风险的情况下,由私人企业或单边行动进行地球工程实验。

#Tech

Ripple:融合 React、Solid 和 Svelte 的 TypeScript UI 框架

Ripple:融合 React、Solid 和 Svelte 的 TypeScript UI 框架
Ripple 是一个 TypeScript UI 框架,它结合了 React、Solid 和 Svelte 的优点。它提供了内置的响应式状态管理(track() 和惰性解构 &[] 语法),组件化架构,熟悉的模板语法,以及优异的性能(精细渲染,行业领先的 bundle-size 和内存占用)。Ripple 具有完整的 TypeScript 集成、VSCode 编辑器支持、控制流(if, for, try)支持,以及作用域样式(component-local CSS)和 Prettier/ESLint 集成。

#Tech

福建土楼

福建土楼
福建土楼是中国东南山区客家人的独特乡村住宅,主要建于12至20世纪。它们是大型、封闭且具有防御功能的夯土建筑,通常呈矩形或圆形,墙体厚重,可容纳高达800人。这些建筑采用夯实的泥土、石材、竹子和木材等混合材料建造,具有良好的通风、防风、抗震等特性。2008年,联合国教科文组织将福建土楼列为世界遗产,以表彰其独特的集体生活和防御组织形式以及与环境和谐共生的建筑传统。目前,福建省永鼎、南靖、屏河等县共有46处土楼被列入世界遗产名录,体现了客家和闽南文化在地域建筑中的特色。

#Tech

首席财务官需要共识强化协议来规范人工智能决策

首席财务官需要共识强化协议来规范人工智能决策
文章指出,对于财务部门而言,“98%准确”的AI模型并非理想目标,关键在于建立严格的治理规范。核心问题并非模型幻觉,而是缺乏可审计的决策记录。为此,文章介绍了“共识强化协议”(Consensus Hardening Protocol,CHP),该协议是一种专为高风险财务工作流程设计的决策治理层,通过多Agent协作、对抗性测试和第三方验证,确保决策过程的透明性和安全性。CHP涵盖了认知网协议(Cognitive Mesh Protocol)用于结构化推理,上下文工程框架用于共享记忆,以及Agent上下文工程用于演进工作流程。最终,CHP将决策过程划分为探索(EXPLORING)、 provisional锁定(PROVISIONAL_LOCK)和锁定(LOCKED)等状态,并将不符合标准的决策标记为“需要人工验证”(REQUIRES_HUMAN_VERIFICATION)。CHP旨在通过开源项目,帮助财务团队规范AI应用,提升决策质量。

#Tech

我为什么选择参加马拉松?

我为什么选择参加马拉松?
文章讲述了作者在童年时对伦敦的向往,以及15年后参加伦敦马拉松的经历。起初,作者是为了体验伦敦的城市风光和井然有序的生活而报名,并认真备战。然而,在比赛过程中,作者被各种运动补充剂所吸引,过度依赖,最终因意外事故受伤。出乎意料的是,在住院期间,作者从医院窗户看到自己儿时向往的伦敦景色,并意识到自己已经实现了儿时的梦想,感到释然,对跑步的执念也随之消散。

#Tech

Codeonix:基于AI的Python自动化工具

Codeonix是一款免费、开源的Python自动化工具,无需服务器,即可将Python脚本转换为强大的桌面自动化程序。它提供14种触发器类型,包括计划任务、Webhook、文件变化、设备连接等,并通过环境变量将上下文注入到脚本中。用户可以通过内置的Monaco编辑器编写Python脚本,或使用AI代码生成功能。此外,Codeonix还包含捆绑的Python环境、社区脚本分享平台以及Quick-Run 快速运行覆盖层,方便用户快速部署和管理自动化任务。

#Tech

利用 Microsoft Fabric + Azure AI Foundry 在一个会话中快速构建三个全栈数据平台

利用 Microsoft Fabric + Azure AI Foundry 在一个会话中快速构建三个全栈数据平台
本文介绍了如何使用 Microsoft Fabric 和 Azure AI Foundry 快速构建了三个全栈数据平台:SEC 收益研讨会、电池价值链 ERP 和矿业智能平台。该方案摒弃了传统冗长的基础设施建设流程,采用“笔记本即管道”模式,将数据管道、ETL 编排、LLM 集成等功能整合到 Fabric 的 Lakehouse 中,简化了架构,减少了集成点和维护负担。 通过使用 Delta 表作为数据集成层、AI Foundry 作为实用工具、优先定义领域模型等策略,实现了代码的一致性和可重复性,大大提高了开发效率,例如电池 ERP 平台的价格引擎能够自动从 AlphaVantage 和 FRED 获取实时数据,进行成本分析。

#Tech

避免卡点:成为不可阻挡的工程师

避免卡点:成为不可阻挡的工程师
本文探讨了如何成为一名“不可阻挡”的工程师,即使面临各种挑战也能持续高效地推进工作。关键策略包括:同时进行多项任务,避免因单一任务阻塞;提前规划项目,规避潜在的阻塞点;重视开发者环境的稳定性和可靠性,确保高效工作;主动调试超出自己职责范围的问题,利用AI工具辅助;构建良好的人际关系,获得支持和帮助;并争取高层领导的支持,争取资源优先级。文章强调,通过这些方法,工程师可以最大程度地减少阻塞,保持高效的产出。

#Tech

日本马桶制造商东洋铁器因人工智能转型股价飙升

日本马桶制造商东洋铁器因人工智能转型股价飙升
日本马桶制造商东洋铁器(Toto)的股票因公司战略调整,重点关注人工智能相关技术而大幅上涨。该公司计划将人工智能应用于其产品和运营中,提升产品智能化水平和效率。尽管具体细节尚未披露,但市场对东洋铁器在人工智能领域的潜力表示乐观。此举表明,传统制造业企业正在积极探索人工智能技术以应对未来挑战。目前无法得知文章中关于订阅及价格的具体信息。

#Tech

GPT Image 2 生成器:透明 PNG & SVG 导出

GPT Image 2 生成器:透明 PNG & SVG 导出
GPT Image 2 是 OpenAI 最新一代的图像生成模型,在文本渲染、照片真实度和空间推理方面取得了显著改进。imagesv2.ai 平台提供了便捷的网页界面访问该模型,并提供免费试用额度。该平台的主要特点包括:生成照片级逼真图像,支持精确的文本渲染,生成 360° 全景图、推特截图和微信聊天场景,提供文章插图、风格卡和 AI 人像风格等功能。最重要的是,它支持透明 PNG 和可编辑的 SVG 格式导出,以及 50 多个现成的模板,显著提升了设计工作流程的效率。

#Tech

智能编程正在耗尽我的精力

文章讨论了“智能编程”(Agentic Coding)带来的新的工作模式对开发者造成的负面影响。这种模式下,开发者不再能像传统编程那样有喘息的空间,而是需要不断地管理和审核由大型语言模型(LLMs)生成的代码,导致认知疲劳和决策疲劳加剧。开发者意识到,过度依赖LLMs,并在不断地进行判断和监督,反而降低了工作效率并可能导致职业倦怠。文章指出,简单地增加代理数量无法解决根本问题,需要改进代码审查和验证流程,但同时也对LLMs构建的验证系统本身的可靠性表示担忧。

#Tech

我不喜欢“员工工程师原型”的说法

我不喜欢“员工工程师原型”的说法
本文作者认为,将“员工工程师”角色划分为团队领导、架构师、问题解决者和助手等原型,是一种误导性的职业发展建议。工程师不应试图迎合这些原型,而是应该专注于产出有价值的工作,赢得信任和影响力。真正的“员工工程师”应该关注如何为公司创造价值,并能够适应公司所需的角色,而不是拘泥于预设的模式。文章强调了对公司价值的判断和责任意识,这是成为优秀员工工程师的关键。

#Tech

6 / 15