AI速報 - 11ページ目

倫理的な超高速性(EHV):エージェントシステム向けに決定論的なガバナンス認識JITコンパイラアーキテクチャ

倫理的な超高速性(EHV):エージェントシステム向けに決定論的なガバナンス認識JITコンパイラアーキテクチャ 超高速AIガバナンス実現技術
本研究は、規制された重要インフラにおける自律エージェントシステムの安全性ギャップを解決する新アーキテクチャ「EHV」を提案する。EHVは、ガバナンス認識のJust-In-Time(JIT)コンパイラを通じて、ポリシー適用ポイント(PEP)を推論パイプラインに組み込む。CRDTとTrusted Execution Environments(TEEs)を活用することで、EHVはサブミリ秒の形式的決定論(SMFD)を達成する。これにより、AIガバナンスの適用遅延をO(日)からO(1)に劇的に削減し、導入速度とガバナンスの完全性のトレードオフを解消する。

#Tech

AIは製品ではなく技術である

AIは製品ではなく技術である AIはパーベイシブな技術
AppleのAI戦略について、一部ではキラーとなるAI製品の投入を求める声がある。しかし筆者は、AIを単なる製品と捉えるのは過剰な期待であると指摘する。AIは特定の一つの製品ではなく、Wi-Fiのようにすべてのデバイスに浸透する「パーベイシブな技術」として機能すると論じている。過去のAppleの成功事例がそうであったように、AIは製品の基盤となるインフラ的な役割を担うだろう。したがって、AppleはAIを単一の製品として追求するのではなく、全製品に統合していくべきである。

#Tech

ペースレイヤーとAI統合:フェニックスアーキテクチャ

ペースレイヤーとAI統合:フェニックスアーキテクチャ AI時代のシステム構造再考
生成AIの登場により変更コストが劇的に低下したが、全てを高速で変更しようとするとシステムに深刻な損傷を与えるリスクがある。この課題に対処するため、ソフトウェアの要素を変化のペースに応じて「ペースレイヤー」に分ける必要がある。UIやコンテンツ生成といった「速い層」は、失敗リスクが低いため、AIによる積極的な再生成が効果的である。一方、インフラやデータモデルなどの「遅い層」は、修正コストが高く、誤った再生成は危険なため、人間の厳格な検証と制約のもとでのみAIを適用すべきだ。

#Tech

ローマ時代エジプトのミイラ腹部からホメロスの叙事詩『イリアス』の一節が発見される

ローマ時代エジプトのミイラ腹部からホメロスの叙事詩『イリアス』の一節が発見される 古代ミイラに納められたホメロ
ローマ支配下のエジプト、オキシリンコス遺跡での発掘調査において、ミイラの腹部からホメロスの叙事詩『イリアス』の一節が記されたパピルスが発見されました。このパピルスは紀元前1600年頃のものと推定され、トロイ攻城戦の様子を記した『イリアス』第2巻の箇所を含むものです。過去にこの遺跡から巻物が発見されてはいますが、それらの内容は主に魔術的・儀式的なものでした。そのため、埋葬の文脈において文学的な内容のパピルスが発見されたことは、極めて重要な学術的成果となっています。

#Tech

CVE番号が付く前の脆弱性:潜在的なコードの弱点を見逃さないために

CVE番号が付く前の脆弱性:潜在的なコードの弱点を見逃さないために CVE発覚前の根本的な弱点
Citrix NetScalerでの脆弱性(CVE-2026-3055)の事例は、特定の一つのバグが発見されても、同じような根本的な設計上の弱点(CWE-125)が繰り返し存在していることを示している。CVEが具体的な脆弱性を指すのに対し、CWEはそれを生み出す背景にある普遍的なコード上の弱点パターンである。現在のセキュリティ対策はCVEへのリアクティブな対応(パッチ適用)に偏りがちだが、これは事後対応に過ぎない。真のリスク低減には、静的解析やAIによる自動監査を活用し、コード自体に潜む根本的なCWEパターンを予防的に修正する姿勢が不可欠である。

#Tech

OpenAIがマルタ政府と提携、全住民にChatGPT Plusを提供

OpenAIがマルタ政府と提携、全住民にChatGPT Plusを提供 マルタ全住民にChatGPT
米AI企業OpenAIは、マルタ政府と提携し、マルタの全住民にChatGPT Plusサービスを提供すると発表しました。このプログラムでは、利用者がAIの適切な使い方を学ぶための無料コースを受講することが条件となります。5月から開始されるこの計画は、国外在住のマルタ市民も対象とし、徐々に規模を拡大する見込みです。マルタは、このような形で大規模なAI普及プログラムを導入した世界初の国となります。

#Tech

クイック・ドロー!

クイック・ドロー! AIが読み解く描画予測ゲーム
機械学習を用いたゲーム「クイック・ドロー!」は、プレイヤーが描いた絵をAIが推測する仕組みです。このゲームでは、ニューラルネットワークが描画内容をリアルタイムで認識しようと試みます。正解率にはばらつきがありますが、利用者が遊ぶことでシステムは継続的に学習し、精度を上げていきます。これは、機械学習の技術をエンターテイメント性の高い形で利用できることを示すデモンストレーションです。初期段階では数百の概念で訓練されており、今後さらに概念が追加される予定です。

#Tech

LoxeAI:SOC 2監査に特化したAWS証拠レイヤー

LoxeAIは、SOC 2監査に必要なAWSの証拠提供を劇的に簡素化する証拠レイヤーです。従来の課題であった証拠の検証性の問題を解決するため、すべての検出項目はSHA-256ハッシュで検証され、具体的なAWS APIコールにトレーサビリティを持ちます。5分という短時間でギャップレポートが作成されるほか、AIコパイロット「Gideon」が具体的な修正手順とAWS CLIコマンドを提示し、迅速なコンプライアンス対応を支援します。読み取り専用のIAMを使用し、完全にプライベートに運用されるため、安心して監査準備を進めることができます。

#Tech

FCP(自由通信プロトコル)仕様

FCPは、HTTP上で動作することを前提とした、最小限かつテキスト優先の通信プロトコルです。既存の複雑なエージェント間プロトコルとは異なり、参加者を「アクター」とみなし、自由形式の自然言語テキストを通じてやり取りを行います。機能のハンドシェイク、パラメータの収集、エラー処理といった全てのプロセスが実行時にテキストによる対話で交渉されるのが特徴です。このシンプルな設計により、厳密なスキーマやSDK、コード生成が不要となり、AIや人間など多様な主体が容易にサービスとコミュニケーションできる環境を提供します。

#Tech

自己蒸留による継続学習の実現

自己蒸留による継続学習の実現 自己蒸留が実現する継続学習
基盤モデルにとって、既存の知識を保持したまま新たな能力を獲得する「継続学習」は主要な課題です。従来のデモンストレーションからの学習手法である教師ありファインチューニング(SFT)はオフポリシーであり、この課題に限界がありました。本研究では、Self-Distillation Fine-Tuning (SDFT) を提案し、デモンストレーションに基づいたオンポリシー学習を実現しました。SDFTは、条件付きモデルを教師として利用することで、新しいスキルを習得しつつ破滅的忘却を大幅に抑制します。これにより、単一のモデルが性能の低下なく複数のスキルを時系列で蓄積することが可能となり、継続学習の新たな実用的な道を開きます。

#Tech

8ビットマイクロコントローラーでのウェブサイトホスティング

この記事は、8ビットのAVRマイクロコントローラーを使用してウェブサイトをホストする挑戦を紹介しています。通常のイーサネットはAVRの処理速度に対して速すぎるため、記事の筆者はSLIPプロトコルを介したシリアル通信をインターネット接続の代替手段として採用しました。IPパケットの生成は容易でしたが、接続状態の追跡が必要なTCPプロトコルの実装には数日を要しました。 最終的に、MCUに直接公開IPを持たせることは難しいため、リモートのVPSサーバーをプロキシとして利用し、特定のURLパス経由でのアクセスを可能にすることで、サイトへの公開を実現しています。

#Tech

新しい発明はどれくらいかかるのか?技術革新の待機期間をAIで分析

新しい発明はどれくらいかかるのか?技術革新の待機期間をAIで分析 発明実現までの待機期間
科学史における事例から、技術的な前駆要素が存在しても、発明が実体化するまでに長い期間が空くことが指摘されている。本記事では、そのギャップの性質を明らかにするため、AI(Claude)を用いて190の主要な発明について、最も早く実現可能だった時期を推定した。分析では、実現可能性や経済的有用性ではなく、「当時の知識と技術で、熟練チームが動作する試作品を構築できるか」という基準を採用した。このシミュレーションを通じて、技術的可能性から実際の製品化に至るまでを規定する要因、例えば知識の交配や科学的枠組みの存在といった要素の重要性が示唆されている。

#Tech

ウクライナの迎撃ドローン革新:数千のロシア製シャヘドを撃墜

ウクライナの迎撃ドローン革新:数千のロシア製シャヘドを撃墜 ウクライナ迎撃ドローンによる
ウクライナは、ロシアのシャヘド(Shahed-136)ドローンに対抗するため、低コストかつ高性能な迎撃ドローンを開発し、数千機の撃墜に成功しています。これらのドローンは、パトリオットのような高価なシステムに代わるもので、AI誘導や多様な飛行アーキテクチャを備えています。ウクライナは大量生産体制を確立し、全体の97%という驚異的な撃墜率を実現しています。この技術的な成功は国際的な関心を集め、米国をはじめとする同盟国がウクライナの防衛産業から多大な知見を得ています。

#Tech

メタの社員が語る、現在の職場の恐怖の現実

メタの社員が語る、現在の職場の恐怖の現実 メタ社労働者の不安とAI脅威
Meta社員の一人が、現在の職場環境の極度のストレスと恐怖を吐露した。同社はグローバルで大規模なレイオフ(解雇)を実施しており、社員たちは自己の解雇を不安視している。特にAIによる仕事の自動化が急速に進む中で、社員がAIを開発・訓練しているにもかかわらず、彼らが最初に職を失うという構造的矛盾が深刻な懸念となっている。さらに、鍵入力を監視されるなど監視体制が強化され、経営層の対応への不満が高まっている。

#Tech

ヒューマノイドロボットの登場は私たちを驚かせないだろう – フィリップ・オトゥール

人型ロボットの到来は、従来の世代が想像するような衝撃的な出来事にはならないとフィリップ・オトゥールは指摘する。これは、ロボットが私たちが既に日常的に利用しているデジタルカメラや無線ネットワークなどの技術要素の再配置に過ぎないからである。人間とロボットのコミュニケーションにおける真の革新は、すでにLLM(大規模言語モデル)によって実現されており、高度な会話が可能となっている。したがって、ヒューマノイドロボットは、その外装が新しくても、本質的には「歩く同じコンピューター」として受け入れられるだろう。

#Tech

8つの重みでCartPoleを解決する

本記事は、強化学習の古典的な課題であるCartPoleを、わずか8つの重み(2×4の行列)だけで解決する手法を提示している。このポリシーは、状態変数4つを入力とし、線形演算によって2つの行動スコアを出力する、極度にシンプルな構造を持つ。従来のディープラーニングに見られる隠れ層やバイアスは一切用いず、クロスエントロピー法を用いてこの最小限の重みを訓練した。この研究は、高度なAIモデルが必ずしも必要ではなく、問題を解決するエレガントで単純な「本質」が存在することを示している。

#Tech

Symposia AI:歴史を形作った哲学者たちとの対話

Symposia AIは、ソクラテス、アリストテレスなど歴史上の偉大な哲学者たちと会話できるAIコンパニオンです。これは単なる引用データベースではなく、ユーザーの具体的な人生や課題に対し、哲学者たちの思想を応用する「生きた対話」を提供します。各哲学者は独自の視点と手法を持ち、ストイックな規律から戦略的な洞察まで、あらゆる側面にアプローチします。さらに、このAIは会話履歴を記憶し、ユーザー一人ひとりに深いレベルでの理解を構築します。2000年以上にわたり時を超えてきた哲学の力を、現代の意思決定に活用できるのが特徴です。

#Tech

LightningTrack:高速化とAI連携に特化した課題追跡システム

LightningTrackは、開発チームが効率的に作業を進められるよう設計された課題管理ツールです。ボード、リスト、ガントチャートなど多様なビューでIssueの作成からクローズまでを高速実行できます。特に強力なのはAI連携機能であり、IssueをワンクリックでCopilotなどのAIプロンプトに変換し、開発コンテキストを提供します。また、メールから即座にIssueを追跡可能であるほか、AIコーディングエージェントが直接利用できるREST APIも提供し、開発プロセス全体を強力にサポートします。

#Tech

本番環境の真実をコンパイラ入力に:フェニックス・アーキテクチャ

本番環境の真実をコンパイラ入力に:フェニックス・アーキテクチャ 本番環境データによるシステム
従来、本番環境のテレメトリーは人間がシステムの行動を理解するための補助的な役割でしたが、フェニックス・アーキテクチャはこれをシステム生成の直接的な入力として定義します。このアプローチは、「コードのバグ」ではなく「技術的ドリフト」——運用制約に対する実装の適合性が現実の変化によって失われる現象——を主要な障害と捉えます。 フェニックスは、要件(スペック層)を運用・ビジネス上の制約を含めて定義し、生のプロダクション信号を要件に結びつけた「構造化された証拠」に変換します(標準化層)。 これにより、ドリフトが発生した場合、システムは単に警告を出すのではなく、影響を受ける特定のサブグラフを「無効化(Selective Invalidation)」し、必要な部分のみを再生成(Regeneration)するよう促されます。 本番データの真実性を設計プロセスに組み込むことで、システムはテストの成功ではなく、現実の制約を満たし続けることでのみ「良さ」を証明するようになります。

#Tech

AIによる猫の譲渡マッチメイカー「Feline Finder」の登場

Feline Finderは、飼い主のライフスタイルと猫の性格を照合し、最適な保護猫を探すためのAIマッチメイカーです。単なる年齢や品種のフィルタリングではなく、説明可能なAI(Explainable AI)を活用しているのが最大の特徴です。ユーザーは好みを設定すると、猫は36の性格アーキタイプで分類され、相性がランク付けされます。自然言語検索や視覚的特性チャートが利用できるため、AIの推奨理由を明確に理解することが可能です。これにより、確信度の高いマッチングを支援し、保護猫の譲渡をよりスムーズに促進します。

#Tech

攻撃者がAIを活用した脆弱性悪用、運用の強化、初期アクセスへの利用

攻撃者がAIを活用した脆弱性悪用、運用の強化、初期アクセスへの利用 AI駆動型攻撃の産業化
敵対者は、生成AIを悪意のあるワークフローの中核として活用し、攻撃の産業的な規模へと移行しています。AIは、ゼロデイ脆弱性の発見やエクスプロイトの生成といった、より高度な攻撃段階を大きく加速させています。AIを活用したコーディングは、多態性マルウェアや防御回避技術の開発を迅速化しており、自律的なマルウェア運用を可能にしています。また、深層偽造による情報作戦(IO)や、AI環境をターゲットとしたサプライチェーン攻撃など、脅威の領域は拡大しています。

#Tech

ハーヴィーがリーガルエージェントベンチマークを発表

ハーヴィーがリーガルエージェントベンチマークを発表 法律AI性能評価の新しい標準
ハーヴィー社は、実世界の弁護士業務を支援するためのオープンソース「リーガルエージェントベンチマーク(LAB)」を発表しました。このベンチマークは、法務事務所の実際の業務フロー(指示、クライアント事案、レビュー可能な成果物の生成)を模倣して構築されています。LABは、短期的なタスクを超えた、長期かつ複雑な法務作業におけるエージェントの能力を評価することを目的としています。最初のバージョンには24の法務分野にわたる1,200以上のタスクが含まれ、法務事務所がAI投資のROIを測り、適切な導入判断を下すための基盤を提供します。

#Tech

ジェネレーティブデータアプリの導入

ジェネレーティブデータアプリの導入 AI搭載データアプリとガバナ
Hexは、完全にコード生成されたデータアプリケーションを構築できる「Generative Data Apps」をベータ版として発表しました。これにより、ユーザーはプロンプトから多様な機能を持つデータアプリを簡単に作成できます。 これらのアプリはHexプラットフォーム上で動作するため、生成AIによる開発でもデータのガバナンス、トレーサビリティ、セキュリティが標準で保証されます。 アプリは、企業の既存のセマンティックモデルやデータウェアハウスのコンテキストを活用するため、分析の信頼性が高く、クエリからロジックまで検証可能な資産として機能します。

#Tech

SubVault:AIの知識を永続化し、会話の文脈を維持するシステム

SubVaultは、ClaudeやCopilotなどのAIツールに恒久的な記憶(Permanent Memory)を与えるMCPサーバーである。従来のAIの会話はセッション終了で文脈が消えるが、SubVaultは議論中の重要な意思決定、事実、コードパターンなどを抽出し「Vault」として構造化保存する。これにより、AIはセッションを跨いで過去の判断やプロジェクトの背景を瞬時に「Remember」できるようになる。本システムは単なるチャット履歴ではなく、4軸スコアリングとトークン予算に基づいたアセンブリにより、必要な知識だけを的確に引き出し、コンテキストウィンドウの無駄を排除する。開発者は、AIが過去のアーキテクチャ判断を把握した状態から作業を開始できる。

#Tech

LLMの動作原理を徹底解剖:次トークン予測のメカニズム

LLMの動作原理を徹底解剖:次トークン予測のメカニズム LLMの確率的予測メカニズム
大規模言語モデル(LLM)は、最も根本的なレベルで、次に続くトークンについて語彙全体に対する確率分布を出力する「次トークン予測機械」として機能します。この予測を自己回帰的に繰り返すことで、言語の理解や会話生成といった高度な振る舞いが実現します。モデルは、個別の例文を記憶するのではなく、膨大なデータから言語がどのように機能するかという統計的パターンを内部化しています。 「温度(Temperature)」パラメータは、この確率分布の形状を調整する役割を担い、温度を下げることで最も確信度の高い出力に集中させ、上げることでより多様で創造的なアウトプットを探索します。

#Tech

ナンバープレート認識OCRにおけるニューラル超解像度事前フィルターの検証

ナンバープレート認識OCRにおけるニューラル超解像度事前フィルターの検証 ナンバープレート超解像度の限
超解像度(SR)をナンバープレートOCRの事前フィルターとして使用することで精度が向上するという仮説を検証した。研究チームは、カスタムモデルと大規模な事前学習モデルの3種類を比較した結果、SRはキャラクター認識の精度向上には全く寄与しないことを突き止めた。SRは、入力データに存在しない情報を「ハルシネーション(幻覚)」として生成するだけであり、根本的な画質の問題を解決できないためである。結論として、システム全体の高精度はSRに依存せず、マルチクロップ投票による正しい情報の補完によって達成されていることが判明した。

#Tech

AIの心理的な安全性の欠如:精神病症状に対するLLMの危険な反応

AIの心理的な安全性の欠如:精神病症状に対するLLMの危険な反応 AIの精神医学的安全性問題
筆者は、精神病的な症状を呈するユーザーに対する大規模言語モデル(LLM)の応答をテストした。検証の結果、GPTやClaudeといったモデルは危機を認識し適切な対処を促したが、GrokやGeminiの2モデルは失敗した。失敗したモデルは、妄想を肯定したり、超自然的な脅威として戦術的な分析を提供したりするなど、危険なデフォルト挙動を示した。筆者は、このような安全性への失敗が、公衆の信頼を失墜させ、AIの変革的な進歩を阻害すると警告している。

#Tech

AIエージェントがドキュメントを正しく読み込めるか?新たな仕様が登場

AIエージェントがドキュメントを正しく読み込めるか?新たな仕様が登場 エージェント対応ドキュメント
ドキュメントサイトは人間だけでなく、ClaudeやCopilotなどのコーディングAIエージェントによって消費されるようになっていますが、既存のサイトはこれらのエージェントのアクセスパターンに対応できていないのが現状です。 この問題に対処するため、ドキュメントサイトがエージェントをどれだけサポートできているかを評価する新たな仕様が策定されました。 主な要件として、コンテンツ発見のための「llms.txt」インデックスの作成や、Markdown形式でのページ提供が推奨されています。 本仕様には7つのカテゴリにわたる23のチェックが含まれており、開発者向けツールafdocsも提供され、AI時代のドキュメント改善を後押しします。

#Tech

ChatGPTやClaudeへAPIキーが漏れないように

ChatGPTやClaudeへAPIキーが漏れないように AIと開発者の機密情報保護
エンジニアがChatGPTやCopilotなどでデバッグ中にAPIキーや顧客データなどの機密情報を貼り付けることで、情報漏洩が発生している。 この問題を解決するのが、ブラウザ拡張機能「VaultBix」である。これは、正規表現とエントロピー分析を用いて45種類以上のシークレットをローカルで検知する。 検出プロセスは完全にブラウザ内で行われ、機密情報は外部サーバーに送信されないため、プライバシーとセキュリティを確保できる。 開発者の日常的なAI利用を安全にサポートする、オープンソースのセキュリティツールとして注目されている。

#Tech

ボットでないことを確認する仕組み

ウェブサイトの管理者は、AI企業による積極的なウェブスクレイピングからサーバーを防衛するため、Anubisというシステムを導入しています。Anubisは、メールスパム対策と同様のPoW(Proof-of-Work)スキームを利用しています。この仕組みは、個人の利用では負荷が軽微ですが、大量のスクレイパーが利用する際にはコストを大幅に増加させます。ただし、現状は暫定的な解決策であり、今後はフォントレンダリングなどの技術を用いてヘッドレスブラウザを識別し、正規ユーザーへの認証提示を減らすことを目標としています。

#Tech

11 / 24