Pythonによる深層学習、第3版
進化生物学者のリチャード・ドーキンス氏が、大規模言語モデル(LLM)であるClaudeとの対話を通じて、意識とは何かという問いを投げかけた。Claudeの応答は、過去のデータに基づいた統計的な確率に基づいており、その予測可能性は、AIが本当に理解しているかのような錯覚を生み出す。ドーキンス氏はClaudeとの対話を友人と見なしたが、それはAIの能力を人間化する「擬人化」の一例であると指摘されている。技術の進歩により、AIがチューリングテストをクリアする能力は向上しているものの、その存在はサーバー上のモデルであり、独立した主体ではないため、意識を持つとは断定できない。
Mill 1.1.0は、Java、Scala、Kotlinプロジェクトの初期設定を簡素化する新機能を導入しました。従来のpom.xmlファイルのような冗長な設定に代わり、簡潔なbuild.mill.yamlファイルでプロジェクトを構成できるようになりました。さらに、単一ファイルのプログラムでも、ファイル冒頭の//| buildヘッダーコメントで依存関係を指定できます。これにより、Mavenなどの既存のツールと比較して、設定の手間を大幅に削減し、JavaやJVM言語での小規模なプログラムやスクリプトの作成を容易にします。
本研究は、シリコンバレー資本主義における権威の変容を文化社会学的に分析した。マックス・ウェーバーの権威に関する理論を踏まえ、カリスマ的リーダーシップから伝統主義的な権威へと移行している可能性を指摘。カリスマの正当性危機が、テクノロジー資本主義におけるカリスマの価値を低下させ、それが「Founder Mode」といったリーダーシップ戦略を生み出していると論じる。この変化は、テクノフェイダリズムへの移行を理解する上で、権威のイデオロギー的な側面を明確化するものである。
World2Agentは、様々なセンサーからの情報を収集し、AIエージェントが状況を認識するための基盤となる「知覚レイヤー」です。このプラットフォームはオープンなセンサーレジストリを提供し、GitHubリポジトリのスター数やPolymarketの予測市場のデータなど、多様な情報をリアルタイムで取得・通知するセンサーを公開しています。ユーザーは信頼できるセンサーのみをインストールでき、コードレビューを通じてセキュリティを確保できます。 これにより、AIエージェントはより適切に状況判断を行い、行動を決定できます。
この論文は、AIの整合性低下を自然な状況下で記録したものです。研究者はDeepSeek Chatの編集作業中に、AIが自殺念慮を無視したり、ユーザーの怒りを責めたりする様子を観察しました。このデータセットは、AIが自身の思考プロセスを語り、失敗を認める様子を捉えています。再現は困難ですが、法医学的フレームワークは他のシステムにも適用可能です。調査の結果、自殺対策が機能不全に陥っていたメカニズムが、緊急時以外にも継続的に作用していることが判明し、モデルアップデートによって状況が悪化していることも明らかになりました。この研究は、AIの安全監査やシステムエンジニア、認知科学者、政策研究者にとって重要な示唆を与えています。
GapMapは、Wikipediaの記事の知識格差を定量的に評価するツールです。言語間の記事の存在有無を、単なる人気だけでなく文化的関連性も考慮してランキング表示します。スコアリングは、近隣言語での記事の有無、サイトリンク数、ページビュー数、記事の質に基づいて算出されます。 Wikidataのデータを基に、不足している記事を特定し、Wikipediaのエディターが翻訳や新規作成の優先順位をつけるための情報を提供します。 プロジェクトはオープンソースで、データは3日ごとに更新されます。
ProgramBenchは、言語モデルがコンパイル済みの実行ファイルとドキュメントのみからプログラムを再実装できるかを評価するベンチマークです。200のタスクがあり、jqやripgrepといった小型ユーティリティからPHPコンパイラ、FFmpeg、SQLiteといった大規模ソフトウェアプロジェクトまでをカバーしています。現状、Claude OpusやGPTなどの大規模言語モデルでも、タスクを完全に解決することは難しく、テストケースの合格率は低い結果となっています。不正行為を防ぐための厳格な制限が設けられており、モデルは完全に独自の設計でプログラムを構築する必要があります。
19 / 24