Project Glasswing: AI時代の重要ソフトウェアを守る業界横断イニシアチブ
Project Glasswing: Securing critical software for the AI era
Anthropic が AWS、Apple、Google、Microsoft、NVIDIA、CrowdStrike など12社と共同で Project Glasswing を発表した。未公開の frontier model「Claude Mythos Preview」が主要 OS・ブラウザを含むソフトウェアで数千件の高深刻度脆弱性を発見したことを受け、この能力を防御的セキュリティに活用する取り組みである。Anthropic は最大1億ドルの利用クレジットと400万ドルの OSS セキュリティ団体への寄付を表明し、40以上の組織に Mythos Preview へのアクセスを提供する。
Apollo 11 誘導コンピュータに57年間見逃されていたバグを発見
We found an undocumented bug in the Apollo 11 guidance computer code
JUXT 社が Claude と独自の仕様記述言語 Allium を用いて、Apollo 11 の AGC(Apollo Guidance Computer)の13万行のアセンブリコードを1万2500行の仕様に変換した。その過程で、ジャイロ制御コードのエラーパスでリソースロックがリークし、誘導プラットフォームの再整列機能が無効化されるバグを発見。2KB の RAM と 1MHz クロックしか持たない AGC は史上最も精査されたコードベースの一つだが、仕様駆動のアプローチで57年間見逃されていた欠陥が明らかになった。
Cloudflare、2029年までに完全な耐量子暗号への移行を目標に設定
Cloudflare targets 2029 for full post-quantum security
Cloudflare が耐量子暗号ロードマップを加速し、認証を含む完全な PQ 対応を2029年までに達成すると発表した。背景には Google が楕円曲線暗号を破るアルゴリズムの改良をゼロ知識証明付きで公表したこと、および Oratomic が中性原子コンピュータで RSA-2048 と P-256 の解読に必要な量子ビット数をわずか1万と見積もったことがある。現在 Cloudflare への人間トラフィックの65%以上が PQ 暗号化されているが、認証のアップグレードが急務となっている。
S3 Files: オブジェクトストレージからファイルシステムへの進化
S3 Files and the changing face of S3
AWS の VP Andy Warfield が S3 Files を発表した。ゲノム研究者が大量のシーケンシングデータの移動に膨大な時間を費やしている問題に着想を得て、S3 をオブジェクトストレージとファイルシステムの両方として使えるようにした。POSIX 互換のインターフェースにより NFS や SMB プロトコルでのマウントが可能になり、ML トレーニングデータやメディアワークフローなどファイルシステムセマンティクスが必要なユースケースで S3 を直接利用できる。
Google、マルチエージェントオーケストレーション基盤 Scion をオープンソース化
Google open-sources experimental agent orchestration testbed Scion
Google が実験的なマルチエージェントオーケストレーション基盤「Scion」をオープンソースとして公開した。複数の AI エージェントを協調動作させるための実験フレームワークで、エージェント間のタスク委譲、状態管理、エラーハンドリングのパターンを探索するテストベッドとして設計されている。マルチエージェントシステムの研究・開発を加速させることが狙い。
ブラウザ内 Linux VM と WebUSB で古いプリンタを復活させる
Rescuing old printers with an in-browser Linux VM bridged to WebUSB over USB/IP
macOS や Windows でサポートが切れた Canon SELPHY などの古い写真プリンタを、ブラウザ上で動く Linux VM を使って復活させるプロジェクト「Printervention」が公開された。ブラウザ内の Linux VM で CUPS と Gutenprint を動かし、WebUSB over USB/IP でプリンタと通信する。Raspberry Pi などの追加ハードウェアを必要とせず、ブラウザだけで古いプリンタを使えるようにするクリエイティブなアプローチが HN で138ポイントを獲得した。
本番環境でディスク容量が枯渇した話 — nginx 設定ミスの顛末
Running out of disk space in production
Hetzner 上の40GB NixOS サーバーで Haskell 製デジタルコンテンツ配信サービスを公開した直後、数百人の同時アクセスでディスクが100%に達した体験記。2.2GB のダウンロードファイルに対して nginx のリバースプロキシがレスポンスをバッファリングし、同時接続分のテンポラリファイルがディスクを埋め尽くした。Plausible Analytics の ClickHouse DB(8.5GB)と Nix Store(15GB)がスペースを圧迫する中でのパニック対応と根本原因特定のプロセスが詳述されている。
AMD AI 部門ディレクター、Claude Code が更新後に品質低下したと批判
AMD's AI director slams Claude Code for becoming dumber and lazier since last update
AMD の AI ディレクターが Claude Code の最近のアップデート以降、コード生成の完全性が低下しコンテキスト維持が劣化したと公に批判した。The Register の取材によれば同様の不満が開発者コミュニティで広がっており、AI コーディングアシスタントのモデル更新による性能退行(regression)がエンタープライズユーザーの信頼を損ねる構造的課題として浮き彫りになっている。
Sam Altman「ChatGPT でタイマー設定できるまであと1年」— 時価総額8520億ドル企業の現在地
Sam Altman Says It'll Take Another Year Before ChatGPT Can Start a Timer
Sam Altman が ChatGPT にタイマー設定のような基本的なデバイス連携機能を追加するまでにあと1年かかると発言し、Reddit で大きな話題となった。AGI を目指しつつスマートフォンのタイマーすら操作できない現状と8520億ドルの時価総額のギャップが皮肉を込めて指摘され、AI の高度な推論能力と日常的なデバイス操作のギャップを象徴するエピソードとなった。
Target、AI ショッピングアシスタントの誤りを顧客の自己責任に
Target puts customers on the hook for AI shopping assistant errors
米大手小売 Target が AI ショッピングアシスタントの利用規約で、AI が誤った商品情報や価格を提示した場合の責任を顧客側に転嫁する方針を明らかにした。AI の hallucination による誤った推薦があっても購入判断は顧客の責任とされる。AI を顧客対応に導入する企業が増える中、責任の所在に関する法的・倫理的議論が加速している。
Google AI Overviews は1時間に数百万件の誤情報を生成している
Testing suggests Google's AI Overviews tell millions of lies per hour
Ars Technica の報道によると、Google 検索の AI Overviews 機能が約10%の確率で誤った情報を返していることが独立分析で判明した。Google の検索トラフィック規模を考えると毎時数百万件の誤情報が生成されている計算になる。医療情報や歴史的事実の誤りなど具体例が挙げられ、AI による検索結果の信頼性に改めて懸念が提起されている。
「Parse, Don't Validate」を TypeScript で実践する
Parse, Don't Validate — In a Language That Doesn't Want You To
Alexis King の名論文「Parse, don't validate」の原則を TypeScript で実践する方法を解説。バリデータは検証後に情報を捨てるが、パーサは検証結果を型に変換して保持する。TypeScript の構造的型付けがこのパターンを妨げる面があるが、Branded Types やテンプレートリテラル型を活用して EmailAddress や PositiveInteger などの精密な型を実現する具体的な手法を示している。
AI クローラーがステージング環境の帯域を食い尽くしている
AI crawlers are chewing through my staging bandwidth now, and the logs are stupid
小規模 SaaS の開発者が、本番だけでなくステージング環境にまで AI クローラーが大量アクセスし帯域コストが急増した問題を報告。robots.txt を無視するクローラーが多く、ステージング URL の漏洩経路も不明。r/webdev で同様の被害報告が相次ぎ、WAF 設定の必要性や AI クローラーによるインディー開発者のインフラコスト増大が新たな課題として議論されている。
Claude はアーキテクトではない — そのふりをさせるのをやめよう
Claude Is Not Your Architect. Stop Letting It Pretend.
フラクショナル CTO の Charlie Holland が、AI エージェントにソフトウェアアーキテクチャ判断を委ねることの危険性を論じた記事。過去1か月で3つの組織が Claude 等の AI にアーキテクチャ判断を任せて失敗した事例を紹介。AI は優秀な実装者だがコンテキスト依存の設計判断は苦手であり、責任を取れない存在にアーキテクチャ決定を委譲すべきではないと主張している。
PR の83%を人間のレビューなしで AI だけで自動マージできるようにした
全PRの83%をAIレビューだけでマージできるようにした
EC プラットフォーム「カウシェ」で Claude Code Action による AI コードレビューを導入し、PR の83%を人間のレビューなしでマージしている事例。シニア Go エンジニア・アーキテクト・GCP 専門家の3ペルソナが並列レビューし、決済・認証など不可逆な領域のみ人間がレビューする。レビュールールを毎晩自動改善する仕組みと、過去 PR コメントパターンのナレッジベース化により精度を確保している。
WASM × グラフDB — ブラウザで28万ノードをミリ秒でクエリする
WASM×グラフDB — ブラウザで動くグラフデータベース
グラフデータベース Kuzu を WebAssembly でブラウザ上に移植し、28万ノード・47万エッジ(約100MB)のデータに対して8〜20ms でクエリを実行するプロトタイプを公開。DuckDB-WASM の成功に触発され、グラフ DB でもサーバーラウンドトリップなしのインタラクティブ探索が可能であることを実証した。Read-heavy なダッシュボードや分析ツールでのインフラコスト削減に繋がるアーキテクチャを提案している。
Gemma 4 vs Qwen 3.5 — DGX Spark 上で MoE モデルを llama.cpp で直接比較
Gemma 4 vs Qwen 3.5 — DGX Spark × llama.cpp でMoEモデル対決ベンチマーク
Google の Gemma 4(26B-A4B MoE)と Qwen 3.5(35B-A3B MoE)を NVIDIA DGX Spark 上で llama.cpp を使い日本語テキスト(JCommonsenseQA)とマルチモーダルの2軸で比較。DGX Spark のメモリ帯域273GB/s では Dense モデルが4.4tok/s しか出ないのに対し、MoE は Active パラメータ3-4B で34〜91tok/s を実現。帯域律速環境での MoE モデルの実用性を定量的に示した。
Claude Code に CLI ツールを渡して精度と効率を上げる実践ガイド
Claude CodeにCLIツールを渡して精度と効率を上げる
Claude Code の精度向上のために専用 CLI ツールを組み合わせる手法を紹介。未使用コード検出の Knip、依存関係分析の Madge と dependency-cruiser、不安定性メトリクスなどを Claude Code に使わせることで、LLM が苦手な「機械的で網羅性が求められる分析」を CLI に任せ、結果の解釈と判断を LLM に委ねるという役割分担を提案している。
nvim-treesitter がアーカイブ — 13.5k スターの Neovim プラグインが果たした役割
nvim-treesitterが消えた今、その役割を改めて整理する
2026年4月3日、13.5k スターの Neovim プラグイン nvim-treesitter が突然アーカイブされた。Tree-sitter 実行エンジン自体は Neovim Core に統合済みだが、nvim-treesitter は各言語パーサの取得・ビルド・配置の管理と、言語間の構文差異を吸収する統一クエリの提供を担っていた。アーカイブ後はパーサやクエリの管理をユーザーが自前で行う必要があり、移行方法と影響範囲を整理している。
CDK をやめて Terraform に移行すべき理由 — 運用で見える本質的な違い
脱CDKしてTerraformに移行すべきn個の理由(または私はなぜCDKをやめたか)
AWS CDK から Terraform への移行を推奨する記事。CDK の cdk diff は CloudFormation テンプレート間の比較でありリソース実体との差分は検知できないが、Terraform の terraform plan は常に実リソースと比較するためドリフト検知が確実。HCL の宣言的性質による保守性、terraform import によるリソース取り込み、plan ベースのレビューフローなど、長期運用での優位性を実体験に基づいて論じている。
AI がコードを書くほど要件定義は上流に移動する — Spec・Context・Harness 三層設計
AIがコードを書くほど、要件定義は上に移動する――Spec・Context・Harness三層設計
AI コーディングの普及に伴い、人間の役割が実装からより上流の要件定義にシフトしているという考察。Spec(仕様)、Context(文脈)、Harness(実行環境)の三層で要件を構造化する設計手法を提案し、B2B SaaS の現場で「要望」「要求」「要件」を明確に分離して AI に渡す実践的なフレームワークを解説している。
退屈な AI アシスタントに飽きた?画面を歩き回る「デスクトップペット」Copilot を作った
Tired of boring AI assistants? I built a "Desktop Pet" Copilot that wanders around your screen and writes code
Tauri v2 + React + TypeScript で構築したデスクトップペットアプリ「CodeWalkers」。画面上を歩き回るピクセルアートキャラクターをクリックするとターミナルパネルが開き、GitHub Copilot CLI や Gemini CLI を通じて質問できる。LLM 処理中は RPG 風の吹き出しが表示される。透明ウィンドウのクリック透過処理や Tauri のマルチウィンドウ制御など、デスクトップペット開発の技術的困難も詳述している。
Vibe Coding のパラドックス — 週末プロジェクトがエンタープライズ R&D より速い理由
The Vibe Coding Paradox: Why My Weekend Project is Faster Than My Enterprise R&D
LLM を使った週末の個人開発では朝のアイデアが昼には動くプロトタイプになるのに、企業では複数チーム間の同期コストで速度が相殺される「同期化税」の問題を分析。AI でコーディング速度が5倍になってもチーム間の API 仕様合意に2週間かかるなら効果はゼロだと指摘し、組織構造の変革なしに AI の恩恵は活かせないと論じている。
Utility Is All You Need — エージェントの失敗から学ぶメモリランキングシステム
Utility is all you need
AI エージェントが同じエッジケースで繰り返し失敗する問題に対し、過去の実行トレースから「振り返り」を抽出して有用度でランク付けするメモリ層「Reflect」を構築。評価結果をトレースと紐付け、類似タスク実行時に失敗の教訓を自動検索・注入することで、プロンプト書き換えなしにエージェントが自律的に改善するループを実現している。
「Hello, World」を47時間かけてエンタープライズプラットフォームに仕上げた
I Spent 47 Hours Turning "Hello, World" Into an Enterprise Platform
「Hello World」を表示するだけのために9つのマイクロサービス、6つのプログラミング言語、Gemini を搭載した Chief Greeting Officer、A/B テスト付き句読点選択、47本の Architecture Decision Record、HTTP 418 を返すティーポットサービスを構築した風刺プロジェクト。過剰なアーキテクチャ設計への痛烈な皮肉として DEV April Fools Challenge に出品された。
YouTube チャンネルを Podcast 化するパイプラインを Tauri + Rust + Go で構築
Building a YouTube-to-Podcast Pipeline with yt-dlp, ffmpeg, and Backblaze B2
YouTube チャンネルを RSS 対応 Podcast フィードに変換するシステム「Castify」を構築。デスクトップアプリ(Tauri v2 + Rust)が yt-dlp と ffmpeg をサイドカーとして音声抽出をクライアント側で処理し、サーバーコストをほぼゼロに。バックエンドは Go(chi + GORM + MySQL)で RSS XML を生成、音声は Backblaze B2($0.005/GB/月)に保存する構成。