hn スコア: 9/10

元Azure Core エンジニアが語る、Microsoft がAzureへの信頼を失墜させた意思決定

Decisions that eroded trust in Azure – by a former Azure Core engineer

元Azure CoreのシニアエンジニアがMicrosoftの内部意思決定の問題を詳細に語る連載記事の第1弾。Azure Boostオフロードカードやネットワークアクセラレータの開発に携わった著者が、OpenAIという最大顧客と米国政府の信頼を失うに至った経緯を内部の視点から明かす。カーネルエンジニアとしてDocker・AKS・Azure Container Instancesなどの基盤技術開発に貢献した経験を持つ著者による、技術的意思決定の失敗に関する貴重な一次情報。

#Azure #Microsoft #Cloud #OpenAI
hn スコア: 9/10

Sora の経済学を計算した結果:AI動画は金を燃やす炉だった

A $20/month user costs OpenAI $65 in compute. AI video is a money furnace

OpenAIが2026年3月24日にSoraの終了を発表した背景を、推論コストの観点から詳細に分析した記事。月額20ドルのユーザーに対し実際のコンピュートコストは65ドル、ピーク時の1日あたりコンピュートコストは推定1500万ドルに対し生涯収益は総額210万ドルという壊滅的な数字を提示。Disneyとの10億ドル契約からわずか3か月での撤退という事実から、AI動画生成の構造的な経済問題を明らかにしている。

#OpenAI #Sora #AI #Economics
hn スコア: 8/10

Google が Gemma 4 オープンモデルを公開

Google releases Gemma 4 open models

Google DeepMindがGemmaファミリーの最新バージョンとなるGemma 4をリリース。責任あるAIアプリケーション構築を目的としたオープンモデルで、テキスト・画像・音声など複数のモダリティに対応するGeminiエコシステムの一部として位置づけられている。開発者がローカル環境やクラウドでファインチューニングやデプロイを行うための軽量かつ高性能なモデルとして提供される。

#Google #Gemma #LLM #OpenSource
hn スコア: 8/10

AMD が Lemonade をリリース:GPU と NPU で動くオープンソースのローカル LLM サーバー

Lemonade by AMD: a fast and open source local LLM server using GPU and NPU

AMDがローカルAI推論のためのオープンソースサーバー「Lemonade」を公開。ネイティブC++バックエンドでわずか2MBの軽量サービスとして動作し、GPUとNPUの両方を活用して高速推論を実現する。OpenAI API互換のため、Open WebUI・n8n・Continue・GitHub Copilotなど数百のアプリと即座に連携可能。1分でインストールでき、ハードウェアに応じた自動設定機能を備えるなど、ローカルファーストAIの実用性を重視した設計。

#AMD #LLM #LocalAI #OpenSource
hn スコア: 8/10

Cursor 3 発表:AI エージェントの統合ワークスペース

Cursor 3

Cursorがバージョン3をリリースし、複数のAIエージェントを統合管理できるワークスペースへと進化。エージェントの並列実行、ローカルとクラウド間のハンドオフUX、コミットからマージ済みPRまでの一貫したワークフローを実現する。コード理解のためのFiles機能、統合ブラウザ、Cursor Marketplace上のプラグインなど、ソフトウェア開発の第3の時代(エージェント群が自律的にコードを出荷する時代)を見据えた機能群を搭載。

#Cursor #AI #IDE #DevTools
hn スコア: 8/10

LinkedIn がブラウザ拡張機能を密かにスキャンしていた問題が発覚

LinkedIn is searching your browser extensions

LinkedInがユーザーのブラウザにインストールされている拡張機能を無断でスキャンしていることが発覚し、browsergate.euで詳細が公開された。EU法の観点から違法な行為である可能性が指摘されており、Hacker Newsで1500ポイント以上を獲得するなど大きな議論を呼んでいる。ブラウザ拡張機能のリストはユーザーのフィンガープリンティングやプライバシー侵害につながる情報であり、企業によるサイレントな情報収集の実態が問題視されている。

#LinkedIn #Privacy #Security #Browser
hn スコア: 7/10

Artemis II の船内コンピュータで Microsoft Outlook が2つ起動し、原因不明

Artemis computer running two instances of MS outlook; they can't figure out why

月周回ミッションArtemis IIの船内コンピュータシステムで、Microsoft Outlookのインスタンスが2つ同時に起動しているという問題が報告された。NASAのエンジニアがその原因を特定できていないという状況がBlueskyで共有され、宇宙船でもWindowsあるあるが発生するというユーモラスな話題としてHacker Newsで292ポイントを獲得。深宇宙でのソフトウェアデバッグという非日常的な状況が開発者コミュニティの関心を集めた。

#NASA #Artemis #Windows #Humor
reddit スコア: 8/10

ガベージコレクション徹底解説:基礎原理からJava・Go・Pythonの最新コレクタまで

Garbage Collection: From First Principles to Modern Collectors in Java, Go and Python

McCarthyの1960年の論文(LispとMark-and-Sweepの起源)とWilsonの1992年のサーベイ論文を出発点に、G1GC・ZGC・Goの並行コレクタ・CPythonのハイブリッド方式まで、GCの系譜を体系的に解説。著者自身がGoでトイGCを実装した経験も含め、言語を横断してGCの仕組みを理解するための実践的な記事。Java→Go→Rust→Javaと複数言語を使ってきた著者の視点から、GCパーズ・スループット・ライトバリアなどの概念を整理している。

#GC #Java #Go #Python
reddit スコア: 8/10

Anthropic がソースコード削除のため数千の GitHub リポジトリを誤って DMCA テイクダウン

Anthropic took down thousands of GitHub repos trying to yank its leaked source code

Anthropicが最も人気のある製品(Claude Code)のソースコードの流出コピーをインターネットから削除しようとした際、誤って数千のGitHubリポジトリをテイクダウンしてしまった事件。あるソフトウェアエンジニアがこの大規模な誤削除を発見し、Anthropicは「事故だった」と認めた。npmパッケージへのソースマップ混入というリリース工程のヒューマンエラーが発端となった、AI企業のコード管理とDMCA運用の問題を浮き彫りにした事例。

#Anthropic #GitHub #DMCA #OpenSource
reddit スコア: 7/10

AI 年齢確認義務化を推進する団体、実は OpenAI が裏で支援していた

Group Pushing Age Verification Requirements for AI Turns Out to Be Sneakily Backed by OpenAI

AIサービスへの年齢確認義務化を推進している団体が、実はOpenAIによって密かに資金提供されていたことが判明。r/technologyで10,000以上のupvoteを獲得した注目ニュース。年齢確認の規制が既存大手に有利に働き、新規参入を阻害する可能性があるという規制のキャプチャ(regulatory capture)の観点から、AI業界の政治的動きに対する懸念が高まっている。

#OpenAI #AI #Regulation #Privacy
reddit スコア: 7/10

Nvidia の中国市場シェアが60%を下回る:国産チップメーカーが165万基の AI GPU を出荷

Nvidia market share in China falls to less than 60%

中国政府がデータセンターでの国産チップ利用を推進する中、Nvidiaの中国市場シェアが60%を下回った。中国の国産チップメーカーが合計165万基のAI GPUを出荷し、急速にシェアを拡大している。米国の輸出規制を背景に、中国のAI半導体自給率が着実に向上していることを示すデータであり、グローバルなAIチップ市場の地政学的な変動を反映している。

#Nvidia #China #AI #Semiconductor
reddit スコア: 7/10

Adobe Creative Cloud がユーザーの hosts ファイルを勝手に書き換えていた

Users say Adobe Creative Cloud rewrote hosts file to detect installed app

Adobe Creative Cloudがインストール済みアプリケーションの検出のために、ユーザーのシステムのhostsファイルを無断で書き換えていたことがユーザーの報告で判明。hostsファイルはOSレベルのDNS解決を制御する重要なシステムファイルであり、ユーザーの同意なく変更することはセキュリティとプライバシーの観点で深刻な問題。アドブロッカーやライセンス管理のためにhostsファイルを編集していたユーザーへの影響が特に大きい。

#Adobe #Security #Privacy #Desktop
reddit スコア: 7/10

Denuvo の DRM がハイパーバイザーベースの手法で突破され、ゼロデイリリースが常態化

Denuvo has been broken, company promises countermeasures against new DRM bypasses

ゲームDRMの業界標準であるDenuvoが、ハイパーバイザーベースのバイパス手法により突破された。発売日と同日にDRM解除版が出回る「ゼロデイリリース」が常態化しており、Denuvo社は対策を約束しているものの、ハイパーバイザーレベルの介入はOSの保護機構をバイパスするため、セキュリティ上の懸念も指摘されている。ゲーム業界のコピープロテクション技術と攻撃者のイタチごっこが新たな段階に入った。

#DRM #Security #Gaming #Hypervisor
reddit スコア: 7/10

「もう100% AI でコードを書かないと時間の無駄?」Web開発者のアイデンティティ危機

Are we really at '100% AI or you're wasting time' yet?

r/webdevで184 upvoteを獲得したセルフポスト。r/ClaudeCodeなどのサブレディットで「手書きコードは時間の無駄」という論調が広がる中、手でコードを書くことにアイデンティティを感じてきた開発者の葛藤を綴った投稿。AI支援コーディングの急速な普及に対し、実際の現場ではどこまでAI依存すべきかという議論が活発に交わされ、Web開発者コミュニティの現在地を反映している。

#AI #WebDev #Career #Community
zenn スコア: 9/10

パラメータ4個で710Mパラメータの Foundation Model に勝った時系列予測手法 FLAIR の全貌

パラメータ4個で710M超えのFoundation Modelに勝った時系列予測手法FLAIRの全貌

AmazonのChronos-T5-Large(710Mパラメータ、GPU必須)をベンチマークで上回る時系列予測手法FLAIRを詳細に解説。FLAIRはパラメータ約4個、numpyとscipyだけで動作するPython500行の実装でありながら、Chronos Benchmark II(25データセット)でAgg. Relative MASE 0.696を達成し、2位のChronos-Bolt-Base(0.791)を大幅に上回った。核心は「周期時系列を行列に変形するとrank-1になる」という構造的観察で、SVDにより季節パターンとレベル変動を2つのベクトルに分離する。

#TimeSeries #ML #Python #Statistics
zenn スコア: 8/10

Cloudflare が WordPress 後継 CMS「EmDash」を公開、実際に触ってみた

WordPress後継CMS「EmDash」を触ってみる

CloudflareがWordPressの後継を名乗るCMS「EmDash」を公開し、その日のうちにセットアップからデプロイまでを一通り検証した記事。EmDashはAstroベースの静的サイトジェネレーターにWordPressライクな管理画面を組み合わせた構成で、Cloudflare Workers(D1 + R2)またはNode.jsにデプロイ可能。npm create emdash@latestで対話型セットアップが完了し、ブログ・マーケティング・ポートフォリオなどのテンプレートを選択できる。

#Cloudflare #CMS #WordPress #Astro
zenn スコア: 7/10

AWS Security Agent が GA リリース、OWASP Juice Shop で実際にペネトレーションテストを実行してみた

AWS Security Agentを組織で活用していく上での考慮点を考えてみた

2026年3月にGAリリースされたAWS Security Agentの実践レポート。設計レビュー・コードレビュー・ペネトレーションテストをAIエージェントが一気通貫で担うサービスを、ECS Fargate上のOWASP Juice Shopに対して実行した結果と、組織導入時の考慮点を整理。CloudFormationテンプレート付きで検証環境の構築手順も公開しており、本番環境に適用する際の注意事項にも触れている。

#AWS #Security #AI #PenetrationTesting
zenn スコア: 7/10

ReAct パターンを TypeScript だけでスクラッチ実装して理解する

ReAct (Reason+Act) パターンを TypeScript だけで実装する

AIエージェントの代表的な実装パターンであるReAct(Reason+Act)を、LangChainやMastraなどのフレームワークを使わずにTypeScriptのみでスクラッチ実装する解説記事。LLMに「思考→行動→観察」のループを繰り返させる仕組みの内部動作を、実際のコードを通じて理解できる。フレームワーク内部で何が起きているかをブラックボックスにせず、自前で実装することで得られる深い理解を重視したアプローチ。

#AI #TypeScript #ReAct #Agent
zenn スコア: 7/10

ハーネスエンジニアリングを極めたら、Issue から AI エージェントが自律的に PR を作成するようになった

ハーネスエンジニアリングを極めたら、IssueからAIエージェントが動き、人間の役割は要件定義だけになった

2か月で21体のAIエージェントによる自律開発パイプラインを構築した実践記録。57万行のモノレポに対し、GitHub Issueに要求を書いて寝ると翌朝にはマージ可能なPRが上がっている状態を実現。ハーネスエンジニアリング(AIエージェントの制御・監視の設計手法)に焦点を当て、何が動き何がまだ動いていないかを具体的な数字とともに記録している。

#AI #Agent #Automation #DevOps
zenn スコア: 7/10

Claude Code に仕様書を丸ごと渡すな:「要件を伝える」との決定的な違い

Claude Codeに仕様書を丸ごと渡すな ── 「要件を伝える」との決定的な違い

Claude Codeに仕様書Markdownを丸ごと渡して実装させるアプローチの問題点を指摘し、「仕様を渡す」ことと「要件を伝える」ことの本質的な違いを解説。仕様書を1つのファイルにまとめてdocs/に配置するパターンが陥りがちな落とし穴と、サブエージェント・スキル・フック・MCPなどの機能を活用した効果的な要件の伝え方を具体的に比較している。

#ClaudeCode #AI #Productivity #DX
zenn スコア: 7/10

ralph loop から始めるハーネスエンジニアリング入門

とりあえず ralph loopからはじめるハーネスエンジニアリング

AIエージェントを継続的に循環させる開発手法「ralph loop」の導入方法を解説する入門記事。ハーネスエンジニアリング(AIエージェントの実行環境と制御機構の設計)の中でも特にシンプルで導入しやすいパターンとして、実践的な構成例とともに紹介。AIエージェントの自律的なコード生成・レビュー・修正のサイクルを回すための最初のステップとして位置づけられている。

#AI #Agent #HarnessEngineering #DevOps
devto スコア: 8/10

Heuristic 検出器 vs LLM Judge:7,000件の AI エージェントトレースを分析して分かったこと

Heuristic Detectors vs LLM Judges: What We Learned Analyzing 7,000 Agent Traces

7,212件のラベル付きエージェントトレースを用いて、ヒューリスティック検出器とLLM-as-Judgeのエージェント障害検出性能を体系的に比較した研究報告。18の本番品質ヒューリスティック検出器がTRAILベンチマークで60.1%のスコアを達成し、コスト0ドルで最良のLLM Judge(11%)を大幅に上回った。構造的な障害検出ではヒューリスティックが優位、意味的な推論が必要なケースではLLMが不可欠という階層的アーキテクチャの有効性を示している。

#AI #LLM #Testing #AgentEval
devto スコア: 7/10

24GB の AI 3D 生成パイプラインを完全オフラインのデスクトップアプリに詰め込んだ

We crammed a 24GB AI 3D-generation pipeline into a completely offline desktop app (and the Demo is live)

インディーゲーム開発者向けに、SaaSやAPIペイウォールに依存しない完全オフラインの2D-to-3D生成ツール「Jupetar」を開発。24GBのローカルモデルフォルダにHunyuan等のモデルを格納し、外部通信を一切行わない「No-Ping」アーキテクチャを採用。買い切りモデルでユーザーが生成メッシュの所有権を完全に保持でき、Steamでデモ版が公開されている。

#AI #3D #GameDev #LocalAI
devto スコア: 7/10

ContextCore:AI エージェントの会話履歴を MCP で検索可能なメモリレイヤーに変える

ContextCore: AI Agents conversations to an MCP-queryable memory layer

複数のIDEアシスタントやマシンにまたがるAIコーディングチャットの履歴を取り込み、キーワード検索とセマンティック検索の両方で検索可能にし、MCP経由でアシスタントに公開するローカルファーストのOSSツール。データはLLMに送信されず、ユーザーがMCPサーバーを明示的に使用する場合のみLLMのコンテキストに含まれる設計。AIアシスタントのセッション間の記憶喪失問題を解決することを目指している。

#AI #MCP #Memory #OpenSource
devto スコア: 7/10

Claude Code のコスト、把握できていますか? フックベースの観測ツールを作った

You're spending money on Claude Code and have no idea how much

Claude Codeのマルチエージェントオーケストレーション利用時にコストデータが構造化されていない問題を解決するため、フックベースの軽量観測ツール「cast-observe」を開発。セッションコスト・トークン数・エージェント別アクティビティをローカルのSQLiteデータベースに記録し、CLIから照会できる。10個のサブエージェントを並列実行する際に、どのエージェントが最もトークンを消費しているかを特定可能にした。

#ClaudeCode #AI #Observability #DevTools