hn スコア: 8/10

Google の TurboQuant: 極限圧縮で AI の効率性を再定義

TurboQuant: Redefining AI efficiency with extreme compression

Google Research が発表した TurboQuant は、LLM の量子化における新手法。従来の INT4/INT8 量子化よりもさらに極端な圧縮率を実現しつつ、モデルの精度劣化を最小限に抑える。特に大規模モデルの推論コスト削減とエッジデバイスへのデプロイを可能にする点で、実用的なインパクトが大きい。Transformer のアテンション層とフィードフォワード層に対して異なる量子化戦略を適用するアプローチが特徴的。

#AI #Quantization #LLM #Google
hn スコア: 7/10

ARC-AGI-3: AI エージェントの汎用知能を測定する初のインタラクティブ推論ベンチマーク

ARC-AGI-3

ARC Prize が ARC-AGI-3 を公開。従来の静的パズル形式から進化し、AI エージェントが未知の環境を探索し、目標をその場で獲得し、適応可能な世界モデルを構築し、継続的に学習する能力を測定する。自然言語の指示なしで、環境内の経験から学んで戦略を適応させる必要がある。人間が100%解ける環境でのスキル獲得効率を時間軸で評価する新しいパラダイム。

#AI #AGI #Benchmark #Reasoning
hn スコア: 7/10

Ensu: Ente が作ったプライバシー重視のローカル LLM アプリ

Ensu – Ente's Local LLM app

エンドツーエンド暗号化の写真ストレージで知られる Ente が、ローカル実行型の LLM アプリ Ensu をリリースした。データをクラウドに送信せず、デバイス上で完結する AI アシスタントを提供する。プライバシーファーストの設計思想を LLM の領域に拡張した取り組みで、Ente のセキュリティインフラストラクチャを活用している。

#AI #LLM #Privacy #Open Source
hn スコア: 7/10

量子化の基礎から応用まで: ngrok による包括的な解説

Quantization from the Ground Up

ngrok のエンジニアリングブログが、ニューラルネットワークの量子化について基礎から実践までを体系的に解説。浮動小数点数の表現から始まり、対称/非対称量子化、キャリブレーション手法、QAT と PTQ の違い、GPTQ や AWQ などの最新手法までカバーしている。LLM を実務で効率的にデプロイするための実践的な知識が詰まった記事。

#AI #Quantization #LLM #Tutorial
hn スコア: 7/10

EU が依然としてプライベートメッセージと写真のスキャンを推進

The EU still wants to scan your private messages and photos

EU の Chat Control 法案が引き続き推進されている。エンドツーエンド暗号化メッセージのクライアントサイドスキャンを義務化する内容で、EU 議会の反対票にもかかわらず、各国政府とテクノロジーロビーが議会の決定を覆そうとしている。暗号化通信のプライバシーとセキュリティに関する根本的な議論が続いており、Signal や ProtonMail などの暗号化サービスへの影響が懸念されている。

#Privacy #EU #Encryption #Policy
hn スコア: 7/10

事故車から Tesla Model 3 の車載コンピュータをデスクで動かす

Running Tesla Model 3's computer on my desk using parts from crashed cars

セキュリティ研究者が Tesla のバグバウンティプログラムに参加するため、eBay で事故車の部品を購入し、Tesla Model 3 の MCU(Media Control Unit)とオートパイロットコンピュータをデスク上で起動させた。水冷金属ケーシングに覆われた iPad サイズのコンピュータを分解し、電源供給や通信の仕組みを解析してスタンドアロンで動作させるまでの過程を詳細に記録している。

#Security #Hardware #Tesla #Reverse Engineering
hn スコア: 7/10

GitHub Copilot の操作データを全ユーザーからモデル訓練に利用へ(自動オプトイン)

Updates to GitHub Copilot interaction data usage policy

GitHub が Copilot の操作データ利用ポリシーを更新し、Free・Pro・Business を含む全ユーザーティアの操作データをモデルの訓練・改善に使用することを発表した。デフォルトで自動オプトインとなるため、ユーザーは明示的にオプトアウトする必要がある。コードのプライバシーとAI訓練データの利用に関する議論が再燃しており、HN と Reddit の両方で大きな反響を呼んでいる。

#GitHub #Copilot #AI #Privacy
reddit スコア: 7/10

Wikipedia が AI 生成テキストを禁止、2つの例外あり

Wikipedia has banned AI-generated text, with two exceptions

Wikipedia が記事内での AI 生成テキストの使用を公式に禁止する方針を決定した。ただし翻訳支援とアクセシビリティ改善の2つの用途は例外として認められる。AI による大量の低品質コンテンツ投稿が百科事典の信頼性を脅かしているとの判断に基づく。r/technology で20,000以上のアップボートを獲得し、AI コンテンツの品質管理に関する広範な議論を呼んでいる。

#AI #Wikipedia #Content Policy #Quality
reddit スコア: 7/10

Neuralink 患者が脳インターフェースで World of Warcraft をプレイ

Neuralink patient confirms he's playing World of Warcraft with his mind

Neuralink のブレインコンピュータインターフェースを埋め込まれた患者が、思考だけで World of Warcraft をプレイしていることを確認した。キーボードやマウスを使わず、脳信号をリアルタイムに変換してゲーム操作を行う。BCI 技術の実用的な進歩を示す事例として注目されており、ゲーム操作のような複雑なインタラクションが可能になったことは重要なマイルストーン。

#Neuralink #BCI #Gaming #Neuroscience
reddit スコア: 7/10

systemd に生年月日フィールド追加、Linux に年齢確認機能が到来

Age checks creep into Linux as systemd gets a DOB field

systemd にユーザーの生年月日(DOB)フィールドが追加された。EU のデジタルサービス法に対応する年齢確認メカニズムの一環で、Linux の init システムがユーザーの個人情報を管理する範囲がさらに拡大する。FOSS コミュニティでは systemd のスコープクリープに対する懸念が再び高まっており、r/technology で1,200以上のアップボートを獲得。Linus Torvalds や Richard Stallman への言及とともに議論が白熱している。

#Linux #systemd #Privacy #EU Regulation
reddit スコア: 7/10

米連邦判事: 国防総省の Anthropic ブラックリスト登録は AI 安全性への見解に対する報復

US judge says Pentagon's blacklisting of Anthropic looks like punishment for its views on AI safety

米連邦判事が、国防総省による Anthropic のブラックリスト登録について、同社の AI 安全性に関する公の立場への「報復」であるとの見解を示した。判事は「企業を機能不全にしようとする試み」と表現。AI 企業の安全性への姿勢と政府契約の関係、AI 軍事利用をめぐる政策的な緊張関係が浮き彫りになっている。

#AI #Anthropic #Policy #Defense
reddit スコア: 7/10

RollerCoaster Tycoon の最適化技法を徹底解析

The gold standard of optimization: A look under the hood of RollerCoaster Tycoon

1999年にほぼ全てアセンブリ言語で書かれた RollerCoaster Tycoon の内部実装を詳細に解析した記事。Chris Sawyer がどのようにメモリ管理、描画パイプライン、パスファインディングなどを最適化したかを現代の視点から掘り下げている。限られたハードウェアリソースで複雑なシミュレーションを実現した職人技は、現代の開発者にとっても示唆に富む内容。

#Assembly #Optimization #Game Development #Retro Computing
reddit スコア: 6/10

Sanders と AOC がデータセンター新設の一時停止法案を提出

Bernie Sanders and AOC introduce bill to pause building of new datacenters

Bernie Sanders 上院議員と Alexandria Ocasio-Cortez 下院議員が、新しいデータセンターの建設を一時停止する法案を共同提出した。AI ブームに伴うデータセンターの急増が電力消費と環境に与える影響を懸念してのもの。r/technology で20,000以上のアップボートを集め、テクノロジーインフラの社会的影響に関する議論を引き起こしている。

#Data Center #Policy #AI Infrastructure #Environment
zenn スコア: 7/10

Web サービスを作る上で Rust を採用する必要ってほぼないよね

Webサービスを作る上でRustを採用する必要ってほぼないよね

Web サービスにおける Rust 採用の是非を論じた記事。レスポンスタイムのボトルネックはネットワーク I/O と DB I/O であり、言語の実行速度差はマイクロ秒からサブミリ秒単位で誤差に埋もれると指摘。CPU バウンドな処理が特定されない限り、JS・Ruby・PHP・Python などの動的型付け言語で十分であり、Rust の開発コストの高さを考慮すると「速いから Rust」は不適切な判断だと主張している。

#Rust #Web Development #Programming Languages #Architecture
zenn スコア: 8/10

NLP2026 の最優秀賞・優秀賞から見る言語処理最前線

NLP2026の最優秀賞・優秀賞から見る言語処理最前線

言語処理学会第32回年次大会(NLP2026)で受賞した最優秀賞3本・優秀賞13本の計16本を俯瞰した記事。2023年の579件から2026年の797件へ発表件数が35%増加し、LLM ブーム以降の NLP 分野の急成長を示す。受賞研究のトレンドを分析し、日本語 NLP 研究の方向性を整理している。松尾研究所のデータサイエンティストによる現地参加レポートを含む。

#NLP #LLM #Research #Japanese
zenn スコア: 8/10

8,706回の INSERT が CI を殺していた — Rails CI 55%短縮の全手順

8,706回のINSERTがCIを殺していた — Rails CI 55%短縮の全手順

GMO ペパボのエンジニアが、Rails アプリの CI 実行時間を 8m08s から 3m37s へ 55%短縮した全手順を公開。GitHub Actions + MySQL 構成で、第1弾のインフラ層最適化(CI 設定・DB 設定のみ)で 47%削減、第2弾のアプリ層最適化でさらに改善。プロダクションコード変更なしで大幅な改善を達成した点が特に実践的。RSpec の matrix 分割戦略と DB セットアップの最適化手法を詳細に解説。

#Rails #CI/CD #GitHub Actions #Performance
zenn スコア: 7/10

Claude Code との壁打ちが「積み上げ型」に変わった — 長期記憶 MCP サーバーの開発記

Claude Codeとの壁打ちが「積み上げ型」に変わった。長期記憶MCPサーバーの開発記

Claude Code のセッション間で文脈が失われる問題を解決するため、SQLite ベースの長期記憶 MCP サーバー「engram」を開発した記録。グローバル1DB + プロジェクトタグによるフィルタリング方式を採用し、FTS5 とベクトル検索のハイブリッドでトークン消費ゼロのローカル完結型を実現。「先週の壁打ちで出た結論」や「却下した設計案」といった動的文脈を保持する仕組みを詳述している。

#Claude Code #MCP #SQLite #AI Tools
zenn スコア: 7/10

UUID は衝突する。なぜなら人間は愚かだから。

UUID は衝突する。なぜなら人間は愚かだから。

UUIDv4 の理論上の衝突確率は 230京回生成でようやく50%を超えるが、実際には人間の実装ミスによって UUID が衝突する確率の方がはるかに高いという逆説的な考察。UUID の衝突確率の下限は「人間がバグを仕込む確率」でバウンドされると指摘し、乱数生成器の誤用やシード固定など、実務で起こりうる衝突パターンを具体的に列挙している。

#UUID #Programming #Reliability #Software Engineering
zenn スコア: 7/10

ハーネスエンジニアリングで人間のコードレビューをやめる

ハーネスエンジニアリングで人間のコードレビューをやめる

コードレビューを完全に AI に委譲するための実践記録。HashiCorp 創業者 Mitchell Hashimoto が提唱し、OpenAI Codex チームの記事で広まった「ハーネスエンジニアリング」の概念を適用。AI の過剰指摘やバンドエイド修正、振り子ループなどの問題に対し、制約・情報提供・フィードバックループの設計で対処する。Cursor と Claude Code での具体的な実装方法を解説している。

#AI #Code Review #Claude Code #Harness Engineering
devto スコア: 7/10

AI エージェントは思考できるが記憶できない — ghost による解決策

your agent can think. it can't remember.

AI エージェントにインスタント・エフェメラルな PostgreSQL データベースを提供する ghost を紹介。無制限のデータベース・フォーク、1TB ストレージを無料で提供し、Memory Engine で記憶、pg_textsearch で全文検索、TigerFS でファイル管理、Ox でサンドボックス実行を実現する。全て PostgreSQL ネイティブで動作し、エージェントの状態管理問題を DB 中心のアーキテクチャで解決するアプローチ。

#AI #PostgreSQL #MCP #Agents
devto スコア: 7/10

Rust 向けゼロコピー protobuf と ConnectRPC の実装を Anthropic がオープンソース化

Zero-copy protobuf and ConnectRPC for Rust

Anthropic のエンジニアが、Rust の RPC エコシステムのギャップを埋める2つのクレートを公開した。buffa は純 Rust の Protocol Buffers 実装で、ファーストクラスの editions サポートとゼロコピーメッセージビューを提供。connect-rust は Tower ベースの ConnectRPC 実装。既存の tonic/prost に対して、ゼロコピーによるメモリ効率の向上と最新の protobuf editions への対応が差別化ポイント。

#Rust #protobuf #ConnectRPC #Anthropic
devto スコア: 7/10

同一 TypeScript プロセスから MCP と REST を同時に配信する方法

Serving MCP and REST from the same TypeScript process

MCP がエージェント向けツール発見の標準になりつつある一方、HTTP API は人間とスクリプト向けに引き続き必要という「スプリットブレイン」問題を解説。Raw MCP SDK、手動 API ラッピング、Graft ライブラリの3つのアプローチを比較し、同じビジネスロジックを MCP と REST の両方から配信する設計パターンを示している。

#MCP #TypeScript #REST API #Architecture
devto スコア: 6/10

今まさに夏時間ギャップの中にいる — あなたのコードは対応できているか

We're Inside the DST Gap Right Now — Your Code Might Not Be

2026年3月のサマータイム切り替えに合わせて書かれた、タイムゾーン処理の落とし穴をまとめた記事。Date.now() の罠、DST ギャップ中に存在しない時刻の扱い、UTC オフセットの動的変化、IANA タイムゾーンデータベースの更新頻度など、グローバルアプリ開発者が直面する具体的な問題をコード例とともに解説。Kotlin での実装例を含む。

#Timezone #DST #Kotlin #Programming
devto スコア: 6/10

MCP アプリのテストは難しい — Inspector によるローカルテスト環境

MCP Apps are hard to test

MCP アプリは ChatGPT や Claude の中で動作するため、コード変更のたびに実ホストへのデプロイ、AI クレジットの消費、非決定的な LLM レスポンスの待機が必要で、テストが困難。sunpeak Inspector はローカルホスト上で ChatGPT と Claude の MCP App ランタイムを再現し、実際のホスト内と同じ表示を実現するテストツール。MCP エコシステムの開発体験改善に取り組む動き。

#MCP #Testing #Developer Tools #AI