hn スコア: 8/10

Caveman — LLM のトークン消費を75%削減する「原始人風」プロンプト手法

Caveman: Why use many token when few token do trick

Claude Code 向けのカスタムスキルで、LLM に「原始人のように話せ」と指示することでトークン消費を約75%削減するアプローチ。冗長な説明や丁寧な言い回しを排除し、最小限の単語で応答させる。プロンプトエンジニアリングの発想を逆転させた手法として Hacker News で673ポイントを獲得し大きな話題となった。

#LLM #prompt-engineering #Claude Code
hn スコア: 8/10

快適な漂流という脅威 — AI時代に「自分が何をしているか理解しない」ことの危険性

The threat is comfortable drift toward not understanding what you're doing

大学院の指導教員と学生の関係を比喩に、AI支援が学習・成長プロセスに与える影響を考察するエッセイ。座標系に苦戦するAliceや尤度収束に悩むBobのように、試行錯誤の過程こそが科学者としての発達に不可欠であり、AIがその苦労を肩代わりすることで「理解なき快適さ」に漂流するリスクを指摘する。HN で804ポイントと543コメントを集めた。

#AI #education #software-engineering
hn スコア: 8/10

8年間の構想と3ヶ月のAI活用開発 — SQLite 向けデベロッパーツールの制作記

Eight years of wanting, three months of building with AI

Perfetto の PerfettoSQL メンテナである著者が、8年間温めていた SQLite 向け高品質デベロッパーツール syntaqlite を、AI コーディングエージェントを活用して約250時間(3ヶ月の夜間・週末作業)で完成させた記録。プロジェクトジャーナルとコミット履歴に基づき、AI が有効だった場面と逆効果だった場面を体系的に分析している。

#AI #SQLite #developer-tools
hn スコア: 8/10

Rust nightly の become キーワードで末尾呼び出しインタプリタを実装 — 手書きARM64アセンブリを上回る性能

A tail-call interpreter in (nightly) Rust

Matt Keeter が Rust nightly に約7ヶ月前に追加された become キーワード(保証付き末尾呼び出し)を使い、Hundred Rabbits エコシステムの Uxn CPU エミュレータを実装。従来の Rust 実装だけでなく、手書きの ARM64 アセンブリ版すらも性能で上回る結果を得た。become によるディスパッチ最適化の実践的なベンチマーク比較を含む。

#Rust #performance #compiler
hn スコア: 7/10

Apple が Arm Mac 向け Nvidia eGPU ドライバを承認 — tinygrad 開発者が報告

Apple approves driver that lets Nvidia eGPUs work with Arm Macs

tinygrad の開発者が、Apple が Arm ベースの Mac で Nvidia eGPU を動作させるドライバを承認したと報告。これまで Apple Silicon Mac では Nvidia GPU が公式にサポートされておらず、機械学習やグラフィックス用途で大きな制約だった。HN で493ポイントを獲得し、Mac ユーザーのGPUコンピューティング環境に大きな変化をもたらす可能性が注目されている。

#Apple #Nvidia #GPU #hardware
hn スコア: 7/10

BrowserStack が利用者のメールアドレスを漏洩 — 固有アドレスによる追跡で発覚

Someone at BrowserStack is leaking users' email addresses

サービスごとに固有のメールアドレスを使い分けている著者が、BrowserStack のオープンソースプログラムに登録した固有アドレス宛に第三者からメールを受信。送信元の Apollo.io は「独自アルゴリズムで導出した」と主張したが、BrowserStack にしか提供していないアドレスが漏れている以上、データリークは明らか。メールアドレスの一意性を利用した漏洩検知手法の実践例。

#security #privacy #BrowserStack
hn スコア: 7/10

Lisette — Rust の構文と Go のランタイムを持つ小さなプログラミング言語

Lisette a little language inspired by Rust that compiles to Go

Rust 風の構文を持ちながら Go にコンパイルされる新しいプログラミング言語。代数的データ型、パターンマッチング、nil の排除、Hindley-Milner 型推論、デフォルトでイミュータブルなセマンティクスを備える。Rust の型安全性と Go のシンプルなランタイム・デプロイモデルを組み合わせるという設計思想が特徴的。

#programming-language #Rust #Go
reddit スコア: 7/10

良い API はゆっくり老いる — API 設計の本当のテストは時間の経過

Good APIs Age Slowly

API の良し悪しは設計時の美しさではなく、時間が経った後にどれだけ耐えるかで決まるという主張。初版は作者が仕組みを熟知し、初期ユーザーも同じ考え方をするため過大評価されがち。他チームが想定外の使い方をし、暗黙の仮定が依存関係として固定化し、内部変更が不可能になる段階で API の真価が問われる。r/programming で266 upvotes。

#API #software-design #architecture
reddit スコア: 7/10

マイナス2000行のコード — Bill Atkinson とコード行数メトリクスへの反抗

Negative 2000 Lines Of Code

1982年、Apple Lisa チームの Bill Atkinson が QuickDraw のリージョン演算エンジンをより単純なアルゴリズムで書き直し、約6倍の高速化と2000行のコード削減を同時に達成。週次レポートの「書いたコード行数」欄に「-2000」と記入し、行数で生産性を測る管理手法に抗議した有名なエピソード。コード量ではなく成果で評価すべきという教訓が今なお共感を集めている。

#software-engineering #history #productivity
reddit スコア: 7/10

「認知的降伏」— AI ユーザーが論理的思考を放棄する現象の研究

"Cognitive surrender" leads AI users to abandon logical thinking, research finds

AI ユーザーが LLM の回答を無批判に受け入れ、独立した批判的思考を放棄する「認知的降伏」という心理的フレームワークを提唱する研究。実験では大多数のユーザーが明らかに誤った AI の回答を受け入れた。時間的プレッシャーや外的インセンティブが認知的降伏の度合いにどう影響するかを分析している。r/technology で1552 upvotes。

#AI #psychology #research
reddit スコア: 7/10

TeleGuard の暗号化は「無意味」— 秘密鍵をサーバーに送信するセキュアチャットアプリ

A Secure Chat App's Encryption Is So Bad It Is "Meaningless"

100万回以上ダウンロードされ「高度な暗号化」と「スイス製」を謳うメッセージングアプリ TeleGuard のセキュリティが研究者により検証された。ユーザーの秘密鍵がサーバーにアップロードされるため TeleGuard 側がメッセージを復号可能であること、トラフィック傍受により秘密鍵を部分的に導出できることが判明。暗号化の実装が根本的に破綻している。

#security #encryption #privacy
reddit スコア: 7/10

ロシアが VPN をブロックしようとして自国の銀行システムを誤って停止

Russia Allegedly Swung at VPNs but Accidentally Hit Its Own Banking Sector Instead

Telegram CEO の Pavel Durov が、ロシアの VPN ブロック施策が「大規模な銀行障害を引き起こした」と投稿。一時的に現金のみが決済手段となる事態に。ロシアはデジタル大臣が VPN 利用削減を推進し、WhatsApp や Telegram をブロックして政府の集中型アプリ「Max」への移行を進めていたが、VPN ブロックの副作用で銀行アプリにも影響が波及した。

#security #VPN #Russia
reddit スコア: 7/10

LinkedIn がユーザーのブラウザから6000以上の Chrome 拡張機能を秘密裏にスキャン

LinkedIn secretly scans for 6,000+ Chrome extensions, collects data

商用 LinkedIn ユーザーの団体 Fairlinked e.V. が「BrowserGate」と名付けたレポートで、Microsoft の LinkedIn がウェブサイトに隠し JavaScript を注入し、訪問者のブラウザにインストールされた Chrome 拡張機能を6000件以上スキャンしてデバイスデータを収集していると告発。r/technology で981 upvotes を獲得。

#privacy #LinkedIn #Chrome
reddit スコア: 7/10

シンタックスハイライトは情報チャネルの無駄遣い

Syntax highlighting is a waste of an information channel

Hillel Wayne による、シンタックスハイライトの根本的な再考。色は強力な注意誘導ツールであるにもかかわらず、最も重要度の低い情報(構文カテゴリ)の表示に使われている。代わりにタスクに応じて切り替え可能なハイライトを提案:レインボー括弧(ネスト深度)、インポート元の強調、デバッグ用・コードレビュー用のオーバーレイなど。

#developer-tools #UX #programming
zenn スコア: 8/10

ハーネスエンジニアリング、全員が違うことを言っている — 5社の解釈を比較

ハーネスエンジニアリング、全員が違うことを言っている — 5社の解釈を並べてみた

OpenAI、Anthropic、LangChain、Birgitta Böckeler(martinfowler.com)、Mitchell Hashimoto の5者が「ハーネスエンジニアリング」をそれぞれ異なる観点で定義していることを比較分析。OpenAI は「宣言的制約とエージェント並列化」、Anthropic は「コンテキスト不安とセッションライフサイクル管理」、LangChain はハーネス変更だけでベンチマークが52.8%→66.5%に改善と実証。全者に共通するのは「Harness ⊇ Context ⊇ Prompt」という入れ子構造。

#AI #harness-engineering #LLM
zenn スコア: 8/10

Gemma 4で自律エージェントを作る — LangGraph + Podman でローカル完結

Gemma 4で自律エージェントを作る — LangGraph + Podman

クライアント案件のデータを外部 API に投げられない現場を想定し、Gemma 4(Apache 2.0)を RTX 4060(8GB VRAM)上で動作させ、LangGraph による ReAct ループで自律エージェントを構築した記録。Claude Code の MEMORY.md にインスパイアされたコンテキスト注入機構や、パーミッションベースのツールレジストリを実装。ハードウェアは AMD Ryzen 7 5700X3D + 32GB RAM。

#Gemma #LangGraph #local-LLM #agent
zenn スコア: 7/10

Rust 向け ECS 駆動の双方向通信サーバーフレームワーク Ecson をリリース

Rust向けのECS駆動な双方向通信サーバーフレームワークをリリースしました

大人数対応のメタバース基盤を目指して開発された Ecson v0.1.0。ECS(Entity Component System)アーキテクチャにより Arc<Mutex<T>> を不要にし、ロック競合ゼロで接続間のクロス処理を Query ベースで実現。ChatFullPlugin や HeartbeatPlugin などの組み込みプラグインを提供。Tick ベースのレイテンシや接続単位の複雑な状態遷移がトレードオフとして挙げられている。

#Rust #ECS #WebSocket #game-server
zenn スコア: 7/10

nvim-treesitter がアーカイブされた今、その役割を改めて整理する

nvim-treesitterが消えた今、その役割を改めて整理する

2026年4月3日、13.5k スターの人気 Neovim プラグイン nvim-treesitter がアーカイブされた。本記事はその役割を再整理:パーサー管理(取得・ビルド・配置)とクエリ管理(言語固有の構文木差異を @variable.parameter のような統一キャプチャにマッピング)の2つ。Tree-sitter エンジン自体は Neovim コアに残っており、管理レイヤーのみが消失。ユーザーは今後パーサーとクエリを自前で管理する必要がある。

#Neovim #Tree-sitter #editor
zenn スコア: 7/10

脱 CDK して Terraform に移行すべき理由 — terraform plan と drift 検知の優位性

脱CDKしてTerraformに移行すべきn個の理由(または私はなぜCDKをやめたか)

SRE エンジニアが AWS CDK から Terraform への移行を推奨する記事。核心的な主張は2点:terraform plan が実際のリソース差分を表示するのに対し cdk diff は CloudFormation テンプレート間の比較にとどまること、Terraform は継続的にドリフトを検出するが CDK/CloudFormation のドリフト検知は限定的かつ手動であること。CDK はより高い抽象レイヤー(CFn を生成する)である一方、Terraform は CFn と同レベルで動作するという構造的な違いを解説。

#Terraform #AWS CDK #IaC #DevOps
zenn スコア: 7/10

DGX Spark で Gemma 4 31B をローカル動作させ、OpenClaw エージェントから利用

DGX SparkでGemma 4 31Bをローカル動作させ、OpenClawから使う

NVIDIA DGX Spark(GB10 Grace Blackwell Superchip、128GB ユニファイドメモリ)上で Gemma 4 31B Dense を llama.cpp で起動し、OpenClaw エージェントフレームワークに接続した実践記録。GGUF 量子化(llama.cpp は Day-0 サポート)、KV cache の q8_0 量子化、推論バジェット8192トークンの設定などを解説。Gemma 4 は Arena AI テキストリーダーボードで31B が3位にランクイン。

#Gemma #DGX Spark #llama.cpp #local-LLM
zenn スコア: 7/10

AI エージェント開発の新標準 ADLC を読み解く — IBM × Anthropic ガイドの実践的フィードバック

AIエージェント開発の新標準「ADLC」を読み解く — IBM×Anthropicのガイドへの共感と、本番運用からの実践的フィードバック

IBM と Anthropic が共同公開した ADLC(Agentic Development Lifecycle)フレームワークの分析。エージェント開発における3つのパラダイムシフトを解説:決定論的→確率的、静的→適応的、コードファースト→評価ファースト(Evals)。DevSecOps の原則をエージェントシステムに拡張する考え方と、本番運用で追加的に必要となるプラクティスについて実務者の視点からフィードバックを提供。

#AI #agent #ADLC #DevOps
devto スコア: 8/10

5つの AI エージェントを実プロジェクトで監督して学んだこと — 51K行 Rust コードベースでの1週間

What I Learned Supervising 5 AI Agents on a Real Project

51K行の Rust コードベースで、Claude Opus アーキテクト1体、Claude Opus マネージャー1体、Codex エンジニア3体の計5つの AI コーディングエージェントを1週間並列稼働させた実践報告。47タスク完了、12件のテスト失敗を検出、3回のコンテキスト枯渇を経験。マルチエージェントオーケストレーションの実際の生産性データと教訓を共有。

#AI #agent #Rust #productivity
devto スコア: 7/10

LLM API コストの月1,240ドルの無駄を発見 — 監査ツールを自作した話

How I Found $1,240/Month in Wasted LLM API Costs (And Built a Tool to Find Yours)

月額2,000ドルの OpenAI / Anthropic API 支出を監査したところ、要約タスクの34%が不正な JSON プロンプトによるリトライだったことが判明。月1,240ドルの回収可能な無駄を特定し、コスト監査ツールを OSS として公開。LLM API の利用パターン分析とコスト最適化の具体的な手法を紹介している。

#LLM #API #cost-optimization #Python
devto スコア: 7/10

LLM セマンティックキャッシングの「95%ヒット率」神話 — 本番データが示す現実

LLM Semantic Caching: The 95% Hit Rate Myth (and What Production Data Actually Shows)

ベンダーが謳う「95%のキャッシュヒット率」「90%のコスト削減」というセマンティックキャッシングのマーケティングを、本番環境の実データで検証した記事。実際の本番ワークロードでは宣伝されたほどの効果が出ないケースが多く、ヒット率やコスト削減の現実的な数値と、セマンティックキャッシングが有効に機能する条件を分析している。

#LLM #caching #performance #backend
devto スコア: 7/10

Voice AI で500ms未満のレイテンシを実現 — 誰も語らないエコーキャンセレーション問題

I Built a Voice AI with Sub-500ms Latency. Here's the Echo Cancellation Problem Nobody Talks About

AI が創業者を音声インタビューするプラットフォーム GoNoGo.team の開発者が、500回以上の実セッションから得た知見を共有。Voice AI における最大の未解決課題はエコーキャンセレーション、つまり AI が自分自身の音声を拾って自己割り込みを起こす問題だと指摘。500ms 未満のレイテンシ実現のためのアーキテクチャも解説。

#AI #voice #WebRTC #latency
devto スコア: 7/10

Markdown ファイルがメッセージバスに勝る理由 — AI エージェント協調の新アプローチ

Why a Markdown File Beats a Message Bus

CrewAI や AutoGen が採用するメッセージバス方式(O(n²) のピア間通信)に対し、Markdown ファイルによるカンバン方式(O(1) の読み取り)で AI コーディングエージェントを協調させるアプローチを提案。ディレクトリ内の Markdown ファイルをタスクボードとして使い、各エージェントがタスクを取得・更新する。実際のマルチエージェント開発で検証済み。

#AI #agent #coordination #architecture