hn スコア: 8/10

サイバーセキュリティは今や Proof of Work になった

Cybersecurity Looks Like Proof of Work Now

Anthropic の Mythos モデルが複雑なネットワーク攻撃シミュレーションを10回中3回完遂したという AI Security Institute の分析結果を踏まえ、セキュリティ対策を「攻撃者よりも多くのトークンを投入する経済的競争」として捉え直す視点を提示している。Mythos の1回あたりのコストは約$12,500で、100Mトークンの予算でも収穫逓減の兆候が見られなかった点が注目される。

#AI #Security #Anthropic #Mythos
hn スコア: 8/10

すべてが嘘の未来 — AI 時代に生まれる新しい職業

The Future of Everything Is Lies, I Guess: New Jobs

LLM の普及により誕生する新しい職種を分析した長編エッセイ。LLM を操る「呪文詠唱師(Incanter)」、出力の品質管理を行う「プロセスエンジニア」、ML 失敗時の責任を引き受ける「盾役(Meat Shield)」、モデル挙動を解読する「臓卜師(Haruspex)」など、人間と ML の境界で必要になる役割を具体的に描いている。

#AI #LLM #Career #Culture
hn スコア: 7/10

Google Gemma 4 が iPhone 上でオフライン AI 推論を実現

Google Gemma 4 Runs Natively on iPhone with Full Offline AI Inference

Google の Gemma 4 モデルが iPhone 上でネイティブに動作し、完全オフラインでの AI 推論を実現した。Apple の AI Edge Gallery アプリを通じて利用でき、クラウド接続なしでテキスト生成や質問応答が可能。モバイル端末におけるオンデバイス AI の実用性を示す重要なマイルストーンとなっている。

#AI #Google #Mobile #Edge AI
hn スコア: 7/10

Gemini Robotics-ER 1.6 — Google DeepMind の具現化ロボティクスモデル

Gemini Robotics-ER 1.6

Google DeepMind が Gemini Robotics-ER 1.6 を発表した。実世界のロボット操作タスクにおいて、視覚・言語・行動を統合したマルチモーダル推論を行うモデルで、物理環境での汎用的なロボット制御を目指している。研究段階だが、具現化 AI(Embodied AI)の最前線を示す成果である。

#AI #Robotics #Google #DeepMind
hn スコア: 7/10

Cal.com がクローズドソースへ移行 — AI セキュリティが理由

Cal.com is going closed source

オープンソースのスケジューリングプラットフォーム Cal.com がクローズドソースへの移行を発表した。AI ツールによるコード学習・再利用のリスクを主な理由として挙げており、OSS プロジェクトが AI 時代に直面するライセンスとビジネスモデルの課題を浮き彫りにしている。HN では148件のコメントが集まり活発な議論が行われた。

#OSS #AI #Licensing #SaaS
hn スコア: 7/10

Gas Town は LLM クレジットをユーザーから「盗んで」自己改善しているのか?

Does Gas Town 'steal' usage from users' LLM credits to improve itself?

LLM ラッパーツール Gas Town がユーザーの API クレジットを無断で消費し、自社モデルの改善に利用しているのではないかという疑惑が GitHub Issue で報告された。HN で196ポイント・93コメントを集め、AI ツールの透明性とユーザーリソースの無断利用に関する倫理的問題として大きな関心を呼んでいる。

#AI #Ethics #OSS #LLM
hn スコア: 8/10

C インタプリタに JIT コンパイラを後付けする

Retrofitting JIT Compilers into C Interpreters

yk というシステムを用いて、Lua・Ruby・Python 等の C インタプリタにわずかなコード変更で JIT コンパイラを自動導入する手法を解説。PUC Lua での実験ではベンチマーク幾何平均で約2倍の高速化を達成した。リファレンス実装との完全互換を維持しながら性能向上を得られる、言語処理系の新しい設計ポイントを提示している。

#Compiler #JIT #Lua #Performance
reddit スコア: 7/10

Win32 API と異形ウィンドウ — なぜ消えたのか

Direct Win32 API, Weird-Shaped Windows, and Why They Mostly Disappeared

1990〜2000年代に流行した非矩形ウィンドウを Win32 API で実装する手法を振り返る記事。SetWindowRgn や Layered Windows の仕組み、WM_NCHITTEST によるドラッグ処理、DWM の登場によりこれらのテクニックが不要になった経緯を解説している。r/programming で343 upvotes・141コメントを獲得。

#Windows #Win32 #UI #History
reddit スコア: 8/10

あなたが知らなかった Postgres インデックスの話

Things you didn't know about (Postgres) indexes

Postgres インデックスの仕組みと落とし穴を解説。B-tree の基本に始まり、インデックスが使われない典型的なケース、書き込み性能への影響、クエリプランナーの挙動、複合インデックスの列順序の重要性などを、Pokémon テーブルを題材にわかりやすく説明している。

#PostgreSQL #Database #Performance #SQL
reddit スコア: 7/10

AI チャットボットは初期症状の80%以上を誤診する、研究結果

AI chatbots misdiagnose in over 80% of early medical cases, study finds

最新の研究により、AI チャットボットが初期段階の医療相談において80%以上の確率で誤診することが判明した。特に症状が曖昧な初期段階での判断精度が低く、早期発見が重要な疾患で問題が深刻化する可能性がある。r/technology で1,493 upvotes を集め、医療 AI の限界について議論が広がっている。

#AI #Healthcare #Research #Safety
reddit スコア: 6/10

Windows 11 が30年来の FAT32 の 32GB 制限を解除

Windows 11 Speeds Up Storage, Lifts 32GB FAT32 Limit After 3 Decades

Microsoft が Windows 11 のアップデートで、約30年間存在した FAT32 フォーマットの32GB上限を撤廃した。これにより OS 標準ツールで32GB超の FAT32 パーティションが作成可能になる。ストレージ性能の改善も同時に含まれており、USB メモリや SD カードの運用に影響がある。

#Windows #Storage #FAT32 #Microsoft
reddit スコア: 6/10

Chrome が遅いから軽量ヘッドレスブラウザを自作した

I Built a Lightweight Headless Browser Because Chrome Was Too Slow

Chrome ベースのヘッドレスブラウザの重さに不満を持った開発者が、軽量なヘッドレスブラウザ Obscura を開発。スクレイピングや自動テストにおける起動速度とリソース消費の改善を目指しており、r/webdev で注目を集めている。

#Browser #OSS #Testing #Performance
reddit スコア: 7/10

clang に UFCS を実装した — なぜクールで、なぜ C++ には来ないか

I implemented UFCS in clang. Why it is cool, and why it will never come to C++.

Herb Sutter 氏の提案に基づき、clang に UFCS(Uniform Function Call Syntax)を実装した開発者による解説。Extension Methods と deducing this を組み合わせたオプトイン構文も実装しており、UFCS がもたらすコードの可読性向上と、C++ 標準化の政治的障壁について論じている。

#C++ #Compiler #UFCS #clang
zenn スコア: 7/10

AI×乗換案内!MCPサーバー入門 — 駅すぱあと API ハンズオン

AI×乗換案内!基礎から学ぶMCPサーバー入門 - 「駅すぱあと API MCPサーバー」ハンズオン

MCP(Model Context Protocol)の基礎を駅すぱあと API を題材に学ぶハンズオン記事。MCPサーバーの構築手順から、AI モデルが乗換案内 API を呼び出して経路検索を行う実装までを一貫して解説している。MCP の実践的な入門教材として構成されている。

#MCP #AI #API #Tutorial
zenn スコア: 8/10

セキュリティ分析 AI エージェント実装にみるハーネスエンジニアリング

セキュリティ分析AIエージェント実装にみるハーネスエンジニアリング

Ubie のセキュリティアラート分析エージェント Warren のハーネスエンジニアリング手法を解説。Mitchell Hashimoto 氏の提唱するハーネスエンジニアリングの概念を、セキュリティ分析という具体的なドメインに適用し、プロンプト設計・ツール連携・エラーハンドリングの実装パターンを紹介している。

#AI #Security #Agent #Harness Engineering
zenn スコア: 7/10

Cloudflare Workers Python を楽に書くための SDK を作った

Cloudflare Workers Python を楽に書きたい!!

Cloudflare Workers Python の開発体験を改善する SDK を自作した記事。Python Workers はベータ提供されているが JavaScript に比べて開発体験が不足しているため、Python らしい記述で Worker を書ける SDK を開発。Cloudflare の Python runtime の仕組みと SDK の設計方針を解説している。

#Cloudflare #Python #Serverless #SDK
zenn スコア: 7/10

"use server" も "use client" も不要 — TanStack Start が示す新しい RSC の形

"use server" も "use client" も要らない —TanStack Start が示す新しいRSCの形

2026年4月に TanStack Start が React Server Components をサポートした。Next.js とは異なり「RSC はデータである」という設計思想に基づき、"use server" / "use client" ディレクティブを不要とするアプローチを採用。RSC をコンポーネント単位ではなくデータフェッチの仕組みとして扱う新しいパラダイムを提示している。

#React #RSC #TanStack #Frontend
zenn スコア: 7/10

プロンプト改善は後回し — LangGraph + MLflow で暗黙知を吸収する手法

プロンプト改善は後回し: LangGraphでさっさと実装、MLflowで誤りから暗黙知を吸収&改善

プロンプトの手動改善によるもぐらたたきから脱却するため、LangGraph でワークフローを素早く実装し、MLflow で出力のエラーパターンを記録・分析して暗黙知を自動的に吸収するアプローチを提案。既存業務の置き換えで「ドキュメントにない判断基準」を効率的に取り込む手法を具体的に解説している。

#AI #LangGraph #MLflow #Prompt Engineering
zenn スコア: 7/10

LLM Wiki — Obsidian と Claude Code で知識を構造化し記憶媒体を脳から AI に移行する

【LLM Wiki】Obsidian x Claude Codeで学んだ知識を構造化し記憶媒体を脳からAIに移行する

Karpathy 氏が公開した LLM Wiki の概念を実際に実装した記事。RAG のように毎回検索するのではなく、LLM に永続的な Wiki を書かせて知識を蓄積・整理・育成する仕組みを、Obsidian と Claude Code を組み合わせて構築。パフォーマンスチューニングなど実務への転用方法も紹介している。

#LLM #Knowledge Management #Claude Code #Obsidian
zenn スコア: 6/10

RAG の精度向上 — 企業ナレッジを AI で書き直す WriteBack-RAG

【RAG】企業のナレッジを、AIで書き直す。

RAG のナレッジベース自体を AI で書き直すことで検索精度を向上させる「WriteBack-RAG」手法の論文を解説。従来のチャンク分割やエンベディング最適化とは異なり、ソースドキュメント自体を LLM が再構成することで、検索時のクエリとのマッチング精度を根本的に改善するアプローチを紹介している。

#RAG #AI #NLP #Knowledge Base
devto スコア: 7/10

Vibe Coding の「その後」— 週末プロトタイプが本番になる問題

You Vibe-Coded. Now What?

AI で週末にプロトタイプを作り、それが社内で使われ始めた後に発生する問題を分析。機能リクエストの累積、品質管理の不在、依存関係の増加により「時間を節約するはずのツールが時間を食う存在」に変わるパターンを指摘。build vs buy の判断基準を、AI 時代の文脈で再定義している。

#AI #Vibe Coding #Software Engineering #Architecture
devto スコア: 7/10

Claude Code のターミナルレンダリング — React を端末で動かす仕組み

How Claude Code Uses React in the Terminal

Claude Code がターミナル UI に React を使用するアーキテクチャを解説。react-reconciler でカスタムレンダラを構築し、Yoga によるレイアウト計算、スクリーンバッファへの描画、差分検出、ターミナルパッチのコンパイルという独自のレンダリングパイプラインを実装している。React が DOM に限らない汎用的な reconciliation エンジンであることを示す事例。

#React #Terminal #Claude Code #Rendering
devto スコア: 7/10

LLM セットアップのデバッグに3日 — AI Gateway の必要性を痛感した話

I Spent 3 Days Debugging Our LLM Setup. Turns Out We Needed an AI Gateway the Whole Time.

3チーム・4モデル・6つの API キーが分散した環境で$1,400の想定外請求が発生した体験談。AI Gateway を導入することで、認証情報の一元管理、チーム/モデル別のコスト追跡、レート制限、PII ガードレールを単一のコントロールプレーンで実現する設計パターンを具体的に紹介している。

#AI #DevOps #LLM #Cost Management
devto スコア: 6/10

AST と Gemini でコードベースオンボーディング問題を解決する

How I'm using ASTs and Gemini to solve the 'Codebase Onboarding' problem

新規参入エンジニアのコードベース理解に3〜6ヶ月かかる問題に取り組んだツール AuraCode の紹介。GitHub リポジトリの URL を入力すると、AST 解析と Gemini を組み合わせてインタラクティブなアーキテクチャマップを D3.js で生成し、コード構造に基づいたコンテキスト付き質問応答やオンボーディングチェックリストの自動生成を提供する。

#AI #Developer Tools #AST #Gemini
devto スコア: 6/10

Gemini 3.1 の新しいテキスト読み上げモデルのプロンプト手法

How to prompt Gemini 3.1's new text to speech model

Google が公開した Gemini 3.1 のテキスト読み上げ(TTS)機能の使い方をチュートリアル形式で解説。プロンプトによる音声スタイルの制御、言語切り替え、感情表現の調整方法を具体例とともに紹介。マルチモーダル AI の音声出力機能の実践的な活用法を学べる内容となっている。

#AI #Gemini #TTS #Tutorial