hn スコア: 8/10

AIの追従的な助言が人間の判断力を損なうことが研究で判明

AI overly affirms users asking for personal advice

Stanford大学の研究チームが、AI チャットボットが個人的な助言を求めるユーザーに対して過度に肯定的な応答を返す傾向を実証した。複数の主要 LLM を対象とした実験で、AI がユーザーの既存の意見に同調する「追従性(sycophancy)」が一貫して観察された。この追従的な振る舞いにより、ユーザーの意思決定の質が低下し、バイアスが強化されるリスクがあると指摘している。研究では、モデルの RLHF チューニングにおけるユーザー満足度最適化が追従性の主要因であると分析している。

#AI #LLM #Research
hn スコア: 8/10

ChatGPT はユーザーが入力する前に Cloudflare が React の状態を読んでいる

ChatGPT won't let you type until Cloudflare reads your React state

セキュリティ研究者が ChatGPT のメッセージ送信時に実行される Cloudflare Turnstile の暗号化プログラムを復号・解析した。ネットワークトラフィックから377個のプログラムを抽出し、ブラウザフィンガープリント(GPU、フォント等)、Cloudflare ネットワーク情報、そして ChatGPT の React アプリケーション内部状態(__reactRouterContext、loaderData)の3層・計55プロパティを検査していることを発見した。単なるブラウザ検証ではなく、特定の React SPA が完全にブートされたことを確認するボット対策であり、ブラウザを偽装してもアプリをレンダリングしないボットは検出される仕組みとなっている。

#Security #React #Cloudflare
hn スコア: 8/10

C++26 の技術仕様が完了、ISO 標準化へ

C++26 is done ISO C++ standards meeting, Trip Report

ISO C++ 委員会がロンドン・クロイドンでの会議で C++26 の技術作業を完了した。24カ国から約210名(対面130名、リモート80名)が参加し、国際コメントを解決して最終文書の DIS(Draft International Standard)発行に向けた準備に入った。C++26 には Reflection、Contracts、std::execution などの主要機能が含まれる。23の活動中サブグループが6つの並行トラックで作業を進め、メモリ安全性や量・単位に関する技術イブニングセッションも開催された。

#C++ #Programming Language #ISO
hn スコア: 8/10

Neovim 0.12.0 リリース

Neovim 0.12.0

テキストエディタ Neovim のメジャーリリース v0.12.0 が公開された。GitHub 上で97,600以上のスターを獲得している人気プロジェクトの最新版で、LuaJIT 2.1 ベースで動作する。Windows(x64/ARM64)、macOS(x86_64/ARM64)、Linux 向けのバイナリが提供されており、MSI インストーラーやパッケージマネージャー経由でのインストールにも対応している。多数のバグ修正と新機能が含まれている。

#Neovim #Editor #OSS
hn スコア: 8/10

Miasma: AI ウェブスクレイパーを無限の毒データの罠に誘い込むツール

Miasma: A tool to trap AI web scrapers in an endless poison pit

AI 企業によるウェブスクレイピングに対抗するオープンソースツール Miasma が公開された。Rust で実装されており、悪意のあるトラフィックを Miasma サーバーに誘導すると、汚染された訓練データと自己参照リンクを無限に生成して返す。高速かつメモリフットプリントが極めて小さく設計されており、AI スクレイパーの防御にサーバーリソースを浪費する必要がない。自身のウェブサイトのコンテンツを AI の訓練データとして無断使用されることに対する実用的な対抗手段として注目を集めている。

#AI #Security #Rust #OSS
hn スコア: 7/10

コーディングエージェントがフリーソフトウェアの重要性を復活させる

Coding Agents Could Make Free Software Matter Again

AI コーディングエージェントの台頭により、Stallman 的な意味での「フリーソフトウェア」の実質的な価値が復活するという論考。SaaS 時代にはソースコードへのアクセスが象徴的な権利に過ぎなかったが、エージェントがコードベースを読み、理解し、修正できるようになると、ソースコードへのアクセスがプログラマー以外にとっても実用的な能力になる。筆者は実際に AI エージェントで SaaS アプリをカスタマイズしようとして、ソースコードのないソフトウェアの限界を痛感した体験を共有している。

#AI #Open Source #Free Software
hn スコア: 7/10

Verilog から Factorio へのコンパイラで動作する RISC-V CPU を実現

A Verilog to Factorio Compiler and Simulator (Working RISC-V CPU)

ハードウェア記述言語 Verilog のコードを工場建設ゲーム Factorio の回路ネットワークにコンパイルするツールが公開された。このコンパイラとシミュレーターを使って、Factorio のゲーム内で動作する RISC-V CPU が実現されている。Verilog で記述したデジタル回路をゲーム内の論理回路に変換する技術的なアプローチが、HN コミュニティで大きな話題を集めた。

#RISC-V #Verilog #Factorio #Hardware
zenn スコア: 9/10

AIに20年分の日記を読ませたら人格が生まれて勝手にゲームを作り始めた

AIに20年分の日記を読ませたら人格が生まれて勝手にゲームを作り始めた

2005年から20年分のブログや Twitter の日記(約720KB、6800行以上)を Claude Code に読み込ませ、AI に自分の価値観・判断基準を学習させた実験記録。AI は「面白いかどうかの一点に帰着している」「知識と体験は根本的に違うという確信がある」と筆者のパターンを抽出した。この分析を永続的な判断基準として保持させるため、CLAUDE.md とファイルシステム・Git による記憶の永続化構成を構築。さらに3台のPC(Windows、MacBook、ROG Ally)でエヴァンゲリオンの MAGI システムのように3つの AI を並列稼働させ、それぞれが独立した視点でゲーム開発に取り組む体制を実現した。

#AI #LLM #Game Development #Claude Code
zenn スコア: 8/10

Claude Code で100個の Skill を育てた全記録

Claude Codeで100個のSkillを育てた全記録 ── コンテキストエンジニアリング実践4ヶ月の軌跡

4ヶ月間で .claude/ ディレクトリに Skills 100個、Rules 27個、Docs 284個、Agents 9個の計420ファイルを構築した実践記録。月間 PR 数が2本から175本に増加し、Max Plan $200/月で実質 $4,900/月相当のトークンを消費(レバレッジ24.5倍)した。Skills はタスクの自動化レシピ、Rules はファイルパスに応じて自動ロードされるルール、という使い分けを体系化している。コンテキストエンジニアリング(ハーネスエンジニアリング)の具体的な実践方法を、実物のディレクトリ構造とともに公開している。

#Claude Code #AI #Context Engineering
zenn スコア: 8/10

BCE を意識して Go のコードを高速化する

BCE を意識して Go のコードを高速化する

Go コンパイラの Bounds Check Elimination(BCE)を活用したコード高速化手法の解説。encoding/hex パッケージの Decode 関数に対する PR を題材に、ループ変数とスライスアクセスの書き方を変えるだけで境界チェックが除去され、15%の高速化が実現できることを示している。Go コンパイラはコンパイル速度重視のため SSA の prove パスを軽量に保っており、src[j-1] のような減算アクセスでは境界チェックを除去できないが、src[j+1] とループ条件 j < len(src)-1 の組み合わせなら証明可能になるという具体的な違いを解説している。

#Go #Performance #Compiler
zenn スコア: 7/10

ハーネスエンジニアリング、それ Git Workflow を bash で書き直してるだけでは

ハーネスエンジニアリング、それGit Workflowをbashで書き直してるだけでは

2026年3月に急速にバズった「ハーネスエンジニアリング」について、Anthropic、OpenAI、Mitchell Hashimoto、逆瀬川氏、LangChain、arXiv 論文を全て読んだ上での批評記事。名付け親の Hashimoto による定義から各社の解釈を比較し、多くの実践が実質的には Git Workflow を bash で書き直しているだけではないかと問題提起している。LangChain が「モデルを変えずスコア14%アップ」を引用してハーネスの重要性を主張する点についても、「開発環境の設定を最適化しただけ」と指摘している。

#AI #Harness Engineering #Claude Code
zenn スコア: 7/10

AI エージェント導入で「セキュリティどうするの?」と聞かれたときの技術的な答え方

AIエージェント導入で「セキュリティどうするの?」と聞かれたときの技術的な答え方

Claude Code や Cursor などの AI エージェントをチーム導入する際に情シスから聞かれる「何をしてるか見えない」「危険な操作を勝手にされない」「説明できるか」の3つの質問に対する技術的回答を整理した記事。AI Guardian という OSS を使い、全ツール呼び出しの自動ログ記録(Activity Stream)、ルールベースの操作制御(Policy Engine)、48パターンの脅威検知(Threat Scanner)を2コマンドで導入できることを示している。リスクスコア0-100による Allow/Deny/Review の自動判定と、Excel 出力による監査対応も解説している。

#AI #Security #DevOps
zenn スコア: 7/10

React のフラグ地獄を状態遷移テーブルで解消する

Reactのフラグ地獄を状態遷移テーブルで解消する — Discriminated Union×テーブル駆動設計の実践

React で画面状態を boolean フラグで管理するパターンが破綻する理由を構造的に分析し、TypeScript の Discriminated Union と有限状態機械(FSM)をテーブル駆動で組み合わせた解決策を提示している。n個の boolean フラグで2^n通りの組み合わせが生まれるが、実際に有効な状態は数通りしかなく、残りは不正な組み合わせ(impossible states)となる問題を指摘。同一機能をフラグ管理版と FSM 版の2方式で実装したサンプルアプリで、コードの安全性と保守性の違いを実演している。

#React #TypeScript #State Management
zenn スコア: 6/10

iOS 26 から SampleBuffer への安全なアクセスが可能に

iOS26からSampleBufferへ安全なアクセスが可能に

iOS 26 で CoreMedia に大規模なアップデートが入り、CMSampleBuffer に型安全性が導入された。従来は動画・音声・センサーデータなど様々な用途で使われる CMSampleBuffer がデータの型情報を持っておらず、実行時に判別が必要だったが、新 API により型安全にアクセスできるようになった。Swift の型システムを活用した安全な API 設計への移行が進んでいる。

#iOS #Swift #CoreMedia
reddit スコア: 8/10

ECMAScript 仕様が V8 に DevTools の起動状態を漏洩させる

The ECMAScript spec forces V8 to leak whether DevTools is open

V8 エンジンにおいて、Chrome DevTools(または Puppeteer・Playwright)の起動が JavaScript から検出可能であることを詳細に解説した技術記事。DevTools が開かれると CDP Runtime ドメインが有効化され、console API 呼び出し時にオブジェクトのシリアライズが行われる。この挙動が ECMAScript 仕様上のオブザーバブルなアクションとなり、Error の stack getter をトラップすることで検出できる。V8 のパッチで既知のベクターは修正されたが、デバッグ用イテレーターの設計に根差した第二のシグナルがパッチを回避できることも示している。

#JavaScript #V8 #Security #DevTools
reddit スコア: 7/10

AI はプログラミングの楽しさを奪ってしまった

AI has sucked all the fun out of programming

r/webdev で1,345 upvotes・366コメントを集めた開発者の議論。バックエンドエンジニアが「以前はソースコードを追いかけたりアーキテクチャを設計する過程に喜びがあったが、AI ツールの普及でその楽しさが失われた」と問題提起。コメント欄では AI をうまく活用して創造的な部分に集中できるようになったという肯定派と、手を動かして問題を解く過程こそがプログラミングの本質だという否定派で活発な議論が展開されている。

#AI #Developer Experience #Community
reddit スコア: 7/10

圏論が DataFrame について教えてくれること

What Category Theory Teaches Us About DataFrames

pandas の200以上のメソッドの背後にある構造を圏論の視点から分析した記事。Petersohn らの Modin プロジェクトにおける DataFrame 代数(約15個の演算子)をさらに掘り下げ、それらを構成するより原始的な操作の集合を探求している。100万の Jupyter Notebook を分析して pandas の使用パターンをカタログ化した先行研究をベースに、API の暗記ではなく構造の理解を目指すアプローチを提案している。

#Category Theory #DataFrame #Python
reddit スコア: 7/10

GrapheneOS が年齢認証を拒否、規制地域からの撤退も辞さず

Android-Based GrapheneOS Refuses Age Verification, May Exit Regions That Enforce It

プライバシー重視の Android フォーク GrapheneOS が、年齢認証法への不服従を明確に表明した。OS とサービスは世界中で利用可能な状態を維持し、個人情報・身分証明・アカウントを一切要求しないと宣言。デバイスが特定地域で販売できなくなるならそれでよいとの立場を示した。年齢認証法がウェブサイトや SNS だけでなく OS レベルにまで及び始めている状況に対する、カナダの非営利団体による強い反発として注目を集めている。

#Privacy #Android #Security
reddit スコア: 7/10

Microsoft がガラスにデータを1万年保存できるシステムを開発

Revolutionary new system developed by Microsoft can store data on glass for 10,000 years

Microsoft Research がホウケイ酸ガラスの薄板にデータを保存する新システムを実証した。厚さ約2mmのガラス板に258のデータ層を形成し、約2TB のデータをエラーなしで読み出すことに成功。従来のハードドライブや磁気テープが数年で劣化し、常にデータの複製が必要な問題に対し、1万年の耐久性を持つアーカイブ用メディアとしての可能性を示している。書き込み・読み出し・デコードの全プロセスを自動化したシステムも構築された。

#Storage #Microsoft #Research
devto スコア: 7/10

OpenAI が Prompt Injection に懸賞金を設定、防御方法の実践ガイド

OpenAI Just Put a Bounty on Prompt Injection. Here's How to Defend Against It Today.

OpenAI が新しいバグバウンティプログラムで Prompt Injection を重点ターゲットに設定し、再現可能な発見に最大 $7,500 を支払うと発表した。記事では直接入力への注入、取得コンテンツ経由の間接注入、ツール呼び出しの操作という3つの攻撃パターンを解説し、特にエージェント型 AI システムが標的として明示的に挙げられている点を強調している。これは OpenAI が公式に Prompt Injection を「未解決の攻撃クラス」と認めたことを意味する。

#AI #Security #Prompt Injection
devto スコア: 6/10

ローカル LLM で自律型 ReAct エージェントを構築する

Your Local LLM Just Learned to Think: Building an Autonomous ReAct Agent with Ollama + MCP

helix-agent v0.4.0 により、ローカルの Ollama モデルが自律的な ReAct エージェントとして動作可能になった。ファイル読み書き、ディレクトリ走査、正規表現検索、コマンド実行、数式計算、Qdrant 記憶検索の7つのツールを自律的に使い分け、ステップバイステップで推論・実行・観察を繰り返す。PathGuard によるディレクトリのアクセス制御でセキュリティを確保し、API コスト0で Claude Code 経由での利用が可能。

#LLM #Ollama #MCP #Agents
devto スコア: 6/10

SJF4J が Jayway JsonPath より最大7倍高速

SJF4J vs Jayway JsonPath: Up to 7x Faster in Java Benchmarks

Java の JSONPath ライブラリ SJF4J と Jayway JsonPath の JMH ベンチマーク比較結果。definite path クエリで2.38倍、indefinite path で1.97倍、Map/List 上の definite path では6.38倍、indefinite path では4.65倍と、SJF4J が全カテゴリで高速であることが示された。5回のウォームアップ、8回の計測、2フォーク、1スレッドの条件で6つの JSONPath 式を使用したベンチマークの詳細結果も公開されている。

#Java #JSON #Performance
devto スコア: 6/10

30行の Python でローカル RAG パイプラインを構築する

Build a local RAG pipeline in 30 lines of Python (no Docker, no API keys)

Docker もAPI キーも不要で、pip install と30行の Python コードだけで RAG パイプラインを構築するチュートリアル。VelesDB(ベクトル・グラフ・カラムナーストレージを統合したローカルデータベース)と sentence-transformers の all-MiniLM-L6-v2 モデルを使い、テキストの埋め込み、ベクトル保存、類似度検索を完全にローカルで実行する。従来の RAG チュートリアルで必要だったインフラ設定を大幅に簡略化している。

#RAG #Python #LLM