ブログ
AI開発、LLMO、コンテキストエンジニアリング、ハーネスエンジニアリングの技術記事。
2026 56件
- 賢いモデルが来るほど、ハーネスは「捨てる」設計になる — Anthropicがマルチからシングルに戻した理由
- マルチエージェントは並列化で速くなる、は幻想だった — 調整コストはエージェント数の二乗で増える
- Figma MakeとClaude Codeで、デザイナー不在のUIを作る — コードからデザインを逆生成する時代
- 記事にArticle schemaを入れてもAIは私を著者と認識しなかった。著者エンティティを実装して引用の帰属が変わった話
- GPTBotに私のJSレンダリングページを見せたら、中身は空の`<div>`だった
- LLMO対応はテストしないと静かに壊れる:AIクローラーの可読性をPlaywrightでCI検証する
- 賢いモデルほど、上手に嘘をつく
- 「いい感じに作って」はなぜ5回目で崩壊するのか -- コードの前に書く6つの定義書と3つの記憶ファイル
- AIエージェントが「空気を読めない」本当の理由:常識ナレッジグラフという欠けたレイヤー
- 接続したMCPサーバーの38%は認証なしだった — 60日で30件のCVEが出たMCPセキュリティの現実
- 43秒の異常が24時間の障害になった: メトリクスの急変と漸増を見分ける時系列デバッグ
- AIエージェントの予測を1つの数字で信じるな — Simulatorは点推定でなく確率分布を返すべき
- サブエージェントにメインの記憶を渡すのは事故だった:7ファイルのうち4つは遮断すべき
- バリデータがバグっていた — 「安全です」と報告するシステム自身が壊れているとき
- 「とりあえず全部許可」でClaude Codeを動かすと、.envの秘密がそのままAnthropicに渡る話
- 店舗LLMOの答えはllms.txtでなくGBPだった — 私が綺麗に書いたファイルを、AIは一度も引用しなかった
- Claude Codeに渡すコンテキストを足すのをやめた — ツール出力を間引いたら長時間タスクの精度が戻った
- 「稼働率99.5%」と「5,000件の決済失敗」は同じ事実 — 障害報告のフレーミングが緊急度を反転させる
- 午後3時、あなたのコードレビュー承認率はほぼ0%になる:決断疲労の科学とAIエージェント時代の処方箋
- ページ単位のSEOはAIに見えていない: 引用されるのは「パッセージ」だった
- Claude Codeを/clearせず9時間動かした日、コンテキストはどこで腐り始めたのか
- Claude Code Skills は発火しなくてもトークンを食う — 5 Skills × 7時間セッションで「使われなかった」3つが18%食べていた
- AIエージェントを7本cronで毎日回したら、2本が18日間沈黙していた — observabilityでは拾えず、exit-code契約で拾えた話
- Claude Codeを3セッション並列で8時間動かしたら、2回コンテキストを上書きしあった
- 5つのAI検索に『kenimoto.devを引用して』と頼んだ。記事31本のうち出てきたのは3本だった
- JSON-LDを11スキーマ入れた。3ヶ月測ったら、AIが拾っていたのは3つだけだった
- コードレビューを6段階にしたら、AIと人間の分業が見えた
- robots.txtにAIクローラー13個の個別ルールを書いた。30日後、守ったのは3つだけだった
- AI Overviewsに載るための4条件を30日試した。効いたのは1つだけだった
- 他のエージェントを監査する4層目を足したら、Strategistが3週間サボっていたことが発覚した話
- ブログを4言語化したら、ポルトガル語版だけ流入が約4倍になった - 22日分の生データ
- Claude Code Skills を10個書いたら、4個に統合された — Reusable Pattern が回り始める瞬間と回らない瞬間
- Claudeに先週47回『おっしゃる通りです』と言われた。そのうち11回は私が、36回はClaudeが間違っていた。
- 同じサイトを7つのAI引用トラッカーに入れたら、7つとも違う数字を返してきた
- 30日間サーバーログを見続けて分かった、私のサイトを最も叩いた5つのAIクローラー - そこから読めるLLMOシグナル
- ClaudeをカオスエンジニアリングのMCPサーバーに繋いだら、ステージングを4回殺した — 6ヶ月見逃していた本番バグを見つけた話
- Claudeが3回連続でバグを「隠す修正」を出してきた話 — デバッグ10の技法をプロンプトに翻訳する
- Strategist に WebSearch を持たせたら 5テーマ選びに 20分かかった - Observer / Strategist / Marketer 3役分離で 3分にした話
- 音声AIスタックを5つ実測した。300msの壁を越えられたのは2つだけだった
- 3人のサブエージェントに同じPRを見せたら、4割の指摘で意見が割れた話
- 他社の llms.txt を30個監査したら、すでに5つのアンチパターンが形になっていた
- SEOが壊れる日 — 私のAIエージェントは、もうGoogleを見ていなかった
- CLAUDE.md は結局 Context Engineering を1ファイルに凝縮したものだった
- 同じ質問なのに、LLMから5つの違う回答が返ってきた — Context Engineering 入門
- JSON-LDで LLM にサイトを「説明」する: 11スキーマ統合実装ガイド
- ChatGPTからのアクセスは、GA4にどう映るのか - LLMOを数値で把握する3つの方法
- 15分で終わるLLMO最小実装: llms.txt + JSON-LDで「AIに見つけられる土台」を作る
- 新規ドメインの最初の1週間、GA4は嘘をつく: kaoriq.com立ち上げ4日間の生データ
- ChatGPTからの流入を90日で8,337%増やした実装: TRMが採用した4つのLLMO戦略柱
- AIエージェントは月いくらかかるのか -- API・サブスク・ローカルの損益分岐点
- Claude Code Hooks v2 — 「お願い」を「プログラム」に変える25のイベント
- Claude CodeのSub-agent設計 — 1セッションで専門家チームを使い分ける
- AIパイプラインが壊れる9つの理由 -- 全部AIの外側だった
- LLMに「引用したい」と思わせるコンテンツ設計 — Microsoftが明かした3原則
- MCPサーバーに接続しただけでトークンが消える — 4サービスで実測した
- Claude Codeで自律型コンテンツパイプラインを構築した話