井本 賢
AIシステムエンジニア
LLMO · WebRTC · リアルタイムAI · コンテキストエンジニアリング
LLM・自動化・分散エージェントでAIネイティブな組織を構築しています。
210K+
Qiita PV
15
冊
3
論文(Zenodo)
Now
- LLMOフレームワーク・LLMOチェッカー・Open LLMO Research Initiative の開発
- AI-Native MEO を LLMO の実店舗向け実装としてまとめる
- ハーネスエンジニアリングをプロダクトに適用 — 開発・運用・マーケティングまでAIエージェントで実践
- 実践での知見を本や記事として公開
2026年7月更新
出版物
🔧 AI開発シリーズ
🧪 ローカルLLM 実測シリーズ
🔍 LLMO / AI検索最適化シリーズ
🛡️ セキュリティ / 品質シリーズ
📊 ナレッジ & データシリーズ
💡 エンジニアリング文化シリーズ
最新記事
- 📝 コードレビューを6段階にしたら、AIと人間の分業が見えた Zenn
- 📝 ハーネスエンジニアリング、全員が違うことを言っている — 5社の解釈を並べてみた Zenn 12,000PV
- 📝 音声AIの体験が崩壊する3つの崖 Zenn
- 📝 Claude Code Reviewのセキュリティリスクと対策 Qiita
- 📝 HTTPS接続、今すぐやめてください Qiita 45,000+ PV
論文
⚡ Free-Executor Paradox: 反復LLMコード修復ループで「タダのエグゼキュータ」が一番高くつく
4構成のLLM (Opus solo / Haiku solo / Opus+Qwen / Opus+Haiku) を3つのPythonコード修復タスクで決定的判定器 (mypy + ruff + pytest) のもとで比較。「強いオーケストレータ + 安い (or ローカル無料) エグゼキュータ」という定石構造が全タスクで最も高くつく現象を発見 — オーケストレータがエグゼキュータの返したサマリを prompt cache 経由で読み直すコストが、実行委譲の節約を食い潰す。最大タスクではHaiku soloがドル建てで5.5倍安い (失敗率25%引き換え)。
📊 Excess Vocabulary: 日本語AI生成テキストの過剰語彙クロスモデル定量分析
7モデル×350サンプル vs 人間977記事で651の統計的に有意なexcess wordsを特定。Claude世代間で語彙偏りが増加(TTR: 0.52→0.29)。ドメイン内分類器AUC=0.946、ドメイン間では完全に崩壊。日本語excess vocabulary研究として世界初、共進化の証拠も確認。
📝 AI Text Slop: 日本語技術記事における6つのLLMの文体収束の定量分析
6モデル×10トピック×3試行=180サンプルで16指標を測定。RLHF商用モデルがOSSより有意に高スコア(Cohen's d=1.01)。語彙と構造の乖離(Swallowパラドックス)、人間のQiita記事がAIより高い構造スコアを示す文化的交絡を発見。
🔵 AI Blue: Vision-Language Modelの色認識バイアス
VLM 4モデル×40色×480観測で色認識精度をCIEDE2000で定量評価。商用モデルは中間色で精度低下、AI生成UIの95.4%が青紫に集中。AI Slopの原因メカニズムを初めて定量的に実証。
研究
🔬 LLMO Framework
AI検索エンジンにおけるコンテンツ最適化
🔬 Voice AI 300ms
音声AIの300msレイテンシの壁への挑戦
🔬 コンテキストエンジニアリング
CLAUDE.md、マルチエージェント設計
🔬 Generative Agent Simulation
LLMマルチエージェントで社会をシミュレート
🔬 香り × AI
AI×パーソナリティで調香を科学する
Side Projects
Open Source
🔍 LLMO / AI SEARCH
open-llmo — GitHub organization · MIT
Open LLMO Research Initiative。「ある URL が AI からどれだけ引きやすいか」を測るための仕様・バリデータ・ツール群を、従来の SEO シグナルを超えた切り口で整備する。
llmo-checker — TypeScript CLI · MIT
URL の「AI からの引きやすさ」を Lighthouse 風に採点する CLI。 llms.txt / JSON-LD / robots policy / 意味構造を静的にチェックし、0〜100 の LLMO Score を JSON で返す。v0.1 draft。
🎙️ VOICE & SPEECH
voice-clone — Python · MIT
Qwen3-TTS を使った音声クローンツール。3 秒程度のサンプル音声から、任意のテキストを指定した声で合成。WSLg 録音対応・多言語。
speech-habit-lens — Python CLI · MIT
AmiVoice ESAS (感情 20 パラメータ) × LLM の三層解析で 1 分スピーチの癖を可視化。音響層 / テキスト層 / 身体と言語をつなぐクロス層を Markdown レポートに。