井本 賢
WebRTC×音声AIエンジニア
LLMO · WebRTC · リアルタイムAI · コンテキストエンジニアリング
LLM・自動化・分散エージェントでAIネイティブな組織を構築しています。
67K+
Qiita PV
14
冊
3
論文(Zenodo)
Now
- LLMOフレームワーク & LLMOチェックアプリの開発
- ハーネスエンジニアリングをプロダクトに適用 — 開発・運用・マーケティングまでAIエージェントで実践
- 実践での知見を本や記事として公開
2026年4月更新
出版物
🔧 AI開発シリーズ
🔍 LLMO / AI検索最適化シリーズ
🛡️ セキュリティ / 品質シリーズ
📊 ナレッジ & データシリーズ
💡 エンジニアリング文化シリーズ
最新記事
- 📝 ハーネスエンジニアリング、全員が違うことを言っている — 5社の解釈を並べてみた Zenn 12,000PV
- 📝 音声AIの体験が崩壊する3つの崖 Zenn
- 📝 ChatGPT/Perplexityに自社サービスが出てこない理由 Qiita
- 📝 Claude Code Reviewのセキュリティリスクと対策 Qiita
- 📝 HTTPS接続、今すぐやめてください Qiita 35,000PV
論文
📊 Excess Vocabulary: 日本語AI生成テキストの過剰語彙クロスモデル定量分析
7モデル×350サンプル vs 人間977記事で651の統計的に有意なexcess wordsを特定。Claude世代間で語彙偏りが増加(TTR: 0.52→0.29)。ドメイン内分類器AUC=0.946、ドメイン間では完全に崩壊。日本語excess vocabulary研究として世界初、共進化の証拠も確認。
📝 AI Text Slop: 日本語技術記事における6つのLLMの文体収束の定量分析
6モデル×10トピック×3試行=180サンプルで16指標を測定。RLHF商用モデルがOSSより有意に高スコア(Cohen's d=1.01)。語彙と構造の乖離(Swallowパラドックス)、人間のQiita記事がAIより高い構造スコアを示す文化的交絡を発見。
🔵 AI Blue: Vision-Language Modelの色認識バイアス
VLM 4モデル×40色×480観測で色認識精度をCIEDE2000で定量評価。商用モデルは中間色で精度低下、AI生成UIの95.4%が青紫に集中。AI Slopの原因メカニズムを初めて定量的に実証。
研究
🔬 LLMO Framework
AI検索エンジンにおけるコンテンツ最適化
🔬 Voice AI 300ms
音声AIの300msレイテンシの壁への挑戦
🔬 コンテキストエンジニアリング
CLAUDE.md、マルチエージェント設計
🔬 Generative Agent Simulation
LLMマルチエージェントで社会をシミュレート
🔬 香り × AI
AI×パーソナリティで調香を科学する
Side Projects
🥃 legacydram — ウィスキー × エンジニアの視点
瓶の中身を「他人のレガシーコード」として読み解くキュレーションメディア。 People · Craft · Tasting。