メタ認知AI:エージェントに自己評価を教える
多くのエージェント指示は行動のみを定義する。欠けているのは自己評価を教える層。本番運用9ヶ月・95フックから得たメタ認知フレームワーク。
AI & Technologyデザイン、開発、AIインフラ、製品構築についての考え。
多くのエージェント指示は行動のみを定義する。欠けているのは自己評価を教える層。本番運用9ヶ月・95フックから得たメタ認知フレームワーク。
AI & Technology650ファイル、7層階層にわたるAIエージェントのためのコンテキストエンジニアリング。3つの本番障害、実際のトークン予算、そしてそれらを乗り越えたシステムの記録。
AI & Technologyマルチエージェント熟議は、シングルエージェントシステムが見逃す失敗を検出します。そのアーキテクチャ、行き止まり、そして本当に構築する価値のあるものについて解説します。
AI & Technology私のClaude Codeエージェントは、人間のずさんな習慣をすべてマシンスピードで受け継ぎました。3つの哲学、150以上の品質ゲート、95のフックを構築して修正を試みました。何がうまくいき、何がうまくいかなかったかをお伝えします。
AI & Technology3,500行のエージェントシステムを86のフックとコンセンサス検証で構築しました。RAG、ファインチューニング、エージェントオーケストレーションについて学んだことを共有します。
AI & Technology多くのコードベースは成長とともに遅くなる。95のフック、44のスキル、14の設定が、新機能のコストを下げ続ける理由を解説。
AI & TechnologyMcKinseyの調査によると、90%の企業がAI導入を主張していますが、パイロットを超えてスケールしているのはわずか23%です。私はこれまでのキャリアで3つのAIシアターのパターンを目撃し、自分自身もその1つを実践していました。
AI & Technologyサイトを6言語に翻訳した結果、韓国語は同一コンテンツで英語の2.8倍のトークンを消費することが判明しました。以下のインタラクティブビジュアライザーで、その理由をご確認いただけます。
AI & Technologyストップフック、スポーンバジェット、ファイルシステムメモリを備えた自律エージェントシステムを構築しました。失敗から学んだことと、実際にコードをシップする仕組みを紹介します。
AI & Technology5つのプロンプトの失敗から、構造化された観察が巧みな言い回しに勝ることを学びました。BoydのOODAループは、私が日常的に使用しているプロンプトエンジニアリングのワークフローに直接対応しています。
AI & Technology私は毎日Claude Codeを使い、86のフック、完全な品質ゲートシステムを運用しています。どこでvibe codingをし、どこでエンジニアリングをするのか、そしてなぜその境界が重要なのかをお話しします。
AI & Technology個人ポートフォリオサイトのモバイルLighthouseパフォーマンススコアを76(CLS 0.493)から全カテゴリ100/100/100/100のパーフェクトスコアに改善した方法を解説します。
AI & Technology技術記事: Introl
大規模言語モデルをローカルで実行するための包括的なハードウェア推奨事項とコスト分析。
さまざまなAIワークロード向けにNVIDIA最新データセンターアクセラレータを比較するGPU選択ガイド。
GoogleのTensor Processing UnitのTPUv1からTPUv5までの進化に関する詳細な技術解説。
コンテナ化環境におけるGPUクラスターのリソース共有戦略。
Rayフレームワークを使用した分散AI計算の構築と管理のガイド。
オープンソースLLMの経済性とDeepSeekの競争上のポジショニング分析。
将来のデータセンター電力要件とNVIDIAの次世代GPUロードマップ。
次世代AIインフラストラクチャに電力を供給する小型モジュラー炉ソリューション。
DeepSeekのMulti-Head Compressionアーキテクチャ革新の技術分析。