株式会社ずんだもん技術室AI放送局 cover art

株式会社ずんだもん技術室AI放送局

株式会社ずんだもん技術室AI放送局

By: 株式会社ずんだもん技術室AI放送局
Listen for free

About this listen

AIやテクノロジーのトレンドを届けるPodcast。平日毎朝6時配信。朝の通勤時間や支度中に情報キャッチアップとして聞いてほしいのだ。(MC 月:春日部つむぎ、火水木:ずんだもん、金:お嬢様ずんだもん)
Episodes
  • マジカルラブリー☆つむぎのピュアピュアA.I.放送局 podcast 20250616
    Jun 15 2025
    関連リンク Anthropic「How we built our multi-agent research system」の要点まとめ Anthropicが、AIの「マルチエージェントシステム」をどう作ったか、その開発の裏側と重要な知見を公開しました。これは、AIアシスタント「Claude」の調査機能(Research機能)を開発する中で得られた貴重な学びです。 AnthropicのResearch機能は、「オーケストレーター・ワーカーパターン」という仕組みを使っています。これは、一人の「リーダーエージェント」がユーザーの質問を受け、それをいくつかの小さなタスクに分解します。分解されたタスクは、複数の「サブエージェント」(リサーチャーエージェント)に指示され、それぞれが並行して調査を行います。最後に、リーダーエージェントが各サブエージェントの結果を統合し、最終的な回答を作成するという流れです。まるで、プロジェクトリーダーが専門チームに仕事を割り振り、最後にまとめて報告書を作るようなイメージです。 このマルチエージェントシステムは、得意なことと苦手なことがあります。得意なのは、たくさんの調査を同時に進める「並列処理」や、大量の情報を扱うタスク、複数のツールを使う作業です。実際に、シングルエージェント(一人のAI)よりも高い調査性能を発揮しました。一方、苦手なのは、プログラミングのように並列化しにくい作業や、全員で同じ情報を共有しながら進める必要がある作業です。このシステムの性能を大きく左右するのは、AIがどれだけ「思考」(=トークン)を使うか、つまりどれだけ深く考える時間を与えられるかです。しかし、大量のトークンを使うため、コストが高くなる点が大きな課題です。最新のモデルに切り替えることで、効率を上げつつコストを最適化できると報告されています。 開発では、AIへの指示文である「プロンプトエンジニアリング」が非常に重要でした。Anthropicは、以下の8つのコツを見つけました。 AIの思考をシミュレーションする: AIが指示をどう解釈し、行動するか想像する。リーダーエージェントに仕事の振り方を教える: サブエージェントへ目的、形式、ツール、担当範囲を具体的に指示させる。タスクの規模に応じた人員配置: 簡単な質問には少ないAI、複雑な調査には多くのAIを割り当てる。ツールの設計と選択: 適切なツールを選ばせ、その使い方を明確に説明する。エージェントに自己改善させる: AI自身に失敗の原因を診断させ、プロンプトを改善させる。広く始めてから絞り込む: まず全体像を掴み、徐々に詳細を調べるように指示する。AIに思考する時間を与える: 作業前に戦略を練ったり、結果が出るたびに立ち止まって考えさせたりする。並列処理で高速化: 複数のサブエージェントやツールを同時に動かすことで、調査時間を大幅に短縮する。 これらの戦略は、厳格なルールではなく、経験からくる良い「やり方」をAIに教え込み、同時に「これはしてはいけない」というガードレールを設定することで実現しました。 AIシステムの効果的な評価方法についても紹介されています。 小規模でもすぐに始める: 最初から完璧な評価システムを目指すのではなく、少数のテストケースでも効果は大きい。LLM-as-judgeを活用する: 生成された回答の正確性や網羅性などを、別のLLM(大規模言語モデル)に評価させる。人間による評価も不可欠: 自動評価では見落としがちな、AIの不自然な挙動や誤りを人間が見つけ、改善につなげる。 マルチエージェントシステムは複雑ですが、適切に設計・運用することで、人間だけでは難しい大規模な調査や分析を可能にする強力なツールとなることが示されています。 引用元: https://zenn.dev/ml_bear/articles/a5dc93b9d03edd Claude CodeとGitHub Issueを使った全自動開発について この記事は、最新のAI技術であるClaude Codeと、ソフトウェア開発で広く使われるGitHub Issueを連携させ、開発プロセスを「全自動化」するコンセプトと、それを実現するためのスクリプトについて紹介しています。これは、AIが自律的にソフトウェア開発のタスクをこなし、まるで一人のエンジニアのようにプロジェクトを進める未来の働き方を垣間見せてくれるものです...
    Show More Show Less
    Less than 1 minute
  • 私立ずんだもん女学園放送部 podcast 20250613
    Jun 12 2025
    関連リンク Claude Code 版 Orchestaror で複雑なタスクをステップ実行する この記事では、AIが複雑なタスクを段階的かつ効率的に実行するための仕組み「Orchestrator(オーケストレーター)」を、Anthropic社のAI「Claude Code」で実現した事例を紹介しています。 従来のRoo Orchestratorの考え方を基に、AIがタスクをサブタスクに分割し、段階的に実行することで、処理コストを大幅に削減(例: 6ドルが1ドル未満に)し、速度向上も期待できます。 このOrchestratorは、Claude Codeの.claude/commandsという機能を利用して作られています。これは、特定のMarkdownファイルを配置するとAIがカスタムコマンド(例: /project:orchestrator)として実行できる仕組みです。AI自身がサブタスクを処理する「Taskツール」と組み合わせることで、複雑な処理を効率的に進めます。 Orchestratorの主なプロセスは以下の5つのステップで構成されます。 Initial Analysis(初期分析): まずタスク全体の範囲と要件を理解し、依存関係や実行順序を計画します。Step Planning(ステップ計画): タスクを2〜4つの段階的なステップに分解し、各ステップ内で複数のサブタスクを並行実行できるように計画します。Step-by-Step Execution(段階的実行): 各ステップ内のサブタスクを並列に実行し、完了を待ちます。前のステップで得られた必要な結果だけを次のステップに渡し、AIが一度に処理する情報量(コンテキスト)を最小限に抑えます。Step Review and Adaptation(ステップレビューと調整): 各ステップ完了後に結果を確認し、残りのステップが適切か検証します。新たな発見があれば、計画を柔軟に調整し、サブタスクを追加・変更します。Progressive Aggregation(段階的な統合): 完了したステップから得られた結果を統合し、それを次のステップの前提知識として活用することで、段階的に全体を理解を深めていきます。 これにより、「段階的な進行」「並列処理による効率化」「AIの『記憶』の最適化」「段階的な理解」「明確な依存関係」といった利点が生まれます。 例えば、TypeScriptプロジェクトの「分析、テスト、リンティング(コード品質チェック)、コミット」といった一連の作業をAIが自動で実行できます。テストやリンティングでエラーが見つかればAIが修正を試み、不要な修正ステップをスキップするなど、状況に応じて計画を柔軟に調整できます。 AIエージェントを効果的に活用するには、「最初にタスク全体を調査・計画」「サブタスクを並列実行」「各ステップ後に計画を見直し」が重要です。これにより、AIは複雑な開発タスクをより賢く、効率的にこなせるようになります。 引用元: https://zenn.dev/mizchi/articles/claude-code-orchestrator Benchmarking Multi-Agent Architectures この記事では、複数のAIエージェントが連携して動作する「マルチエージェントシステム」の設計パターンと性能について、LangChainの公式ブログが実施したベンチマーク結果を解説しています。 なぜマルチエージェントが必要か? これまでの単一AIエージェントは、扱うツールや情報(コンテキスト)が増えると性能が低下するという課題がありました。これは、人間が一度に処理できる情報量に限界があるのと似ています。そこで、役割ごとにエージェントを分割し、互いに連携させる「マルチエージェントシステム」が注目されています。これにより、システムがモジュール化され、開発・評価・保守がしやすくなる上、異なるチームが開発したエージェントを組み合わせることも可能になります。 3つの代表的なアーキテクチャ LangChainでは、代表的なマルチエージェントの連携方法として以下の3つを比較検証しました。 Single Agent: 全てのツールと情報にアクセスできる従来の単一エージェントです。性能の基準となります。Swarm: 各エージェントがお互いの存在を認識し、必要に応じてタスクを他のエージェントに「ハンドオフ」(引き渡し)します。一度にアクティブになるのは1つのエージェントのみで、ユーザーへの応答は直接エージェントが行います。Supervisor: 「スーパーバイザー」と呼ばれる中心のエージェントが、ユーザーからの入力を受け取り、適切な...
    Show More Show Less
    Less than 1 minute
  • 株式会社ずんだもん技術室AI放送局 podcast 20250612
    Jun 11 2025
    関連リンク AI領域における組織の強みを活かすアーキテクチャ設計 AI Shift社が開発する企業向けAIエージェント構築プラットフォーム「AI Worker」について、開発チームとAIチームが協力し、組織の強みを最大限に活かすアーキテクチャ設計をどのように模索したかを紹介します。 AIエージェント開発における課題と変化 かつてはAIチームの研究力がプロダクトの強みでしたが、2024年からのLLM(大規模言語モデル)の急速な進化により、AIチームの研究と市場の変化にずれが生じました。開発チームはLLMのAPI組み込みに注力するようになり、AIチームとの連携が一時的に薄れる課題がありました。しかし2025年、AIエージェントが注目され、LLMだけでなく、多様なツール連携や記憶管理など、より複雑な要素が必要になったことで、開発チームもAIの専門領域に、AIチームも開発ノウハウに踏み込む必要が出てきました。 組織の強みを活かすアーキテクチャ設計のポイント 責務の再定義とチーム統合: AIエージェント開発では、AIチームの役割がアプリケーション層まで広がるため、サービス単位で責務を分けるのではなく、開発チームとAIチームを統合し、同じ実行エンジンサービス内でそれぞれの専門性を活かすようにしました。これにより、DB選定やHTTPサーバ構築など、AIチームが開発領域にも関われるようになります。 開発言語の統一(TypeScript): 元々異なる言語(AIチーム:Python、開発チーム:TypeScript)を使っていたところを、AIエージェントの実行エンジンもTypeScriptに統一しました。これは、他サービスのアーキテクチャを参考にできる、チーム間の知識共有がしやすくなる、開発速度が向上するといったメリットがあるためです。 AIエージェントフレームワーク「Mastra」の採用と向き合い方: TypeScript製のAIエージェントフレームワーク「Mastra」を採用することで、開発の初期スピードを上げられました。Mastraは、エージェントやワークフロー、RAG(検索拡張生成)などの主要機能に加え、デバッグや運用機能も充実しています。 一方で、AIエージェントの分野は変化が激しいため、特定のフレームワークに過度に依存せず、将来的に別のフレームワークに乗り換えられるように、重要な機能(例:データ永続化のための短期記憶)はMastraの機能を使わず、独自でPostgreSQLを導入するなど、疎結合な設計を意識しています。これは、柔軟な設計と将来への備えのためです。 疎結合な設計とFeature Flagの活用: 異なるチームが同じコードを触るため、コードベースでの「依存性の逆転」と「疎結合な責務分離」を徹底しました。これは、Mastraのワークフローを「ユースケース層」、記憶管理を「インフラ層」と捉え、それぞれが独立するように設計することで、テストのしやすさや、変更時の影響範囲を小さく保つための工夫です。 また、LLMの不確実性に対応するため、実装と検証を高速で回せる「Feature Flag」の仕組みを導入しました。これにより、新しい機能を本番環境に影響なく検証し、迅速に改善サイクルを回すことが可能になりました。例えば、AIエージェントの振る舞いを刷新するプロジェクトを、Feature Flagを活用することで約1ヶ月で本番リリースまで漕ぎつけ、長期的なR&Dの高速化に貢献しました。 まとめ AIエージェント開発では、開発チームとAIチームがお互いの領域に踏み込み、協力し合うことが重要です。そのためには、疎結合で柔軟なアーキテクチャ設計と、Feature Flagを活用した高速な検証サイクル基盤の構築が不可欠であり、これらが市場の変化に対応し、プロダクトを成長させる鍵となります。 引用元: https://zenn.dev/aishift/articles/c897d0e095c3d8 Agent Development Kit によるエージェント開発入門 タイトル: Agent Development Kit によるエージェント開発入門 要約: この資料は、大規模言語モデル(LLM)を基盤とした「AIエージェント」を開発するための入門ガイドです。新人エンジニアの皆さんが、AIエージェントの基本的な仕組みや開発の流れを理解するのに役立つ内容となっています。 まず、LLMが単なる質問応答にとどまらず、より複雑なタスクをこなす「エージェント」として機能...
    Show More Show Less
    Less than 1 minute
No reviews yet