ABEJA Tech Blog

中の人の興味のある情報を発信していきます

最新 AI Tech 情報キャッチアップ用 AI Agent を作成し自身の研究開発業務を一部自動化してみた

こんにちは!ABEJA で ABEJA Platform 開発や AI 関連の研究開発業務を行っている坂井(@Yagami360)です。 こちらはABEJAアドベントカレンダー2025の23日目の記事です。

ここ5〜6年くらいのAI 技術の進歩は目覚ましですよね。数年前に ChatGPT 登場して以降、更に進歩が大きく加速してきています。 AI 技術の飛躍的な進歩は嬉しい反面、進歩が早すぎて最新の AI 技術動向を全然キャッチアップしきれていないというのが最近の自分の悩みになってました。

そんな研究開発業務における悩みも AI Agent 使えば簡単に解決できるのではないかと思い、研究開発用の AI Agent を作成してみました。

最新 AI Tech 情報キャッチアップ用 AI Agent

今回の研究開発用 AI Agent は、最新の AI Tech 関連の情報を収集して GitHub Issue 上のレポートとして自動作成する AI Agent になっています。

GitHub レポジトリは、以下においています。詳しい使い方等は、レポジトリの README を見ても貰えればと思います

github.com

作成可能なレポートの種類

今回の研究開発用 AI Agent で作成可能なレポートとしては、以下のような種類になっています。

  • 週次レポート

    GitHub Action により毎週金曜日に自動的に作成されるレポートで、今週1週間の AI 技術動向に関するレポートになっています

    github.com

  • 月次レポート

    GitHub Action により毎月1日に自動的に作成されるレポートで、先月1ヶ月間の AI 技術動向に関するレポートになっています

    github.com

  • 特定トピックのレポート

    GitHub Action の workflow_dispatch での手動実行で自動的に作成可能なレポートで、特定の AI 関連トピック(RAG, A2A など)に関するレポートになっています

    github.com

仕組みなど

基本的には、プロンプトで指示しただけの技術的に簡単な AI Agent になっています。(プロンプト指定だけでそれなりのレポート品質になったので、RAG とか使わなかったというのが背景です)

もし中身の詳細知りたい方いれば、コード見てもらえれば思いますが、以下ポイントを列挙しておきます。

  • 使用する LLM モデル

    Claude か Gemini の各種モデルが利用できます。 デフォルトでは、API 利用コストの安さ観点から Gemini の gemini-2.5-flash にしています。 別のモデルを使用したい場合は、環境変数の値か GitHub Actions 用の Variables の値で切り替えれるようにしています

  • キーワード指定

    最近の AI トレンドや将来性の高い AI 技術関連のキーワードリストをプロンプトで指定し、関連した情報を取得できるようにしています。 ここらへんのキーワード選定は、自身の AI 知識が必要であり、時代の変化に応じた継続的なプロンプト調整が必要になるかと思います

  • Web 検索機能

    Claude モデルや Gemini モデルの Web 検索機能を使用して、プロンプトで指定した有益なサイトのURLリストから情報を取得できるようにしています。 どのようなサイトが有益かは、自身の AI 知識が必要であり、時代の変化に応じた継続的なプロンプト調整が必要になるかと思います。

    なおサイトURLによっては、うまくページング処理等をしないとすべての情報を取得できないのですが、現時点ではここらへんの処理は実装していないので、一部情報がとれてない箇所もあります。 また、ちゃんとした AI Agent を開発する場合は、取得した各種情報をデータベースに保存して、毎回情報取得しなくて済むようにするかと思いますが、今回はさくっと作りたかったので毎回これら情報を取得するようにしています(それ故、API 利用コストが大きくなります)

  • MCP サーバー機能

    GitHub MCP サーバーや Hugging Face MCP サーバーを使用して、AI 関連で人気の GitHub レポジトリや Hugging Face 上のモデル・データセットなどの情報を取得できるようにしています。
    ただし現状では Claude モデルのみでのサポートで、Gemini モデルではサポートしていません。今後 Gemini モデルでも MCP サーバーを利用できるようにする予定です。

    また今後必要に応じて、ArXiv MCP サーバーを使用した論文情報の取得や Slack MCP サーバーを使用した Slack 通知機能、Twitter MCP サーバーを使用した Twitter 投稿機能なども追加しようとは思ってます

  • GitHub Issue レポート内での質疑応答機能

    作成されたレポートに関して、詳細を深堀りしたいケースが多々ありますが、GitHub Issue 内に閉じた形で確認できればツールを色々横断しなくて済むので便利です。
    そのため作成された GitHub Issue レポート内にて、@claude メンション or @gemini-cli メンションして Claude モデルや Gemini モデルに質問することで、レポート内容の詳細を更に深堀りすることもできるようにしています。

    仕組み的には、Claude Code Action や Gemini CLI Action を使用して実現しています。Claude Code Action や Gemini CLI Action の本来の用途は、バグ報告 GitHub Issue からの PR 自動作成や PR 自動レビューなどになりますが、今回の AI Agent では、これら機能をうまく利用して、レポート内容の質疑応答をできるようにしています。

  • GitHub Actions による定期的なレポート自動作成

    GitHub Action の schedule 機能で、定期的にレポートを自動作成できるようにしています。 これにより、最新 AI Tech のキャッチアップに必要なことは、毎週1回 or 毎月1回 GitHub Issue を開き自動的に作成されたレポートを確認するだけで良いです

    定期実行可能なサービスには他にも色々あるかと思いますが、GitHub Action を使用することで GitHub レポジトリ内で完結し、なおかつコストの発生しない方法でレポート作成できるようにしています(API 利用コストは別途発生します)

  • uv による Python パッケージ管理

    Python パッケージ管理ツールとしては、uv を使用しています。
    pip や conda は、AIプロダクションレベルでは NG として、これまで poetry が広く使われてきたかと思いますが、
    uv は内部的には Rust 言語で書かれており、非常に高速に Python パッケージのインストール処理を行えます。開発者体験も大きく向上するので非常にオススメです。(poetry → uv への以降も比較的簡単に行えるようになっています)

  • AI Agent 開発用フレームワーク

    AI Agent 用のフレームワークとしては、LangChain / LangGraph, Microsoft Agent Framework (AutoGen, Semantic Kernel), Google ADR, OpenAI Swarm, CrewAI など、ノーコード系だと Dify, OpenAI AgentKit / Agent Builder, Vertex AI Agent Builder などなど様々なツールが乱立しており、それぞれメリット・デメリットがありますが(AI Agent 時代における各社シェア争いでフレームワーク乱立しすぎて開発者的には困るのですが)、 今回の AI Agent の機能的にこれらのフレームワークの必要性がなかったため特に使用していません。単純に Claude モデルであれば claude_code_sdk、Gemini モデルであれば genai を使用しています。

    今後マルチ AI Agent 化したいなどあれば、適切なフレームワークを使用するようにしようと思います。(あるフレームワークに寄せるとコード全体がそのフレームワーク依存になり、後で別のフレームワークに移行するコスト高そうだったので、あえてフレームワーク使用しなったというのもあります。)

  • Vibe coding で開発

    少し別の話になりますが、この AI Agent は、LLM モデルによる Vibe coding で実装しており、実装の殆どを AI で行っています。
    また PR 作成に関しても、Cursor or Claude Code CLI + GitHub MCP サーバーによる PR 自動作成で行っており、PR レビューに関しても、Claude Code Actions or Gemini CLI Action or GitHub MCP サーバーを使用した自動レビューで行っています。これからは如何に Vibe Coding で自動化して効率化させるかの時代ですね。

Claude Research / Gemini Deep Research で作成したレポートとの精度比較

そもそも今回のような AI Agent をわざわざ作らなくても、Claude Research や Gemini Deep Research 使ってレポート作成すればいいのでは?という観方もあると思うので、簡単な精度比較もやっておきました。

以下その結果です。

公正な比較のために、モデルは同じモデルを使用し、プロンプトに関しては、研究開発用 AI Agent は週次レポート用のプロンプト、Claude Research と Gemini Deep Research に関しては「2025-10-03 ~ 2025-10-09 の最新 AI Tech 情報を教えて」という週次レポート期間の単純なプロンプトにしています。

  • 研究開発用 AI Agent での週次レポート by gemini-2.5-flash

    github.com

  • Claude Research by claude-sonnet-4 でのレポート

    claude.ai

  • Gemini Deep Research by gemini-2.5-flash でのレポート

    g.co

主観にはなりますが、自作した研究開発用 AI Agent の優位点は以下にあるのかと思います

  • 簡潔な情報になっており、キャップアップしやすい
  • 最新ニュースも列挙してくれる
  • 開発者が知りたい情報(フレームワークなど)も知れる
  • 高速に回答
    • 研究開発用 AI Agent は数分。Claude Research は 20~30分もかかる
  • GitHub Actions で週次/月次レポートを自動作成してくれる
  • 用途に応じて色々カスタマイズできる

AI にも各レポートのメリット・デメリットを比較してもらいました。(もっと厳密な品質比較したければ、品質評価モデルや品質スコア等を使用すべきかと思いますが、簡単のためチャットで精度比較しただけです)

概ね自分の主観での比較と同じような回答をしてくれています。今回の AI Agent の目的としては、エンジニアや研究者が、ビジネス価値や将来性の高い最新 AI Tech 動向をクイックにキャッチアップできることにあるので、AI Agent 作成した一定の価値がありそうです

claude.ai

なおこの比較結果は、精度比較時点(2025/10頃)での結果なので、今後 Claude Research や Gemini Deep Research 使ったほうが良いレポート作成できるというのは大いにあります

まとめ

AI Agent を使用すれば、研究開発業務においても自身の業務を色々自動化&効率化できることがわかりました。

また今回の研究開発用 AI Agent は、最新 AI 技術キャッチアップのみの AI Agent でしたが、他にも AI 関連の最新論文調査用 AI Agent や、これら最新 AI Tech 情報や論文動向を加味した株価予想マルチ AI Agent 等も作成できる気がしました。

AI Agent 使って、手が追いついてないことや苦手なことはどんどん自動化していきましょう!

We Are Hiring!

ABEJAは、テクノロジーの社会実装に取り組んでいます。 技術はもちろん、技術をどのようにして社会やビジネスに組み込んでいくかを考えるのが好きな方は、下記採用ページからエントリーください! (新卒の方やインターンシップのエントリーもお待ちしております!) careers.abejainc.com

特に下記ポジションの募集を強化しています!ぜひ御覧ください!

トランスフォーメーション領域:データサイエンティスト

トランスフォーメーション領域:データサイエンティスト(ミドル)

トランスフォーメーション領域:データサイエンティスト(シニア)