最新 AI Tech 情報キャッチアップ用 AI Agent を作成し自身の研究開発業務を一部自動化してみた

こんにちは！ABEJA で ABEJA Platform 開発や AI 関連の研究開発業務を行っている坂井（@Yagami360）です。こちらはABEJAアドベントカレンダー2025の23日目の記事です。

ここ５〜６年くらいのAI 技術の進歩は目覚ましですよね。数年前に ChatGPT 登場して以降、更に進歩が大きく加速してきています。 AI 技術の飛躍的な進歩は嬉しい反面、進歩が早すぎて最新の AI 技術動向を全然キャッチアップしきれていないというのが最近の自分の悩みになってました。

そんな研究開発業務における悩みも AI Agent 使えば簡単に解決できるのではないかと思い、研究開発用の AI Agent を作成してみました。

最新 AI Tech 情報キャッチアップ用 AI Agent
まとめ
We Are Hiring!

最新 AI Tech 情報キャッチアップ用 AI Agent

今回の研究開発用 AI Agent は、最新の AI Tech 関連の情報を収集して GitHub Issue 上のレポートとして自動作成する AI Agent になっています。

GitHub レポジトリは、以下においています。詳しい使い方等は、レポジトリの README を見ても貰えればと思います

github.com

作成可能なレポートの種類

今回の研究開発用 AI Agent で作成可能なレポートとしては、以下のような種類になっています。

週次レポート

GitHub Action により毎週金曜日に自動的に作成されるレポートで、今週１週間の AI 技術動向に関するレポートになっています

github.com
月次レポート

GitHub Action により毎月1日に自動的に作成されるレポートで、先月１ヶ月間の AI 技術動向に関するレポートになっています

github.com
特定トピックのレポート

GitHub Action の workflow_dispatch での手動実行で自動的に作成可能なレポートで、特定の AI 関連トピック（RAG, A2A など）に関するレポートになっています

github.com

仕組みなど

基本的には、プロンプトで指示しただけの技術的に簡単な AI Agent になっています。（プロンプト指定だけでそれなりのレポート品質になったので、RAG とか使わなかったというのが背景です）

もし中身の詳細知りたい方いれば、コード見てもらえれば思いますが、以下ポイントを列挙しておきます。

使用する LLM モデル

Claude か Gemini の各種モデルが利用できます。デフォルトでは、API 利用コストの安さ観点から Gemini の gemini-2.5-flash にしています。別のモデルを使用したい場合は、環境変数の値か GitHub Actions 用の Variables の値で切り替えれるようにしています
キーワード指定

最近の AI トレンドや将来性の高い AI 技術関連のキーワードリストをプロンプトで指定し、関連した情報を取得できるようにしています。ここらへんのキーワード選定は、自身の AI 知識が必要であり、時代の変化に応じた継続的なプロンプト調整が必要になるかと思います
Web 検索機能

Claude モデルや Gemini モデルの Web 検索機能を使用して、プロンプトで指定した有益なサイトのURLリストから情報を取得できるようにしています。どのようなサイトが有益かは、自身の AI 知識が必要であり、時代の変化に応じた継続的なプロンプト調整が必要になるかと思います。

なおサイトURLによっては、うまくページング処理等をしないとすべての情報を取得できないのですが、現時点ではここらへんの処理は実装していないので、一部情報がとれてない箇所もあります。また、ちゃんとした AI Agent を開発する場合は、取得した各種情報をデータベースに保存して、毎回情報取得しなくて済むようにするかと思いますが、今回はさくっと作りたかったので毎回これら情報を取得するようにしています（それ故、API 利用コストが大きくなります）
MCP サーバー機能

GitHub MCP サーバーや Hugging Face MCP サーバーを使用して、AI 関連で人気の GitHub レポジトリや Hugging Face 上のモデル・データセットなどの情報を取得できるようにしています。
ただし現状では Claude モデルのみでのサポートで、Gemini モデルではサポートしていません。今後 Gemini モデルでも MCP サーバーを利用できるようにする予定です。

また今後必要に応じて、ArXiv MCP サーバーを使用した論文情報の取得や Slack MCP サーバーを使用した Slack 通知機能、Twitter MCP サーバーを使用した Twitter 投稿機能なども追加しようとは思ってます
GitHub Issue レポート内での質疑応答機能

作成されたレポートに関して、詳細を深堀りしたいケースが多々ありますが、GitHub Issue 内に閉じた形で確認できればツールを色々横断しなくて済むので便利です。
そのため作成された GitHub Issue レポート内にて、@claude メンション or @gemini-cli メンションして Claude モデルや Gemini モデルに質問することで、レポート内容の詳細を更に深堀りすることもできるようにしています。

仕組み的には、Claude Code Action や Gemini CLI Action を使用して実現しています。Claude Code Action や Gemini CLI Action の本来の用途は、バグ報告 GitHub Issue からの PR 自動作成や PR 自動レビューなどになりますが、今回の AI Agent では、これら機能をうまく利用して、レポート内容の質疑応答をできるようにしています。
GitHub Actions による定期的なレポート自動作成

GitHub Action の schedule 機能で、定期的にレポートを自動作成できるようにしています。これにより、最新 AI Tech のキャッチアップに必要なことは、毎週１回 or 毎月１回 GitHub Issue を開き自動的に作成されたレポートを確認するだけで良いです

定期実行可能なサービスには他にも色々あるかと思いますが、GitHub Action を使用することで GitHub レポジトリ内で完結し、なおかつコストの発生しない方法でレポート作成できるようにしています（API 利用コストは別途発生します）
uv による Python パッケージ管理

Python パッケージ管理ツールとしては、uv を使用しています。
pip や conda は、AIプロダクションレベルでは NG として、これまで poetry が広く使われてきたかと思いますが、
uv は内部的には Rust 言語で書かれており、非常に高速に Python パッケージのインストール処理を行えます。開発者体験も大きく向上するので非常にオススメです。（poetry → uv への以降も比較的簡単に行えるようになっています）
AI Agent 開発用フレームワーク

AI Agent 用のフレームワークとしては、LangChain / LangGraph, Microsoft Agent Framework (AutoGen, Semantic Kernel), Google ADR, OpenAI Swarm, CrewAI など、ノーコード系だと Dify, OpenAI AgentKit / Agent Builder, Vertex AI Agent Builder などなど様々なツールが乱立しており、それぞれメリット・デメリットがありますが（AI Agent 時代における各社シェア争いでフレームワーク乱立しすぎて開発者的には困るのですが）、今回の AI Agent の機能的にこれらのフレームワークの必要性がなかったため特に使用していません。単純に Claude モデルであれば claude_code_sdk、Gemini モデルであれば genai を使用しています。

今後マルチ AI Agent 化したいなどあれば、適切なフレームワークを使用するようにしようと思います。（あるフレームワークに寄せるとコード全体がそのフレームワーク依存になり、後で別のフレームワークに移行するコスト高そうだったので、あえてフレームワーク使用しなったというのもあります。）
Vibe coding で開発

少し別の話になりますが、この AI Agent は、LLM モデルによる Vibe coding で実装しており、実装の殆どを AI で行っています。
また PR 作成に関しても、Cursor or Claude Code CLI + GitHub MCP サーバーによる PR 自動作成で行っており、PR レビューに関しても、Claude Code Actions or Gemini CLI Action or GitHub MCP サーバーを使用した自動レビューで行っています。これからは如何に Vibe Coding で自動化して効率化させるかの時代ですね。

Claude Research / Gemini Deep Research で作成したレポートとの精度比較

そもそも今回のような AI Agent をわざわざ作らなくても、Claude Research や Gemini Deep Research 使ってレポート作成すればいいのでは？という観方もあると思うので、簡単な精度比較もやっておきました。

以下その結果です。

公正な比較のために、モデルは同じモデルを使用し、プロンプトに関しては、研究開発用 AI Agent は週次レポート用のプロンプト、Claude Research と Gemini Deep Research に関しては「2025-10-03 ~ 2025-10-09 の最新 AI Tech 情報を教えて」という週次レポート期間の単純なプロンプトにしています。