ABEJA Tech Blog

中の人の興味のある情報を発信していきます

GENIAC3期のLLM開発で使用したロングコンテキスト評価のベンチマーク公開

LLM

ABEJAでデータサイエンティストをしている藤原です。 弊社は、経済産業省とNEDOが実施する、国内の生成AIの開発力強化を目的としたプロジェクト「GENIAC(Generative AI Accelerator Challenge)」の1期、2期に続き、3期にも採択され、そこで大規模言語…

Mentor Pi メカナムホイールを ROS 2 で動かす 〜 macOS 上のシミュレーション環境構築とフロンティアベース探索による検証

導入 ABEJA でインターンをさせていただいている青木です。 本記事では、インターンの成果として「メカナムホイールを搭載した 4 輪ロボット Mentor Pi (Mecanum) を ROS 2 で動かし、macOS 上でシミュレーション・探索まで行う環境を整える」という取り組み…

なぜSSHでは一文字送信するのに100パケットも必要なのか? Claude Code を使って調査してみた

LLM

こんにちは、ABEJA Platform に搭載しているアプリケーション、「ABEJA Insight for Retail」の開発と運用を担当している森永です。 みなさんは普段 SSH を使っていますか? 私は元々 Vimmer だったこともあり (最近は機能面で楽なので VSCode を使用してお…

Differential Transformer V2が発表されたので、今更ではあるがV1論文を読んだうえで差分を確認してみた

こんにちは!ABEJAでデータサイエンティストをしている大田です。 先日Hugging FaceでDifferential Transformer V2の発表があり、そこでは昨年発表されたDifferential Transformer (V1)と比べてもさらに実用的な改変があったとのことです。去年にV1の論文が…

2足歩行ロボットを作ってみよう(前編)

はじめに ロボットの制作 ハードウェアの設計 モデルの作成 シミュレーション USDの作成とIsaacSimでの確認 プロジェクトの作成 学習条件の設定 環境の設定 Agentの設定 強化学習について 設定の詳細 タスクの設定 歩容改善の取り組みについて 対称性の学習 …

NVIDIA Clara を使用して医療・創薬系の AI モデルを動かしてみた

こんにちは!ABEJA で ABEJA Platform 開発や AI 関連の研究開発業務を行っている坂井(@Yagami360)です。 こちらはABEJAアドベントカレンダー2025の25日目の記事です。 近年のディープラーニングの発展に伴い、マテリアル・創薬・医療分野においても AI の…

今更ながら DeepSeek-R1 の論文を読んでみた

こんにちは!ABEJA で ABEJA Platform 開発や AI 関連の研究開発業務を行っている坂井(@Yagami360)です。 こちらはABEJAアドベントカレンダー2025の24日目の記事です。 今年のはじめ頃、中国の DeepSeek 社から非常に軽量かつ品質の高い LLM が公開され、H…

gpt-oss-120bに論理クイズや数学の問題を解かせて、推論ログをよく読んでみた。

gpt-oss-120bに論理クイズや数学を解かせて、推論ログをよく読んでみた。

Strands + Amazon Bedrock AgentCore + Athenaでお手軽データ分析機構を作ってみる

こんにちは。 株式会社ABEJAのシステム開発部でエンジニアをしている吉田です。 こちらはABEJAアドベントカレンダー2025の24日目の記事です。 ABEJAで仕事をしていると、「エンジニアではないけれど、データベースにあるデータを分析したい」という相談を受…

π0シリーズで使われるaction expertをコードレベルで理解する

ABEJAアドベントカレンダー2025の24日目の記事です。 ABEJAでデータサイエンティストをしている大谷です。 最近VLAに触れ合うことが増えてきました。11/7にもMacStudioで動かすSO-ARM x π0.5 -解説から実機動作まで-というタイトルで登壇もしました。 ただ、…

初心者入門:toio を VLA で動かしてみる

こんにちは!ABEJA に新設されたエンボディドインテリジェンスグループ で PM をしている飯嶌です。 こちらはABEJAアドベントカレンダー2025の24日目の記事です。 昨今、Physical AI への注目が集まっています。しかし、実際に SO-101 などのアームロボット…

最新 AI Tech 情報キャッチアップ用 AI Agent を作成し自身の研究開発業務を一部自動化してみた

こんにちは!ABEJA で ABEJA Platform 開発や AI 関連の研究開発業務を行っている坂井(@Yagami360)です。 こちらはABEJAアドベントカレンダー2025の23日目の記事です。 ここ5〜6年くらいのAI 技術の進歩は目覚ましですよね。数年前に ChatGPT 登場して以…

Terminal で暮らそう (序章)

この記事は ABEJAアドベントカレンダー2025 の 23 日目の記事です。 こんにちは!システム開発部の合屋(ごうや)です。 昨年は 今から始める NeoVim 生活 (序章) という記事を書き、Terminal に籠もる生活を送っています。 今年は Claude Code をはじめとす…

【ABEJAアジャイル活動記録】停滞を越えて、再び合流へ。「象・死んだ魚・嘔吐」がつないだチームとPOの関係

POとの距離が少しずつ開き、気づけば停滞していたスクラムチーム。 「象・死んだ魚・嘔吐」を使って言語化できない違和感を整理し、チームとPOが再び同じ方向を見るまでの実践を、スクラムマスターの視点でまとめました。

【LeRobot】テレオペで収集した模倣学習データの中身を解剖する

ABEJAでデータサイエンスしています、瀧田です。本記事はABEJAアドベントカレンダー2025の21日目の記事です。 はじめに テレオペレーションによるデータ収集環境 使用したロボットアーム カメラ構成(3台) 模倣学習のタスク LeRobotにおけるデータセット 前…

【年末大掃除】開発環境VMの再作成 - apt・brew・asdf・Dockerを使い分けたパッケージ管理

はじめに VMの構築 インスタンスの起動(OS選択) ファイアウォール設定 自動シャットダウン OSのアップデートを受け取る 最新で使いたい系ツールのインストール apt管理のツール build-essential Docker direnv セルフアップデート機能ありツール gcloud Ho…

余ったPCで検証用のプライベートクラウドを構築してネットワークで遊んでみた

※ 本記事は一部 AI を用いて執筆しております。 内容に関しましては基本的に筆者が慎重にレビューや動作確認、ファクトチェックを行なっておりますが、万が一問題と思われる点ございましたら、コメント欄にてご指摘くださいませ。 1. イントロダクション:な…

環境構築を爆速で!Python開発テンプレートのご紹介

こんにちは!システム開発部でエンジニアをやっている春名です。 この記事はABEJAアドベントカレンダー2025の19日目の記事です。 Pythonの開発環境については、過去に以下のような記事を書きました。 tech-blog.abeja.asia ユーモアあふれる記事が並ぶ中では…

Super AI Agent と呼んでみる

こんにちは。CTO室の村主です。こちらはABEJAアドベントカレンダー2025の19日目の記事です。本日は「Super AI Agent と呼んでみる」というタイトルで記事を書いてみたのですが、別に何かSuper AI Agentというものを開発したわけではなく、Claude CodeやCodex…

ユーザー理解してる“つもり”から抜け出す──PdM視点で考えるアジャイルチームの落とし穴とは…

アジャイルチームに潜む「ユーザー理解できてるつもり」問題 ユーザーインサイトを深掘りする KA法分析(例:分析根拠に自信がないユーザー) チームで観察することを仕組み化する POが正解を持たない前提に立つ 「つもり」ではないユーザー理解に近づいた …

ロングコンテキストLLMの汚染された長文コンテキストへの耐性

ロングコンテキストLLMの評価タスクの検討の一環で、汚染された長文コンテキストへの耐性を評価するタスクの検証を行いました。

NotebookLM で技術書を読む:初期理解・深掘り・理解確認のフェーズ設計

こんにちは。 株式会社ABEJAでソフトウェアエンジニアをしている近藤です。 この記事は、ABEJAアドベントカレンダー2025、16日目の記事になります。 3 行まとめ 1. はじめに:NotebookLM を技術書の理解に使ってみようと思った背景 2. 初期理解フェーズ:No…

【徹底紹介】Notionのページレベルのアクセス制御について ~Notion3.0「エージェント」に隠れた神機能~

ABEJAアドベントカレンダー2025の16日目の記事です。こちらではNotionのAIエージェントと同時期にリリースされたページレベルでのアクセスに関する設定方法や活用ケースに関して紹介しています。

Figmaに買収されたWeavyとは?次世代のAIクリエイティブワークフローを実現するプラットフォーム

はじめに Weavy AIとは Weavyが他のAIツールとどう違うのか Weavyがなかった時代の課題 Weavyがあることでできること 基本的なワークフローの作成方法 ステップ1:アカウント作成とワークスペースの起動 ステップ2:ノードの理解 ステップ3:基本ワークフロ…

Kubernetes & Helm を使ったミニデータパイプライン構築練習

1. はじめに 2. Kubernetes・Helm・Kustomize の基本 2.1 Kubernetesの役割 2.2 Container / Pod / Node / Cluster / Namespace の関係 2.3 Control Plane と Worker の役割分担 2.4 Helm 〜Kubernetes用パッケージマネージャ〜 2.5 Kustomizeで環境ごとの差…

LLMに「謎解き」はできるのか?

LLMに「謎解き」はできるのか? ABEJAでデータサイエンス部のグループマネージャをしている中西 @cfiken です。本記事はABEJAアドベントカレンダー2025の13日目の記事です。 はじめに 謎解きの難しさ 検証のセットアップ 1. データセット:自作謎解きベンチ…

Figmaを開く前に、デザイナーが『迷わないチーム』を作るためにMVVとインセプションデッキを作った話

こんにちは、ABEJA Insight for RetailでプロダクトUI/UXデザインを担当している小林です。 この記事はABEJAアドベントカレンダー2025の12日目の記事です。 以前、こちらの記事にてデジタル庁のガイドブックを活用した「ダッシュボードのバリューアップ」に…

引越し先の問題を解決するために真の意味でひとりハッカソンをする

この記事は、ABEJAアドベントカレンダー2025の11日目の記事です。 こんにちは。 株式会社ABEJAのシステム開発部でエンジニアをしている鈴木です。 他のメンバーががっつり技術に触れている中、今回はひたすらにバイブコーディングする話になります。 今年の…

ヤドンでやぁ〜んと学ぶLLMのロングコンテキストを支える技術YaRN

やぁ〜ん こんにちは、データサイエンティストをしている服部です。 ABEJAアドベントカレンダー2025の10日目の記事です。 LLMといえばロングコンテキスト大事ですよね(唐突) そんなLLMのロングコンテキストを支える重要技術である「YaRN」を紹介したいと思…

【ロボット動かす】LeRobotのプラグイン拡張でノットフィジカルなAIを実装する!【部屋が欲しい】

はじめに 先にまとめ プラグイン拡張とは 実装について 事前準備 全体 パッケージ配置 ロボットの実装 Configクラスの作成 Robotクラスの初期化 & 型定義 __init__ observation_features action_features 接続処理 キャリブレーション & 設定 アクションの送…