ABEJA Tech Blog

中の人の興味のある情報を発信していきます

gpt-oss-120bをpythonとvLLMで触りながら理解する

データサイエンティストをしている服部です。 OpenAIからgpt-ossというオープンモデルが登場しました。 早速ですが、このモデルを使いながら中身を理解していきたいと思います。 gpt-ossのモデル特徴 vLLM上で動かす 通常のtokenizerで動かす 最終出力と思考…

NVIDIA OmniverseとCosmosを活用したロボティクス向け合成データ生成 〜 学習用データ不足問題の解決編

こんにちは!ABEJA で ABEJA Platform 開発を行っている坂井(@Yagami360)です。 以下の記事では、Cosmos を実際に動かしてみながら Cosmos により物理法則が考慮されたフォトリアリスティックな動画生成(合成データ生成)が可能であることを確かめました…

NVIDIA Cosmos の世界基盤モデルによる合成データ生成入門 〜 Cosmos Transfer 編

本記事は、以下の記事の後編記事になります。 tech-blog.abeja.asia NVIDIA Cosmos の概要や Cosmos Predict に関しては、上記の前半記事をご確認ください。 後編記事では、Cosmos Transfer を実際に動かしながらその機能を確かめていきます Cosmos Transfer…

NVIDIA Cosmos の世界基盤モデルによる合成データ生成入門 〜 Cosmos Predict 編

こんにちは!ABEJA で ABEJA Platform 開発を行っている坂井(@Yagami360)です。 今年の CES2025 にて、 NVIDIA から Cosmos という自動運転やロボティクス用のプラットフォームをリリースしたという発表が大々的にありました。 blogs.nvidia.co.jp CES 202…

SmolVLA×SO-101で色付きキューブ搬送【同期推論】

はじめに SmolVLAとは タスク設定とデータセット作成 タスク概要 環境 データセット作成 SmolVLA のファインチューニング 評価と結果 汎用性の評価 考察とまとめ We Are Hiring! はじめに こんにちは!ABEJAでエンジニアをしている宇留嶋です。2025年5月にオ…

H200 GPU x 8基で Qwen2.5-VL-72B-Instruct を使った OCR を試してみる

ABEJAでデータサイエンティストをしている藤原です。 今回は、株式会社ハイレゾ様のGPUクラウドサービス「GPUSOROBAN」で H200 GPU × 8基構成のシングルノードサーバを用いて、大規模モデルを使用した検証を実施しました。本記事では、その検証でのGPUサーバ…

Raspberry Pi で作るWebカメラ映像配信(物体検出機能付き)

はじめに ABEJA 新卒エンジニアの和田です。 趣味で購入した Raspberry Pi が使われずに眠っていたため、USB 接続の Web カメラでリアルタイム映像を取得し、何か面白いことをしたいと思い立ちました。本記事では、低コストかつシンプルに映像入力環境を整え…

SO-101で試すSmolVLA非同期推論

はじめに SmolVLAとは 非同期推論のメリット 非同期推論スタックの仕組み 全体構成 AsyncInference ServiceのRPC設計とデータフロー 実験 タスク定義 実行コマンド Policy Server起動コマンド Robot Client起動コマンド 実験結果 アクションキューサイズの経…

ロボティクス開発における学習用データ不足問題の解決手段?NVIDIA の「Isaac Sim & Lab」を使用してシミュレーター上で学習用データセットを生成する

こんにちは!ABEJA で ABEJA Platform 開発を行っている坂井(@Yagami360)です。 先日の記事では、NVIDIA のロボティクス用3Dシミュレーター「Isaac Sim & Lab」を使用して、物理演算が考慮された3Dシミュレーター上でロボティクスモデルを学習させたり推…

宣言的AIコーディングのススメ

こんにちは。CTO室の村主です。 Claude Codeを日々使う中で思っていることをGeminiに言語化してもらいました。 Gemini製作物ですので、超最新トレンドを掴んでいなかったり、書き味がイマイチなところも敢えて残していますので、読み物として楽しんでくださ…