ABEJA Tech Blog

中の人の興味のある情報を発信していきます

infra

AWSのAZ障害でもサービスを継続させる技術

こんにちは。ABEJAのインフラ管理してる村主 @rwle1221 です。 本ブログは ABEJA Advent Calendar 2019 の11日目です。 今日は、みなさん記憶に新しい2019年8月末に発生した AWS の東京リージョンの AZ 障害について、どのようにしていればサービス影響を与…

なぜPrometheusを辞めてDatadogを採用したのか

こんにちは。ABEJAのインフラ管理してる村主 @rwle1221 です。 本ブログは Datadog Advent Calendar 2019 の8日目です。 今日は ABEJA Platform というプロダクトで、なぜ Prometheus から Datadog に変えたのか。というお話したいと思います。 一人の方でも…

EKSの運用を楽に安くするためにSpotinst Oceanを使って工夫してる話

こんにちは。ABEJAのインフラ管理してる村主 @rwle1221 です。 この記事は Amazon EKS Advent Calendar 2019 2日目の記事です。 1日目は AWSの中の方が re:Invent 直前のアツい想いを書く ということで、ハードルが上がってそうですがそんなことは気にせずに…

ABEJAの技術スタックを公開します (2019年11月版)

よくエンジニアの方にご質問いただく `ABEJAってよく聞くけど、実際どんなことやってるのかよくわからない` という点をクリアにするために、事業内容と技術視点でのABEJAの取り組みを紹介したいと思います。ABEJAに興味のある方や、未来の一緒に働くメンバー…

Terraform workspace を駆使しつつ assume-role + MFA 対応する

ABEJA で Research Engineer をやっている中川です.普段は論文読んだり,機械学習モデルを実装したり,インフラを構築したりしています.ABEJA ではインフラを構成する AWS に対するアクセス制御を容易にするため,以下の概念図のように権限だけを管理する…

SpotinstとECSを組み合わせたら気付けばContainer as a Service with Spot Instanceができてました

こんにちは。ABEJAのインフラを担当している村主です。 昨今インフラ界隈で流行っておりますKubernetesに全振りしたい気持ちで仕事に励んでおりますが、サクッと使うにはKubernetesは重くて、ECSが軽いのでECSも使っています。 まずはじめにSpotinstについて…

Uberのような配車サービスは海外の観光客とって必須なサービス。というのを体感した

ABEJAのSRE/インフラエンジニアの村主です。 今回、サンフランシスコでGoogle Cloud Next '18 が行われていたので行ってきました。その際にUberの乗りまくって体感したことを共有します。 Google Cloud Next '18 やサンフランシスコのネタはもっとあるので、…

Kubernetes x AWS x GPUにハマった話

tl;dr 長文なので3行で kubernetesとAWSとGPUは超える壁が多かった。やるならkubeadmがオススメ。 kubeadmでcloud-provider=awsの手順を後半に記載 はじめに ABEJAのサービス系インフラを管理しているインフラエンジニアの村主です。 コンテナ周りは割とECS…

スポットインスタンスを効率的に管理するSpotinstを使おう

みなさん、AWSのスポットインスタンスは使っていますか? スポットインスタンスを使えばオンデマンドインスタンスの約70-80%引きでEC2を利用でき、大きなコスト削減が出来ます。 しかし、スポットインスタンスは価格変動が起きるとインスタンスが停止したり…

俺はSSHをしたくない ~ Fargate vs ECS+SpotFleet のPrice比較 ~

この記事は AWS Fargate Advent Calendar 2017 の9日目の記事です。 こんにちは。 service sshd stop 布教活動中の、ABEJAのサービス系インフラを管理しているインフラエンジニアの村主です。 今回AWSからFargateというコンテナマネージドサービスが発表され…