
公開日
2023年9月14日
SRE組織・業務のご紹介
⚠ 本記事は2022年に別媒体で公開していた内容に追記修正を加えたものです。
こんにちは!トレンドマイクロでSREを担当している森です。
本記事では弊社のSRE組織と主な業務についてご紹介します。個別企業のSRE組織ってどうなっているんだろう?という方のご参考になれば幸いです。
1. 対象読者
主にSREに関心のある方や、現在SREとして勤務されていて個別企業の事例に興味のある方を想定して書いています。
この記事では組織と業務概要の話がメインです。
2. SREとは
SREの詳しい説明や類似の概念/役割との違いについては、Googleの書籍や様々な企業様・個人の方による先行の解説がありますので、本記事では割愛します。
SREのあり方や実践方法は各企業・組織・扱うサービスによって異なりますが、弊社では「SREとは、スケールするシステムのサービス運用をエンジニアリングで改善して、サービスの信頼性の確保とサービス成長のバランスをとるための方法論である」と捉え、この実現のために後述する各業務を行っています。
3. トレンドマイクロのSRE組織
3.1. 現在のSRE組織
弊社では主にフィリピンを拠点とするGlobal SREと、日本を拠点とするJapan Local SRE、米国(US)を拠点とするUS Local SREが協同で活動しています。

弊社の製品・サービスの中には、複数の地域 (リージョン) でサービスを提供しているものがあります。
Japan / US Local SREは基本的に日本/USリージョンを担当します。
Global SREはそれ以外の全リージョンを担当するほか、夜間/休日時間帯の緊急対応など、日本/USリージョンの一部業務もカバーします。
※ 担当範囲は製品・サービスにより異なります。弊社では現在、一部の製品から段階的にSREプラクティスの導入を進めており、法人向け製品の一部 (Trend Vision One™, Trend Micro Cloud App Security™, Trend Micro Email Security™, Trend Micro Web Security™, Worry-Free Business Security Service™, Cloud Edge™) などにて上記のようにGlobal/Local SREの体制を導入しています。
製品により、Global SREのみで担当しているものや製品独自のSRE体制を持つものもあります。
3.2. なぜ日本にLocal SREがいるのか
Japan Local SREは2022年から新しく発足した組織です。組織体制としては、Global SREや製品開発チームと並列の位置づけです。

Global SREの一部としてではなく日本内部の組織として発足した理由は、主に以下の2つです。
同じ製品のユーザでも、リージョンによりお客さまからの製品/サービスへの期待が異なることがあります。
日本のメンバーがSREとして製品に関わることで、日本でのユースケースをCUJ (Critical User Journey) やSLIの設計時に一層考慮できるようになりました。また、サポート部門との連携強化など、必要に応じて日本固有の事情に柔軟な対応を実現しています。
加えて、多くの製品でリージョンを利用したRing deployment戦略を利用しています。「新機能よりも安定性を重視したい」という声が大きい日本のお客さまに合わせ、新機能等を展開する際はステージング環境の後に本番環境の他のリージョンに展開してから最後に日本リージョンに展開する等、安定性を確認しながら慎重に実施しています。
いくつかの製品で、環境をリージョンごとに分離し、特に重要なデータを含むシステム環境をJapan Local SREで管理しています。これにより、地域固有のビジネス要件やコンプライアンス要件に対応しやすくなります。
4. SREの業務
2023年現在、主に以下のような業務を行っています。
4.1. モニタリング
・SLI/SLOの設定、見直し
・ログの収集、可視化
・監視項目の管理、見直し
・監視ツール/環境の開発、改善
・日々のシステム監視、アラート対応
4.2. インシデント対応
・発生した事象のトリアージ、調査対応 (主にプラットフォーム~コンテナ環境)
・関係者の招集、対応の指揮
・事後対応としてBPMの取りまとめ
・訓練の実施
4.3. 変更管理
・AWS / Azure 環境のコンプライアンス適合・認証対応
・デプロイ (週数回~、製品により頻度が異なります)
・コンテナ基盤、データベース、その他利用している各種クラウドサービス等、インフラ環境の管理・運用・設定
4.4. トイルの削減
・各業務の手順化・自動化・省力化
4.5. その他
・チームとしての運用の建付け (日本および他リージョンの関係部署と業務内容や方法を調整しつつ、お客さまへの貢献の最大化を目指しています)
・特に日本の他部署へ向けて、SREの概念の共有・文化醸成
・学習
-技術:必要な知識が多岐にわたるため、業務時間内にも学習の時間を設けたり、互いに勉強会を開催したりしています。
-英語:Global SRE および開発チームとのコミュニケーションを英語で行うため、組織として英語力強化に取り組んでいます。
5. おわりに
トレンドマイクロは開発拠点が複数地域にあり、かつグローバルでお客さまにサービスを提供していることなどから、SREの組織としてはやや珍しい体制となっているかもしれません。こんな感じなんだ!と面白く読んでいただけましたら幸いです。
SREでは今後もサービスの信頼性の確保とサービス成長の両立を実現させるため取り組んでまいります。
トレンドマイクロ株式会社
セキュリティエキスパート本部 ローカルSRE部
森 葉月