グーグル・クラウド・ジャパンは8月29日、オンラインでSRE(Site Reliability Engineering:サイト信頼性エンジニアリング)とJCBの採用事例に関する説明会を開催した。
SREとは
はじめに、グーグル シニア デベロッパーリレーションズ エンジニアの山口能迪氏はSREについて「信頼性の高い本番環境システムを実行するための職務、マインドセット、エンジニアリング手法のセットであり、Webサイトやサービスの信頼性をどのように確保し、運用していくのかという手法だ」と述べた。
通常、ソフトウェアエンジニアリングは運用・保守よりも設計・構築を重視する傾向にあり、総コストの40~90%はローンチ後に発生することが見込まれている。
開発チームは、なるべく速く製品・サービスを開発する指向性だが、運用チームはリスクを減らすためにスピードを下げようとするため、協調的な働き方が難しく、脆い組織構造になってしまい、スケールも難しくしてしまっていると同氏は指摘する。
これは、開発と運用の各組織のサイロ化も促してしまうため、従来からプロダクトマネジメントと開発チームの間をアジャイル、開発チームと運用チームの間はDevOpsにより、それぞれの組織間における摩擦を低減するための取り組みが進められてきたという。
DevOpsは、Google社内においてSREが提唱された同時期に広まっており、開発と運用間の緊張を緩和するための手法として広く知られている。