社員100名超で AWS GameDay を開催しました!
宮崎啓
こんにちは、リクルートテクノロジーズの 宮崎 啓です。2020年12月23日に AWS GameDay という社内イベントを実施したので、その内容について紹介したいと思います。
AWS GameDayとは
AWS Re:Invent でも毎年人気イベントになっているゲーム形式のDevOpsコンテストです。今回、弊社では社内イベントとして、2018年のRe:Invent で開催された『MicroService Madness』をフルリモートで開催しました。
概要
公式のルール上、詳細な内容は触れられない事をご了承下さい。
簡単に説明すると、以下のような内容になります。
- AWS環境が与えられ、架空のマイクロサービスを稼働させる
- 障害や攻撃など様々なイベント(=カオス)が発生する
- DevOpsチームとして安定稼働を目指す
- 4人1チームでゲームに参加し、チームごとのスコアを競い合う
本来のゲームイベントでは、オフラインで一箇所に集まりみんなでワイワイガヤガヤするのですが、今回は昨今の情勢を鑑みてフルリモートでの開催となりました。
イベント開催までの流れ
参加者募集
リモート開催での社内コンテストイベントは初めての試みだったのですが、Slackやメーリングリストでの大会概要の周知、Confluenceでのイベント説明ポータルページの設営等により、なんと総勢110名・28チームものエントリーが集まりました!!!
参加者の分布としては、インフラエンジニア・アーキテクト担当者が大半でしたが、セキュリティ組織、企画組織、フロントエンド開発組織、データ分析組織 などからも集まりました。クラウドに対する興味を持つ人が増加してきている事を実感させられました。
事前勉強会
AWS様にご協力いただき、AWSサービス(今回のイベントで活用するサービス)についての事前勉強会を行いました。
一般的なWebシステムの開発で利用されるAWSサービスや、非機能面を充足させるAWSサービスの紹介とそれらのケアポイントについて一通り紹介して頂きました。少しボリュームが多く、一回で理解しモノにするのは難しかったかもしれません。
この事前勉強会にも、エントリーされた110名の殆どが参加し、当日のスコアを上げるべく集中して勉強会に臨んでいました。
大会当日
実際にゲームを始めていくと、様々なところでの躓きや混乱により、3時間半というゲーム時間が短く感じました。
余談ですが、私が参加したチームは前半かなりリードしていたのですが(瞬間最高順位:4位!)、後半に発生したとあるカオスをシューティングすることが出来ずにアタフタしているうちにスコアがあれよあれよという間に下がり、最終的には下から4位という残念な結果とあいなりました…(爆
AWS様より、優勝チームメンバーにはパーカー、2位・3位にはTシャツが贈呈され、各チームメンバーの勇姿を讃えました。最後は、参加者で集合写真を撮影しました。
大会終了後はAWS様より実際に発生したカオスの解説を受けました。あのカオスは実は裏でこんな事が起きていた!というネタバラシ&解説をうけ、参加チームそれぞれが振り返りを行いました。
LT大会
大会終了後に実施したLT大会では、Gamedayの上位3チームからの発表や持ち込みLTで盛り上がりました。上位スコアのチームにはそれぞれメンバーのスキルセットも違う中で高得点を出せた要因があり、非常に面白いLTとなりました。
『普段の業務と同様に、システムが正常に動作していることの監視、APMの活用や、各AWSサービスの状況を確認することが重要だった』という事や、『Gamedayそのもののルールを最初にしっかり聞き、理解していることも重要であった』という内容が印象的でした。
まとめ
大会終了後のアンケートや、参加者からの感想をもらい独自に振り返りを行いました。
フルリモート開催のメリット・デメリット
対面が苦手な方も、カジュアルに参加でき、物理的移動なども無い点が参加しやすさに繋がったと考えています。
一方で、リモートだと、苦戦している参加者にリーチするのが難しいため運営サイドでの工夫がより一層必要になるという気づきがありました。
たとえば、説明スライド配布場所やGameルール周知で、Slackチャンネルでの周知や、GameDay公式で用意されるドキュメント等複数に情報が分散してしまい、どこを見れば良いのか、何をすれば良いのかを正しく理解できずに序盤苦戦する参加者がいました。対面であればすぐにフォローできますが、リモートでは難しい。情報リソースをまとめるなどの準備をより入念に行う必要があると感じました。
GameDayに参加して感じたこと
システム運用、障害対応、監視といったDevOps活動の重要性を改めて気づくきっかけとなりました。トラブルシューティングにおいては、発生している事象を整理し、普段疑わない箇所であっても設定が正しいことを一つずつ確認するという当たり前のことが大切であるということを再認識させられました。
コミュニティ活動としての効果
今回のイベントで初めて知った社内のメンバーが多数いました。今回のイベント開催はクラウドコミュニティ活動という観点でも非常に有意義なものでした。今後もこうしたイベントを通じて社員皆で学びを深めていきたいと考えています。今後も、このようなイベントを開催しましたら記事にてご紹介していきたいと思います。
最後までお読み頂きありがとうございました!