えいのうにっき

誤字脱字・記述の誤りなどはこちら https://github.com/a-know/blog.a-know.me へお願いします

次世代Webカンファレンス・テーマ "SRE" にCREが参加してきたメモ

昨日、次世代Webカンファレンスに参加してきた。初参加。

nextwebconf.connpass.com

同じ時間帯のテーマ "Performance" にも若干興味はあったのだけど、自分も同じ xRE として得るものがありそう。と思い、"SRE" のテーマを聴講してきた。このエントリはそのメモ。

書き留めたことなど

  • 着想は「ソフトウェアエンジニアがインフラの管理をする」というところから。
  • SREとして、"リアクティブなタスク" と "プロアクティブなタスク" に分けて考えている
    • この比率が50:50になるようになることを目標としている
      • これは、SRE本にある「トイルは50%以下に抑える」から来ている
    • 「トイルかどうか」の判断は意外と難しい。複雑に絡み合っている場合がある
      • それと、「トイル」は少し言葉が強いと感じている
  • SLI/SLOを定められないのであればSREとして名乗るべきではない、くらいの強い気持ちを持っている
    • SLOをエンジニアが決めるところまではできた
    • 本当はそのオーナーを決めなければいけない。POとかCTOとか。そこまでできて初めてその数字に妥当性をもたせることができると思っている。
    • このサービスはこれくらいでいい、といった意思決定ができる必要がある。
    • SLOという考え方をエンジニア側だけでなくビジネス側にも理解してもらうことが大事。
      • 稼働率100%を目指すと開発速度が落ちる、ということは理解する必要がある。
  • SLOをviolateする可能性のあるものをアラートさせる、という考え方でアラート設定している
    • アラート設定内容もレビューするようにしている。
  • SREの仕事のひとつとしての「セルフサービス化」
  • Webオペレーション(サーバー・インフラの運用)は "科学" ではなく "技芸"
    • SREは "科学" に近づいていかなければならないと思う。
  • 「自律的なチームを作り、そこに権限を与える」。
  • SREがマネージドサービスにより失職しないために。「どれだけ創造性を発揮できるか」。
  • SRE/SLI/SLOというのは組織に関するキーワード
    • 技芸ではなく科学をということを組織全体が理解することが大事。

思ったこと

  • CREの在り方を端的に表現すると「カスタマーサクセスをエンジニアリングで達成する」ってことなのかなぁ
  • SREが働きかける対象は開発者。ではCREは?
    • やはり "Customer" ?
    • "Site - 開発者" の関係を考えると...?
    • "Customer - ?" ...?
    • CREがなにかを主張したとき、それはどんな "正しさ" になるんだろう。みたいなところを考えてみたい。
  • Webオペレーションは科学ではなく技芸。
    • これも、カスタマーサポートとカスタマーサクセスの対比でも言えると思う。
    • となると、やはりCREはカスタマーサクセスをエンジニアリングで実現する、ということ......?

ウェブオペレーション ―サイト運用管理の実践テクニック (THEORY/IN/PRACTICE)

ウェブオペレーション ―サイト運用管理の実践テクニック (THEORY/IN/PRACTICE)

SRE サイトリライアビリティエンジニアリング ―Googleの信頼性を支えるエンジニアリングチーム

SRE サイトリライアビリティエンジニアリング ―Googleの信頼性を支えるエンジニアリングチーム



follow us in feedly