昨日、次世代Webカンファレンスに参加してきた。初参加。
同じ時間帯のテーマ "Performance" にも若干興味はあったのだけど、自分も同じ xRE として得るものがありそう。と思い、"SRE" のテーマを聴講してきた。このエントリはそのメモ。
書き留めたことなど
- 着想は「ソフトウェアエンジニアがインフラの管理をする」というところから。
- SREとして、"リアクティブなタスク" と "プロアクティブなタスク" に分けて考えている
- この比率が50:50になるようになることを目標としている
- これは、SRE本にある「トイルは50%以下に抑える」から来ている
- 「トイルかどうか」の判断は意外と難しい。複雑に絡み合っている場合がある
- それと、「トイル」は少し言葉が強いと感じている
- この比率が50:50になるようになることを目標としている
- SLI/SLOを定められないのであればSREとして名乗るべきではない、くらいの強い気持ちを持っている
- SLOをエンジニアが決めるところまではできた
- 本当はそのオーナーを決めなければいけない。POとかCTOとか。そこまでできて初めてその数字に妥当性をもたせることができると思っている。
- このサービスはこれくらいでいい、といった意思決定ができる必要がある。
- SLOという考え方をエンジニア側だけでなくビジネス側にも理解してもらうことが大事。
- 稼働率100%を目指すと開発速度が落ちる、ということは理解する必要がある。
- SLOをviolateする可能性のあるものをアラートさせる、という考え方でアラート設定している
- アラート設定内容もレビューするようにしている。
- SREの仕事のひとつとしての「セルフサービス化」
- Webオペレーション(サーバー・インフラの運用)は "科学" ではなく "技芸"。
- SREは "科学" に近づいていかなければならないと思う。
- 「自律的なチームを作り、そこに権限を与える」。
- SREがマネージドサービスにより失職しないために。「どれだけ創造性を発揮できるか」。
- SRE/SLI/SLOというのは組織に関するキーワード。
- 技芸ではなく科学をということを組織全体が理解することが大事。
思ったこと
「リアクティブではなくプロアクティブ」って、カスタマーサポートとカスタマーサクセスの対比の文脈でもよく出てくるキーワードで、SREの文脈でこれが出てくるのも偶然ではないんじゃないかなーなどと思ったり。 #nwc_sre
— a-know | Daisuke Inoue (@a_know) 2019年1月13日- CREの在り方を端的に表現すると「カスタマーサクセスをエンジニアリングで達成する」ってことなのかなぁ
- SREが働きかける対象は開発者。ではCREは?
- やはり "Customer" ?
- "Site - 開発者" の関係を考えると...?
- "Customer - ?" ...?
"インフラエンジニアの意見は「正しくなりがち」"
— Otsuka (@mopin) 2019年1月13日
うまい言い回しだと思う。現場での懸念がすごくよくわかる。#nwc_sre- CREがなにかを主張したとき、それはどんな "正しさ" になるんだろう。みたいなところを考えてみたい。
- Webオペレーションは科学ではなく技芸。
- これも、カスタマーサポートとカスタマーサクセスの対比でも言えると思う。
- となると、やはりCREはカスタマーサクセスをエンジニアリングで実現する、ということ......?

ウェブオペレーション ―サイト運用管理の実践テクニック (THEORY/IN/PRACTICE)
- 発売日: 2011/05/14
- メディア: 大型本

SRE サイトリライアビリティエンジニアリング ―Googleの信頼性を支えるエンジニアリングチーム
- 発売日: 2017/08/12
- メディア: 単行本(ソフトカバー)