とことんDevOps | 日本仮想化技術のDevOps技術情報メディア

DevOpsに関連する技術情報を幅広く提供していきます。

日本仮想化技術がお届けする「とことんDevOps」では、DevOpsに関する技術情報や、日々のDevOps業務の中での検証結果、TipsなどDevOpsのお役立ち情報をお届けします。
主なテーマ: DevOps、CI/CD、コンテナ開発、IaCなど

開催予定の勉強会

読者登録と各種SNSのフォローもよろしくお願いいたします。

イベントレポート 第16回とことんDevOps勉強会 【特別編】 「Datadogで学ぶ多面的なオブザーバビリティ」

今回のとことんDevOps勉強会は特別編ということで、Datadogの萩野様を特別講師としてお招きし、「Datadogで学ぶ多面的なオブザーバビリティ」と題して多様なオブザーバビリティについて紐解いていくような解説をいただきました。

弊社でも案件でDatadogを導入することが多いですが、その多様な機能からなかなかその全体像と目的を理解するのに苦労しています。そんな弊社のエンジニアの悩みもあり、Datadogの萩野様にご登壇頂くことになりました。本セミナーではオブザーバビリティの多様な側面を一つ一つ紐解きながら、オブザーバビリティを構成する要素やその意義、活用方法をご紹介いただきました。

振り返りも兼ねて当日の配信の様子をYoutubeでアーカイブしていますので、是非ご覧ください。当日参加できなかった方も、これを機会にとことんDevOps勉強会に興味を持っていただければと思います。また、当日いただいたQ&Aに関してもこちらのブログでまとめていますので、ぜひご覧ください。

セミナー動画 - YouTube Live アーカイブ

www.youtube.com

発表資料 - Speaker Deck

speakerdeck.com

Q&Aまとめ

Q: 監視界隈だと、"AIOps"という言葉を聞くことが多くなってきたような気がしますが、 DatadogでAIOpsと呼べる機能はありますか? ※AIOpsの定義はあいまいだと思いますがw

 

A: Datadogは裏でDeep LearningやMachine Learningを使って機能を実現しており、AIOpsとしてのポテンシャルを持っていると思います。期待するような機能としてはWatchdog AIという機能があり、潜在的なトラブルの可能性や解決へのアドバイスなどをしてくれます。また今年の8月に発表されたBits AIではダッシュボード上で自然言語で実現したいことを入力することで、それを実現する処理のクエリーを生成してくれるといったこともできるようになりました。

Q: オブザーバビリティについて、より理解を深めていくための良い情報源などがあれば教えてください

 

A: 最近オブザーバビリティ関連のユーザーコミュニティや勉強会がいくつか立ち上がって来ているので、そこに参加するのが良いと思います。オブザーバビリティは範囲が広いので、順序立てて勉強するのが困難です。そのため、実際に使っている人の実例を見たり聞いたりする方が理解を深めるのが早いのではないかと思います。

Q: オブザーバビリティの導入はある程度コストがかかると思いますが、初期からはあまり導入しないのでしょうか?

 

A: 今までオブザーバビリティという言葉を使っていなかっただけで、どのようなプロジェクトでも多かれ少なかれ監視自体はやってきたかと思います。Datadogのようなオブザーバビリティのツールでは、今までそれぞれ異なるツールで実現していた監視領域を、1つのプラットフォームで実現するという点がメリットの一つです。

そのため、そういったツールを導入して監視するかどうかは判断が必要となってきます。最初から全面的にオブザーバビリティのツールを導入するのではなく、お金をかけてでも導入する部分とそうではない部分とを分けて部分導入するというのもありかと思います。

Q: お試しであまりお金をかけずにDatadogを使ってみたいんですが、この機能はお金かかるぞっというのがあれば教えてほしいです

 

A: Datadogではログの取扱いで多くお金がかかる可能性があります。ログの取扱いは従量課金制となるので、むやみやたらとログを取扱ってしまうと大変な金額になることもあります。吐き出すログの量が流動的な場合に、突然利用料金が跳ね上がってしまうというケースもあります。そういう意味で、最初は対象とするログの範囲を絞ると良いと思います。そのほかにもReal User Monitoringも料金が高くなりやすい機能だと言われています。

Q: オブザーバビリティは環境問わず導入した方がいいのでしょうか?テスト環境、ステージング環境、本番環境など

 

A: ニーズとコストの比較をして、コストメリットがあるか判断をする必要があります。Datadogをはじめとするオブザーバビリティ界隈ではOpsだけではなくDevやSecにも対象を広げて使うことを推奨しています。特にパフォーマンステストやユーザー視点のテストは、開発段階でオブザーバビリティの観点から行うべきテストで、本番ローンチ後のバグの発生率を下げるという効果があります。

ただし、ステージング環境や疑似本番環境も含め、全ての環境にオブザーバビリティのツールを入れるべきかというと、それはコストメリットをしっかりと判断する必要があります。

Q: DATADOGでDashboardを作成するのは視覚的に簡単にできるものでしょうか?よく表示するものはサンプルなどはありますでしょうか?

 

A: よく使われるようなDashboardはテンプレートが用意されており、それを選択するだけで主要な項目が設定された状態ですぐに使えるようになっています。テンプレートをベースにカスタマイズして自分の求めるDashboardを作成することもできます。また、スクラッチから作る場合にも、表示したいデータを選択して追加するだけでDashboardを作ることができます。

Q: オブザーバビリティをうまく機能させるためには、OpsサイドだけでなくDevサイドにも理解を深めさせる必要があると感じましたが、そのような方向で活用されている事例があれば教えて欲しいです

 

A: 社内でそういった事例があるか確認してみます。

→後日、こちらの事例を紹介いただきました。

NTT docomo様事例

開発部門が運用業務を巻き取って組織の生産性を2倍に向上 | Datadog

Softbank様事例

アジャイルとDevOpsで変化に強い開発環境を | Datadog

Q: Securityもオブザーバビリティに含まれるイメージがなかったので勉強になりました。ただ Security の画面例の見方がよくわかりませんでした。 上の方にグラフがありましたが、Securityのイベント件数を示していて、 件数が多い部分に危険な兆候がある、という見方になるのでしょうか。

 

A: セキュリティに関しては脅威検知や普段と異なる挙動の検知からアラートを上げたり、Dashboardに表示するというのがDatadogのセキュリティの機能となります。イメージとしてはDatadogが直接セキュリティを対策をするのではなく、セキュリティを担保するためのツールの動きを一元的に監視するという形になります。

リンク

今回、ご協力いただいたDatadog様のサイトはこちらから。

www.datadoghq.com