HS효성인포메이션시스템 기고 | 공격은 상수, 복구는 변수···랜섬웨어 시대의 사이버 복원력 가이드

랜섬웨어 피해 현황과 점점 심각해지는 이유 공격자는 피싱 메일과 악성 매크로 같은 전통적 기법부터, 취약한 원격 접속과 미패치 소프트웨어, 공급망 프로그램의 업데이트 채널, 노출된 API 키와 도난 계정 등 가능한 모든 진입 경로를 동원한다. 과거에는 파일을 암호화하고 복호화 키를 대가로 금전을 요구하는 단일한 갈취 방식이 일반적이었지만, 지금은 암호화에 더해 데이터 유출을 빌미로 한 공개 협박과…

The DXC program empowering neurodivergent IT pros

The tech industry stands to gain significant value by tapping into neurodivergent talent. Such professionals can offer fresh perspectives, demonstrate strengths in areas critical to IT, and even have the potential to make teams 30% more productive, according to research from Deloitte. To harness these strengths, employers often need to make changes to hiring processes,…

4 mandates for CIOs to bridge the AI trust gap

For the third consecutive year, the Thinkers360 AI Trust Index has taken the pulse of sentiment toward AI, and the results, once again, are a stark reminder to CIOs and CXOs that the technological innovation curve continues to outpace the ethical and governance structure required to support it. The 2025 Index provides a crucial look…

異常検知は「アラートを鳴らす」より「原因を絞る」――運用で効くデータサイエンス入門

異常の定義を決める――点の異常、文脈の異常、集団の異常

異常検知を始める前に最初にやるべきことは、「異常とは何か」を決めることです。これは技術ではなく、業務上の合意です。例えば売上が前日比で大きく落ちたら異常なのか、週次の季節性の範囲なら正常なのか。KPIが下がることだけが異常なのか、急上昇も異常なのか。どれくらいの変化幅から対応が必要なのか。ここを曖昧にすると、精度の議論が空回りします。

異常は大きく三つに分けて考えると整理しやすいです。ひとつ目は点の異常です。単発のスパイクや急落など、単一時点の値が明らかにおかしいケースです。二つ目は文脈の異常です。同じ値でも、時間帯や曜日によって意味が変わるケースです。たとえば深夜のアクセス数が多いのは異常かもしれませんが、昼間に多いのは正常かもしれません。三つ目は集団の異常です。全体のKPIは正常でも、特定地域や特定デバイスだけが急に悪化しているケースです。プロダクトの障害や計測の問題は、全体では薄まって見え、集団の異常として現れることが多いです。

さらに、異常の目的も分ける必要があります。ビジネスKPIの異常は「売上が落ちた理由を突き止める」ことが目的になりやすい一方で、システム系の異常は「障害を早く検知して復旧する」ことが目的です。同じ“異常検知”でも、許容できる誤検知と見逃しのバランスが違います。売上の監視で誤検知が多いと現場が疲弊しますし、障害監視で見逃しがあると致命的です。異常検知は、精度の前に目的を分けることが成功の第一歩です。

手法の選び方――統計的しきい値、予測残差、機械学習

異常検知の手法は、大きく三系統で考えるとわかりやすいです。まずは統計的なしきい値です。移動平均からの乖離、過去平均との差の標準化、分位点による範囲設定などがこれに当たります。利点は、速くて説明しやすいことです。「過去30日平均との差がこれだけ大きいから異常」と言えると、現場は納得しやすいです。欠点は、トレンドや季節性が強い指標では誤検知が増えることです。曜日で大きく揺れる指標を単純なしきい値で監視すると、週末のたびにアラートが鳴るような状態になります。

次に、予測残差を使う方法があります。時系列予測モデルで「本来の値」を予測し、実測との差が大きいときに異常と見なします。この方法は、季節性やトレンドをモデルが吸収するので、単純なしきい値より誤検知を減らしやすいです。一方で、予測が外れる原因が“異常”なのか“モデルの限界”なのかが混ざることがあります。大型キャンペーンや外部ショックで全体が動くと、残差が大きくなり、異常扱いが増えるかもしれません。ここでは、イベント情報を別途入れる、異常種別を分ける、予測区間で判断するなど、運用を前提にした工夫が必要です。

三つ目は機械学習的な異常検知です。Isolation Forestのように“孤立しやすい点”を異常とする方法や、オートエンコーダのように“再構成できない点”を異常とする方法などがあります。これらは多変量の特徴量を扱いやすく、複雑なパターンの異常に対応できる可能性があります。ただし、説明が難しくなりやすく、導入には注意が必要です。異常検知は、現場が原因探索に動けることが重要なので、「なぜ異常なのか」をある程度説明できる設計が求められます。機械学習モデルを使うなら、どの特徴量が異常スコアに寄与したかを示す、異常の近傍例を出す、異常のタイプごとにルールを分けるといった、説明の補助線が必要になります。

ここで重要なのは、最初から高度なモデルを使うことが正解ではないという点です。異常検知の失敗の多くは、精度ではなく、通知の設計と対応フローの欠如にあります。説明しやすい手法で小さく始め、運用の負荷と見逃しのリスクを見ながら、必要なところだけモデルを強くしていく方が、結果的に成功しやすいです。

アラート疲れを防ぐ――閾値調整、優先度付け、原因探索の導線

異常検知を現場で機能させる最大の敵は、アラート疲れです。アラートが多すぎると、人は見なくなります。すると本当に重要な異常も見逃します。だから異常検知では、検知精度より先に、通知を減らし、重要度を分け、対応を速くする設計が必要です。

まず、異常の優先度を決めます。売上や決済など致命度が高い指標は、多少の誤検知があっても即通知すべきかもしれません。一方、軽微な指標は、即通知ではなく日次のサマリーで十分かもしれません。次に、抑制条件を設けます。例えば「同じ種類のアラートは一定時間内に再通知しない」「全体が正常で特定セグメントだけ悪化した場合は別扱いする」「データが未確定の時間帯は通知しない」など、現場の運用に合わせた抑制は、実用性を大きく上げます。

さらに重要なのが、アラートが鳴った後の導線です。通知だけ送られても、人は次に何を見ればいいかわかりません。異常が起きたら、関連指標を同時に表示し、分解軸を用意することが有効です。例えば売上の異常なら、流入、CVR、客単価、決済成功率など、売上を構成する要素を同時に見られると原因が絞りやすくなります。さらに地域、デバイス、バージョン、流入元など、よくある故障点で切ったビューがあると復旧が速くなります。異常検知は、検知と原因探索が分断されると現場で使われません。検知の仕組みと、原因探索の仕組みを一体で設計することが、成功する異常検知の共通点です。

最後に、異常検知を育てる仕組みも必要です。アラートが真の異常だったか、誤検知だったか、対応は必要だったかを記録できると、しきい値調整やモデル改善が進みます。異常検知は一度作って終わりではなく、運用しながら“現場にとってちょうどいい感度”に合わせ込むことで価値が出ます。通知の量を適正にし、優先度を付け、原因探索を速くする。この三つが揃うと、異常検知は単なるアラート装置ではなく、プロダクトとビジネスを守る意思決定のインフラになります。


Read More from This Article: 異常検知は「アラートを鳴らす」より「原因を絞る」――運用で効くデータサイエンス入門
Source: News

4 modi in cui il ruolo del CIO si espanderà nel 2026

Il ruolo del CIO sta subendo la sua trasformazione più drammatica degli ultimi anni. I leader tecnologici precedentemente focalizzati sulla trasformazione digitale e sulla migrazione al cloud si vedono ora affidare la responsabilità della sostenibilità aziendale, della governance dell’AI e del consolidamento strategico delle piattaforme. Questo spostamento riflette una realtà più ampia: l’intelligenza artificiale non…

Microsoft is not rewriting Windows in Rust

A job posting by a Microsoft engineer sparked excitement about a project “to eliminate every line of C and C++ from Microsoft by 2030”, replacing it with Rust — but alas for fans of the memory-safe programming language, it turns out this is a personal goal, not a corporate one, and Rust isn’t necessarily even…

5 stages to observability maturity

When CIOs talk about observability, they may refer to log dashboards, real-time causal graphs, or AI agents that surface business risk before customers feel an impact. The term has become so overloaded that even seasoned analysts sometimes flinch when they hear it. One of them is Forrester’s Carlos Casanova, who says the industry has misused…

4 ways the CIO role will expand in 2026

The CIO role is undergoing its most dramatic transformation in years. Technology leaders previously focused on digital transformation and cloud migration are now being handed responsibility for corporate sustainability, AI governance, and strategic platform consolidation. This shift reflects a broader reality — AI isn’t just another technology to deploy. Next year, it will start to…

개발자 AI 지원, 어디까지 왔나…앤트로픽·토스·올리브영 등이 전한 현장의 고민과 전망

이날 행사에서 반복적으로 등장한 키워드는 ‘실험 문화’, ‘권한 부여’, ‘심리적 안정감’이었다. 참석자들은 AI 기술 자체보다 이러한 조직 문화적 요소가 ‘AI 퍼스트’ 전환의 진짜 성공 요인이라고 강조했다. 개발자 관계(Developer Relations, 이하 데브렐) 커뮤니티 데브챗(Devchat)과 앤트로픽, 스타트업 전문 미디어 EO 스튜디오가 후원한 이번 행사에는 CJ올리브영, 토스, 센드버드 등 국내 주요 기업의 개발·데브렐·AI 관계자들이 참석해 AI 도입 이후…

현업에 번진 AI 기대감, 리더십 부재로 추진력 잃다

구글 워크스페이스가 의뢰한 설문조사에 따르면 기업 경영진은 직원보다 인공지능에 대해 훨씬 강한 기대감을 보이고 있지만, 다수의 직원은 체계적인 교육과 명확한 AI 로드맵이 부족하다고 느끼고 있다. 해당 조사에서 경영진은 AI가 자사에 의미 있는 긍정적 영향을 미쳤다고 답할 가능성이 직원보다 15% 더 높았다. 반면 AI로 인한 변화에 적응할 준비가 돼 있다고 답한 직원은 3명 중 1명에 그쳤다.…