IDC도 이제 52시간 근무제에 맞게 진화하여야 한다. 빅데이터와 AI는 그들의 그러한 계획에 많은 도움을 줄 수 있는 것이다.

티쓰큐 AI사업부 이승훈 실장(사진:최광민 기자)
티쓰큐 AI사업부 이승훈 실장(사진:최광민 기자)

사실 빅데이터, 인공지능 기술에 대한 경험과 사례들을 살펴보아도 IDC에 그러한 기술들을 적용하여 ROI를 획기적으로 개선했다는 사례들을 국내에서 찾기가 쉽지는 않다.

IDC의 IT인프라 관리 기법은 고정 임계치 기반 모니터링에서 동적 임계치 기반 모니터링으로 발전하여 왔고, 이제는 빅데이터와 AI기술을 활용한 빅데이터 분석 기술을 결합한 선 감지(Multi-Variant & Machine Learning) 솔루션을 활용하게 되는 시점에 도달해 있다.

국내 IDC의 관리자들은 현재의 IT인프라 설비들이 매우 훌륭하다는 것을 충분히 알고 있으나, 예기치 못한 사고나 원인을 알 수 없는 에러나 트러블, 장애에 대응하는데 많은 어려움을 겪는것도 사실이다. 현재의 인프라는 IT설비자체의 에러보다는 운영, 특히 애플리케이션 개발단계를 거쳐 서비스 단계에서 사고를 겪는 경우가 대부분이다.

그러나, 이제 IDC 관리자들은 빅데이터와 AI기술을 활용하여 IDC 운영에 더욱 효율성을 제공할수 있게 되었다. 기존 장애예측에 대한 접근은 장애 사전 예방을 통한 가용성 및 품질 향상을 꾀하는 측면에서 주로 MTBF(Mean Time Between Failure) 중심으로 서비스의 영향도를 예측해 왔었으나 그 정확성 측면에서 의문이 있었던 게 사실이다.

이제 관리자들은 실제 서비스 장애가 발생하기 이전에 예상되는 장애와 문제가 되는 리소스를 예측하여, 장애를 사전에 예방할 수 있다.

관리자들은 빅데이터와 인공지능 기술을 활용하여 예를 들면 애플리케이션의 메모리 Leak 현상, CPU Spike,DB Pool Consume Up 현상 등의 잠재적 소프트웨어 이슈를 사전에 발견하고 갑작스런 리소스간 상관관계의 절단을 Metric 변화를 통해 발견함으로써 Discovery 주기 이전에 변경에 대한인지와 사전 조치가 가능하게 되었다. 즉, 설비 이상이나 다운 징후에 대한 예측도를 사전에 파악하고 SW적인 문제인지 HW적인 문제인지 예측할 수 있게 되었다.

이로써 IDC관리자들은 리소스별 시간대별 정교한 임계치 설정과 같은 운영/분석적 업무 절감을 경험할 수 있고 별도의 서비스 모델링 업무 및 모델 불일치를 제거할 수 있게 되었다.

또한, 대형 IDC 관리자들은 빅데이터와 AI를 통해 소스코드 레벨의 이상징후를 탐지하고 소스코드 변동에 따른 타 시스템의 영향도와 토폴로지차원의 경고, 시스템간의 상관관계에 대한 즉각적인 알람 등을 활용할 수 있게 되는 소스코드 레벨에서의 자산관리와 거래추적을 통해 대형 시스템의 매우 세세하고 실질적인 End-to-End 모니터링을 구현할 수 있게 되었다.

결론적으로 “IDC도 이제 52시간 근무제에 맞게 진화하여야 한다. 빅데이터와 AI는 그들의 그러한 계획에 많은 도움을 줄 수 있는 것이다”

저작권자 © 인공지능신문 무단전재 및 재배포 금지