Risk Management Theatre: On Show At An Organization Near You by Hubert Shin

원문보기

현재 쓰고 있는 새로운 책에 들어갈 컨셉 중 “위험 관리 극장(risk management theatre)” 이라는 것이 있다. 이 명칭은 내가 보아온 콘트롤(제어) 중심의 상명하복식의 조직에서 죄가 없는 사람들의 삶을 고통스럽게 만들면서 어떻게 앞으로 죄 짓는 것을 피해갈 수 있는지 알려주는 관리방식을 표현하기 위해 쓴 말이다. (이 말은 보안 극장(security theatre)과 유사하게 만들어졌다.) 위험 관리 극장은, 누군가는 반드시 멍청하거나 나쁜 짓을 할 것이라는 가정하에 프로세스를 최적화 하는 경우인데(Bjarte Bogsnes가 관리에 대해 이야기 한 것에서 인용), 다시 말하면, 신뢰할 수 없는 누군가가 있을 수 있다는 의미이다. 즉, 그 몇몇을 위해 조직 구성원 모두에게 예방 차원의 콘트롤을 수행하는 전략이다.

안타깝게도 위험 관리 극장은 큰 조직들내에 어디에나 있다. 이 이론의 지배하에 X 이론 패러다임이 지속적으로자리잡고 있다. 상명하복 식의 콘트롤의 대안을 난 적응적 위험 관리(adaptive risk management)라 부르는데, 이것은 인간 중심관리 이론들(Ohno, Deming, Drucker, Denning, Dweck 등이 수행한 연구)과 복잡한시스템이 어떻게 동작하는지에 대한 연구 등에서 나온 것이다. 적응적 위험 관리는 고민하고, 투명화하고, 실험하고, 빠르게 피드백하는 반복을 통해 이루어진다.

여기에 두 가지 접근의 차이에 대한 몇 가지 예제가 있다.

적응적 위험 관리(사람들이 투명성과 피드백을 향상 시키면서 문제를 식별하고 즉흥성과 실험성을 통해 그 문제를 해결하는 방법)
위험 관리 극장 (죄가 없는 사람들에게 콘트롤(제어)과 프로세스를 통해 그들의 삶을 고통스럽게 만들면서 어떻게 하면 향후 죄 짓는 것을 피해갈 수 있는 지 가르쳐주는 방법)
지속적 코드 리뷰 : 엔지니어 사이에서 체크인 전에 자신의 코드를 확인해 달라고 부탁하는 기술 리더는 팀이 체크인한 모든 코드에 대해 검토하고 코드 리뷰 툴을 통해 Trunk 존재하는 코드에 대해 코멘트   있도록 하는 것이다.

필수적 코드 리뷰 : 툴을 통해 Trunk  코드가 병합되는 변경이 진행   누군가에 의해 승인을 받는 체크인 게이트가 존재하는 것이다 이것은 비효율적이고 성능을 포함한 중요한 회귀 테스트 피드백의 지연을 야기한다.
빠르고, 자동화된 유닛과 인수 테스트 : 몇분안에 완료되는 유닛테스트와 몇 십분 정도 소요되는 인수 테스트를 통해 Trunk로 커밋 되기 전에 자신의 워크스테이션에서 수정된 내용을 검증할 수 있도록 하는 것이다. 
메뉴얼 테스팅 : 특히 다른 팀이 수행하거나 분산 환경에서 수행되는 경우 필수적 코드리뷰와 마찬가지로 시스템 전체 변경 결과에 대해 피드백을 늦추게 되는 테스트 방식이다. 
디플로이 파이프라인 : 체크인된 내용부터 모든 릴리즈까지의 변경을 추적할  있는 시스템으로 위험한 변경을 찾아내고 거부할  있고 자동화된 테스트와 매뉴얼 검증을 동시에 수행   있다.
종합적 문서 꾸러미 : 복잡하지 않은 시스템에서 장애가 발생하는 경우장애의 주요 원인이  사람이  에러를 찾아낼  있도록 매커니즘 또는 카테시안 패러다임 안을 발견할  있는 것이다.
상황적 인지 : 보다 쉽게 모니터링 하기 위해 툴을 통해 상황을 이해하고 관련된 데이터를 분석하고 연관지을 수 있는 것으로 프로세스, 비즈니스, 시스템 레벨의 측정 지표 뿐만이 아니라 특정 이벤트에 대한 토의 내용까지도 모두 포함하는 인지 방법이다. 
의무들의 분리 : 지식 고유, 피드백, 협업을 방해하는 장벽으로 움직이게 되는 것으로 각 이벤트에 대한 효과적 대처를 필수로 할 수 있는 효과적인 반응에 대한 상황 인지를 감소시킨다.

하지만, 반대의 경우가 적절한 환경이 있다는 것을 강조하고 싶다. 만약 당신의 조직이 딜리버리와 운영 프로세스가 문제가 많고 숙련되지 않았다면, 콘트롤(제어)을 수행하는게 개선을 위해 보다 효과적일 수 있다. 하지만 이것은 끝까지 지속할 수 있는 대책이라기 보다는 잠시 동안쓸 수 있는 방법이고, 함께 일할 사람의 동의하에 진행하는 것이 좋다.

여기에 IT 분야에서 두 접근의 차이점이 존재한다.

적응적 위험 관리(사람들이 투명성과 피드백을 향상 시키면서 문제를 식별하고 즉흥성과 실험성을 통해 그 문제를 해결하는 방법)
위험 관리 극장 (죄가 없는 사람들에게 콘트롤(제어)과 프로세스를 통해 그들의 삶을 고통스럽게 만들면서 어떻게 하면 향후 죄 짓는 것을 피해갈 수 있는 지 가르쳐주는 방법)
원칙 기반 역학 : 원칙들이 만들어질 때 구상되지 않은 상황에 원칙들이 적용되는 것이다.  규칙 기반 정역학 : 새로운 기술과 프로세스들(예를들어 클라우드 컴퓨팅)을 만났을 때 규칙을 다시 적도록 하는 것이다. 
 투명성을 이용하여 사고나 나쁜 행위들을 예방 : 모두가 하는 일을 모두가 쉽게 알 수 있다면, 모두두가 조심을 하게 된다. Louis Brandeis가 말했듯이 "공공성은 사회 및 산업 질명들에 꼭 맞는 제제 수단이다. 햇살이 가장 좋은 전염병을 막는 도구이듯이, 전기불은 가장 효율적인 경찰이다"  콘트롤(제어)를 이용하여 사고나 나쁜 행위를 예방 : 이 접근법은 큰 문제에 대한 반응으로 법제정자들이 액션을 취하는 방법이다. 그러나 콘트롤은 예상못한 문제들에 재빠르게 대처해야 할 때 제한되는 경우가 많다. 이것은 새로운 위험들을 야기하고, 표준화된 변경 프로세스가 매우 느린 경우 긴급한 경우에도 프로세스에 의존하게 되는 경우를 만든다. 
시스템이 실패할 수 있다는 것을 수용 :  모든 시스템과 환경은 지속적으로 변화한다. 그리고 모두가 이성적으로 받아들일 의사결정을 내리는데에는 항상 정보가 부족하다. 사람들은 문제를 해결하고 우리는 판단하는 사람에 의존해야만 한다.  사람이 문제라는 것을 가정 : 만약 사람들이 프로세스를 올바르게 따른다면 나쁜일이 전혀 일어나지 않을 것이라는 생각이다. 콘트롤(제어)는 "나쁜 사과"를 찾아내기 위해 존재한다. 현실에서 프로세스는 해석과 적응이 필요하다는 것을 무시하는 경우이다. 
협업, 실험 시스템 레벨의 개선하는 사람들에게 보상 :  사람들은 시스템 레벨 지표를 개선하려고 협업한다. 예를들어 리드 타임이나 서비스 복구 시간 따위의 지표를 말이다. 개인의 "생산성"이나 기능 수준의 보상은 없다. 지엽적으로 이성적인 의사결정을 내리고  시스템 레벨의 장애들을 또한 받아들일 수 있다.  개인의 "생산성"에 기준한 보상과 지엽적 최적화 : 예를들어, 운영 담당자들이 쓰루풋에 대한 지출이나 품질에 대한 지출에 의한 속도를 위해 개별자들이 최적화 하는 것을 말한다. (심지어 이것이 잘못된 고전적 이분법인데도 말이다) 
지속적으로 배우고 실험하는 문화를 만듬 : 사람들은 배울 수 있는 실수에 대해 열러진 토의를 수행하고 시스템을 개선하기 위한 목적으로 화가 났던 문제나 고객 서비스 문제 이후 어떤 피드백을 받고 싶은지 포스트 모텀(post-mortems)을 수행한다. 사람들은 서로 나아지기 위한 새로운 시도와 실험을 서로 장려한다(많은 가정들이 실패할 수 도 있다는 기대 하에서도 말이다)  두려움과 불신의 문화를 만듬 : 에러 대한 책임 부족, 생략, 완료 실패에 대해 지적을 장려한다. 만약 누가 이야기 전에 난 아무것도 안 한다면, 문제간 생긴 경우 책임을 질 필요가 없다고 생각하게 된다. 
실패들은 배울 수 있는 기회 :  이것은 콘트롤된 환경이 필요하고 결과가 적절히 완화될 수 잇어야 한다. 이러한 상황에서 실패라는 개선하기 위한 기회를 장려한다.  실패는 사람의 에러에 의한 것임 :  (어떤 프로세스를 올바로 따르는 것에 대한 실패) 그리고 첫번째 반응은 책임질 사람을 찾고, 그들을 벌주기 위해서이고, 추가적인 프로세스나 제어 방식으로 미래의 문제를 해결한다.  

위험 관리 극장은 그저 고통스럽고 지속적인 딜리버리의 적용을 막기만 하는 것은 아니다 (물론 일반적인 지속적인 개선 또한 방해한다). 이것은 실제로 위험하다. 왜냐하면 첫째로 두려움과 불신의 문화를 만든다. Bogsnes는 이에 대해 다음과 같이 말한다. "만약 전체 관리 모델이 불신과 잘못된 행위에 대한 콘트롤(제어)이 중심이라면, 이 관리의 결과는 우리가 무언가를 예방하는 것 이상의 무엇인가가 될 것이다. 사람들이 점점 더 범죄자처럼 대해지면, 그들의 행동이 점점 더 범죄자 스러워 질 수도 있다." 

이러한 조직 문화는 우리가 직장을 잃을까봐 겁먹은 사람들을 볼 때나, 뭔가 잘못된 것으로부터 스스로를 보호하려 행동하는 사람들을 볼 때나, 또는 정보를 독식하여 스스로가 반드시 필요해지도록 만드는 사람들을 볼 때 주로 나타난다.

물론 콘트롤(제어)라는 IT 거버넌스 프레임웍의 큰 축을 안팍으로 모두 나쁘게만 보려는 의도는 아니다. 정말고 제대로 적용한다면, 그들은 효과적인 위험 관리에 필수적인 요소로 받아들여질 수도 있다. 예를들어 ITIL이 가벼운 변경 프로세스를 위하여 위험 관리에 적응적 접근을 수행할 수 있는 것처럼 말이다. 우리가 이것을 결정할 수 있는 것은 결국 이들 프레임웍이 어떻게 수행하느냐이다. 조직문화와 오랫동안 엮여 이러한 프레임웍과 같은 방법이 조직 문화의 영속성을 결정되고 사용된다.

핑백

덧글

  • 2014/12/12 13:49 # 삭제 답글

    여러분으로 입력에 대한 감사의
댓글 입력 영역