[AI윤리] AI의 결정은 따라야 하는 것인가?
1018 발제
AI의 결정은 따라야 하는 것인가?
AI는 수많은 데이터 셋을 기초로 학습을 토대로 상당한 수준의 의사결정을 보여준다. 데이터 셋에 대한 편향성이나 대표성에 문제가 없다고 한다면, 이를 토대로 판단한 의사결정은 정당하고 따라야 하는 것인가? COMPAS와 같은 범죄자의 재범율을 구하는 AI 프로그램이 만일 정당한 결과라면, 대출 상담을 해주는 AI 프로그램이 대출한도를 결정해 준다면, MRI나 CT 촬영한 영상을 보고 어떤 의사 결정을 한 AI의 의견은 정당하고 따라야 하는 것인가? 우리는 데이터 셋에 대한 문제점에 집중하고 있지만, 이러한 문제점에 결함이 없다고 한다면 AI의 의견에 따르는 것이 바람직한 것인가?
이 발제에 대한 답변을 작성할때 이책이 굉장히 많은 생각을 주었다. 많은 정도가 아니라, 그동안 인공지능을 통해 내려지는 판단의 결과에 대하여 왜 항상 애매한 의문을 가질 수밖에 없었는지를 통쾌하게 설명해준다. 책은 이런 사람들이 써야 하는 것 같다. 이 책은 아주 보물이다.
내 생각은 : 바람직하지 않다.
우선, 데이터 셋에 대한 편향성과 대표성에 문제가 없다는 가정을 만족하려면, 그 데이터 셋은 인간의 삶과 동떨어진 자연 현상으로부터 얻어낸 데이터 셋 일 것이다.
지역적, 시대적 문화의 차이를 필연적으로 가질 수 밖에 없는 인간이,
개개인 각각의 개성을 가지고 만들어내는 서로 다른 데이터들로부터 대표성을 가진 데이터를 추출하는 것은 불가능하다. 천편일률적으로 같은 공간에서 완벽히 동일한 복제 집단으로 살아간다면 가능할지 모르겠다.
그렇기에 인간에 관한 데이터라는 모집단에서 완벽한 표본을 뽑는 것은 애초에 불가능하다. 완벽한 대표성을 갖는 범죄자 데이터는 만들어질 수 없다.
그렇다고 지구 상 모든 범죄자들의 데이터를 모은다면 그것은 결국 모집단이라 대표성을 논할 수 없다. 그리고 이 데이터 또한 특정 시기의 데이터일 뿐 미래를 대표하리라 가정할 수 없다.
결국 편향성과 대표성의 문제를 완벽히 해결하는 데이터라면 우리가 AI를 개발하여 판단을 기대해볼 내용이 아니라 매우 예측 가능하거나 인간의 삶과 동떨어진 데이터일 것이다.
편향성을 최소화하고 최대한의 대표성을 갖는 데이터셋을 이용했어도, AI모델이 판단을 내린 결정을 따르는 것은 역시 바람직하지 않다.
AI 모델이 판단 과정은 데이터의 수치들이 갖는 상관관계에 근거한다.
그리고 상관관계란 아래 글에서 말하듯이 어떤 것들의 관계가 밀접하다는 뜻이지 어떤 것이 다른 어떤 것의 원인이 됨을 보여주는 것이 아니다.
출처 : https://dbr.donga.com/article/view/1303/article_no/6894 (여기 기사에서 매우 일목요연하게 설명을 잘함!)
인공지능은 이 상관관계를 매우 빠른 시간에 찾아내어 보여준다. 이것은 인공지능의 매력이기도 하지만, 인간으로 하여금 상관관계가 곧 인과관계인 것처럼 해석하여 판단할 여지를 준다.
발견된 상관관계가 인과 관계인지는 인간이 충분히 숙고하고 여러 번의 관찰을 통해 검증해야 할 부분이다. 따라서 이러한 과정 없이 인공지능의 판단 결과를 따르는 것은 바람직하지 않으며 새로운 문제를 야기할 수밖에 없다.
+ 쓰고 나니 드는 생각,
인과관계가 명확한, 그러니까 밝혀진 의료 진단에서 쓰이는 결과에 대하여는 어떻게 생각하는가?
의료분야에서는 이게 인과관계가 밝혀진 것 아닌가?