오늘도 여성 A 씨의 의심은 의심으로만 끝났다. ‘이렇게 사소한 것도 성차별적이라고 말할 수 있을까’란 의문이 들었기 때문이다. 수많은 여성이 A 씨와 같은 고민을 하는 동안, 사회는 또 다른 차별을 하나 더 축적하고 있다. 오랜 시간 우리 사회에는 성 고정관념이 고착돼왔으며, 이러한 양상이 학습데이터로 누적되면서 여성의 존재를 지워나갔다. 공백으로 자리한 젠더 데이터를 어떤 방식으로 메워나가야 할까. 빅데이터 알고리즘에 누적된 성차별적 데이터가 여성의 삶에 어떤 영향을 미쳤는지 알아봤다.

하주언 기자 gkwndjswn2@naver.com
정채원 기자 jcw990531@naver.com
곽예은 기자 yeeun3636@naver.com
김가희 기자 skyballoon00@naver.com
김도헌 기자 heenglow@naver.com
노희주 기자 nnwriggle@naver.com


‘불편함’은 여성들이 만들어낸 허상이 아니다

아무도 문제 삼지 않았던 사소한 차별들
  같은 세상 속에서 다른 일상을 경험하는 사람들이 있다. 전체 인구의 절반을 차지하는 여성은, 남성과 사뭇 다른 하루를 마주한다. 매우 사소한 부분에서조차 이 차이가 발생하지만, 이미 우리 삶에서 당연한 것이 돼 미처 의식하지 못하는 경우가 많다.
  영국의 저널리스트이자 여성운동가인 캐럴라인 크리아도 페레스의 책 『보이지 않는 여자들』은 여성이 표준이 될 수 없는 사회를 향해 문제를 제기한다. 이러한 문제는 실내 표준 온도와 같이 사소한 부분에서도 발견할 수 있다. 실제로 여성의 신진대사율은 남성보다 35% 낮지만, 실내 표준 온도는 40대 남성의 대사율을 기준으로 정해졌다. 결국 여성에게 적당한 실내 온도는 표준보다 평균 5도 정도 차이가 나, 여성은 실내에서도 쉽게 추위를 느끼는 불편을 종종 겪기도 한다.
  이러한 차이에서 나오는 불편함은 여성의 삶에 아주 자연스럽게 녹아있다. 심지어는 바지 주머니 크기에서조차 여성과 남성 간의 차이가 발생한다. 유명 SPA브랜드 네 곳의 여성용 청바지 주머니에 손지갑을 넣자, 네 곳의 바지가 모두 주머니 위로 지갑이 튀어나왔다. 그러나 남성용 청바지에는 지갑이 들어가고도 손가락 두 마디 길이의 여백이 남았다. 성별에 따라 주머니에 수납할 수 있는 물건의 한계가 발생하는 것처럼, 여성은 남성이 경험하지 않는 일상의 차별을 마주하게 된다.

데이터에서 지워진 여성은, 사회에서도 지워진다
  이렇듯 여성이 일상 속에서 사소한 불편을 겪는 이유는 바로 ‘젠더 데이터의 공백’ 때문이다. 젠더 데이터란 사회 전반의 의식이나 생활 양식에서 발생하는 성별의 특성과 차이를 데이터화한 것이다. 따라서 젠더 데이터의 공백이 있다는 것은 어느 한 성별의 데이터가 결핍돼있는 현상을 의미하는데, 대부분 여성의 데이터가 부족한 것이 현실이다. 그리고 이러한 젠더 데이터 공백은 남성이 표준이 되는 사회 분위기를 형성하는 데 결정적인 역할을 한다.
  젠더 데이터 공백으로 만들어지는, 남성이 기본값인 사회의 근본적인 문제는 ‘남성에게 치우쳐진 사회적 제도’가 만들어질 수 있다는 것이다. 이는 자연스레 ‘남성 중심 사회’로 발전하게 되며, 사회에서 여성이 설 자리가 줄어들게 되는 가장 큰 원인으로 작용한다. 그렇다면 젠더 데이터 공백으로 인해 발생한 여성 차별 문제들에는 어떤 것들이 있을까.

 

“여성을 배제하거나, 성차별을 답습하거나”

무급노동 : ‘공짜로 착취 가능한 자원’
  가장 대표적인 젠더 데이터 공백은 여성의 무급노동이다. 최근엔 남성도 무급노동에 참여하지만, 우리나라 여성은 남성보다 하루에 평균 34분을 더 일한다. 단, 무급으로 말이다. 
  여성의 노동을 데이터로 기록하지 않음으로써 발생한 ‘공백’은 어떤 문제를 낳을까. 책 『보이지 않는 여자들』의 저자는 공공서비스 예산을 삭감하자, 여성이 더 많은 무급노동은 감당해야 했던 영국의 사례로 이를 설명한다. 정부는 무급노동 데이터를 기록하지 않아 얼마나 많은 여성이 타의로 돌봄노동을 담당하는지 인지하지 못했다. 그 상태에서 공공서비스 예산을 대폭 삭감하자 돌봄 서비스가 필요한 아이·노인 돌봄노동이 여성에게 전가됐다. 결국, 떠넘겨진 돌봄노동으로 인해 여성들은 직장을 포기하거나, 유급 노동의 시간을 줄여야 했다. 그 결과, 예산 삭감 2년 만에 여성 실업률은 20% 증가했고, 113만 명의 실업자를 낳았다. 이 사례는 여성의 그림자 노동을 젠더데이터화 하지 않음으로써, 결국 여성이 배제됐음을 보여준다. 이를 통해 알 수 있는 것은 젠더 데이터 공백이 단순히 불편한 것을 넘어 정책의 실패, 여성 배제로 이어질 수 있는 문제라는 사실이다.

편향된 빅데이터 알고리즘이 탄생하는 과정
  그렇다면, 여성이 배제되고 남성이 중심이 되는 사회의 미래는 과연 장밋빛일 수 있을까.  논문 「빅데이터 알고리즘의 성차별 가능성에 관한 실증적 분석과 개선방안」에서는 알고리즘이 지원자를 선별하는 ‘채용알고리즘’을 제작·실험했다.  
  우선, 여성과 남성 지원자의 능력을 동등하게 설정한 후 △성별 △자녀 유무 △연령 등의 변수를 기입했다. 그리고 실제 회사에서 채용을 담당하는 평가단이 이들의 업무 능력 및 책임감 등을 평가했다. 이들이 평가한 고용 학습데이터들로 분석 및 개발된 알고리즘의 결과는 남성 채용률 약 14~15%, 여성 채용률 약 9~11%였다. 여성과 남성의 능력이 동등함에도 불구하고, 결과적으로 남성 채용률이 더 높은 이유는 무엇일까. 원인은 바로 알고리즘 개발을 위해 수집한 학습데이터에 있다. 학습데이터들이 성차별적일 경우, 이를 토대로 개발된 알고리즘도 편향성을 띠게 된다. 실제로, 알고리즘 개발 과정에서 성별을 제거하자 여·남 간 채용률이 동등하거나, 오히려 여성의 채용률이 남성보다 높았다. 
  답습된 성 편견의 일례로, 채용알고리즘 개발 과정에서 지원자들의 업무 책임감을 평가한 학습데이터를 들 수 있다. 여기서도, 성별에 따른 능력 차가 없었음에도 남성은 63%가 고득점을 얻고, 여성은 단 37%만이 고득점을 얻었다. 결국, ‘여성은 남성보다 책임감이 부족하다’라는 식의 성차별 인식이 쌓여 편향된 학습데이터를 형성하고, 이를 기반으로 성차별적인 선별 알고리즘이 만들어진 것이다.

 

이젠 차별의 ‘고리’를 끊어내야 할 때

빅데이터, 편향된 사회를 바로잡으려면
  앞서 말했듯, 학습데이터가 편향됐다면 이 데이터를 기반으로 만들어지는 알고리즘 역시 한쪽으로 치우칠 가능성이 크다. 그리고 편향성을 띤 알고리즘은 사회의 편견을 더욱 강화한다. 따라서 개발 과정부터 공정한 학습데이터를 수집하는 것이 중요하다.
  해당 논문을 작성한 고려대학교 노동문제연구소 정희태 교수는 무엇보다 알고리즘을 투명성, 공정성, 책무성의 세 가지 원칙에 따라 개발해야 한다고 밝혔다. 덧붙여 누군가를 선별하는 시스템인 채용알고리즘에 있어선 제3의 감사시스템이 마련돼야 한다고 말했다. 학력과 성별, 인종 등 차별받는 집단을 대리하는 기관을 설립해 선별과정의 공정성을 평가해야 한다는 것이다.
  데이터에 의존하는 2020년, 우리는 앞으로 젠더 데이터를 어떻게 이용해야 할까. 앞서 채용알고리즘에서 성별 변수를 제거하자 공정한 결과가 나온 사실을 통해 알 수 있듯, 차별 가능성이 내포된 변수인 성별은 평가 시 배제돼야 한다. 결국, 젠더 데이터는 성별이라는 변수가 선별 평가에 영향을 미쳤는지 판단할 때 사용돼야 한다는 것이다. 정 교수는 차별받는 집단의 데이터, 젠더 데이터를 알고리즘 평가에 활용한다면 차별 요소가 제거된 공정한 알고리즘을 끌어낼 수 있을 것이라 말한다. 기존 성별 편향이 문제가 됐던 의료, 노동, 정치, 도시계획 등의 빅데이터에 젠더 데이터가 평가지표로 활용된다면, 이후 만들어지는 빅데이터에서는 성차별 문제를 해소할 수 있다는 의미다.

세상을 바꿀 여자들, ‘프로 불편러’를 자처하다
  남성이 기준인 세상에서 차별을 인지한다는 것은 쉽지 않다. 심지어 여성임에도 인지하지 못한 수많은 성차별이 있다. 차별을 인지했다 하더라도 ‘내가 너무 예민한 것은 아닐까’와 같은 의심, “별 게 다 불편하네”와 같은 외부의 시선이 스스로를 움츠러들게 할지도 모른다. 그러나 우리는 사소한 것에 예민하게 반응하는 것이 아니라, 사소한 것까지도 여성을 차별하는 사회를 이제서야 비로소 인지한 것이다. 정 교수는 “불평등한 사회 구조를 인지하고, 이를 개선하기 위한 사회적 노력이 이어진다면 앞으로는 성차별의 재생산을 완화할 수 있을 것”이라고 전했다. 빅데이터가 성차별을 재생산하지 않도록, 그리고 지워진 여성의 목소리를 채워 나가기 위해 젠더 데이터 수집을 더는 미뤄선 안 된다. 지금까지의 사회가 그래왔다고, 앞으로도 그래야 할 이윤 없다.

 

저작권자 © 동덕여대학보 무단전재 및 재배포 금지