인공지능(AI) 챗봇 ‘이루다’ 개발사 스캐터랩이 1월15일 이루다 데이터베이스(DB)와 학습에 사용한 딥러닝 대화 모델을 폐기하기로 했다. AI 학습 방식과 학습에 활용한 데이터가 부적절하다는 지적 때문이다.
이루다 공식 페이스북 캡처
스캐터랩은 15일 “이용자들의 불안감을 고려해 ‘이루다’ 데이터베이스 전량 및 학습에 사용한 딥러닝 대화 모델을 폐기하기로 했다”고 밝혔다. 다만 “이루다 DB는 비식별화(익명화) 절차를 거쳐 개별적이고 독립적인 문장 단위로 이루어져 개인 식별이 가능한 데이터는 담고 있지 않다”고 했다. 또 “딥러닝 대화 모델은 비식별화 절차를 거친 데이터를 토대로 대화 패턴만을 학습했기 때문에 개인정보가 빠져나갈 위험이 전혀 없다”고 설명했다.
앞서 이루다는 회사에서 예상하지 못한 학습 알고리즘으로 장애인, 성소수자, 임산부 등을 대상으로 차별발언을 해 논란이 일었다. 실제로 한 사용자가 “네가 장애인이면 어떻겠냐”고 묻자 이루다는 “죽어야지 뭐”라고 답했다. 레즈비언에 대한 질문에는 “진짜 싫다”, “소름끼친다”고 답변했다. 다른 사용자가 “흑인이 왜 싫은데”라고 묻자 이루다는 “모기같다. 징그럽게 생겼다”라고 답해 인종 혐오도 드러냈다.
이루다 개발과정에서 고객들의 개인정보를 소홀히 다뤄 개인정보보호법을 위반했다는 의혹도 받고 있다. 스캐터랩은 이루다를 만드는 데에 연애 분석 앱인 ‘연애의 과학’ 이용자들의 카카오톡 데이터를 활용했다. 연애의 과학에서 수집한 카카오톡 데이터는 100억건이다. 이 중 1억건이 이루다 DB에 들어갔다. 이 과정에서 익명화 처리를 충분히 하지 않고 회원들이 동의한 범위를 넘어서 데이터를 활용했다는 것이다. 또 연인들의 대화 데이터를 직원들끼리 사내 메신저에서 업무 외적으로 공유했다는 의혹도 받고 있다. 연애의과학 이용자들은 스캐터랩이 개인정보를 유출했다면서 집단소송을 준비하고 있다.
현재 한국인터넷진흥원(KISA)과 개인정보보호위원회가 의혹에 대해 조사하고 있다. 스캐터랩은 조사가 끝나는 즉시 이루다 DB를 폐기할 방침이다. 이루다 개발에 활용한 앱에서 데이터 활용을 원하지 않는 이용자로부터 신청을 받은 후 해당 데이터를 모두 지울 예정이다. 관련 후속 조치는 각 어플리케이션 공지를 통해 안내 받을 수 있다. 향후 신규 가입과 서비스 이용시에는 개인정보 수집, 이용 동의 절차를 강화할 계획이다.
글 jobsN 김하늘
jobarajob@naver.com
잡스엔
평일엔 학교, 주말엔 경기장…투잡 뛰는 선수들 (0) | 2021.01.19 |
---|---|
수수료 떼먹고 훼손 책임 떠넘겨, 계속되는 택배사 갑질 (0) | 2021.01.19 |
오늘부터 카페 내 취식 가능…헬스장·노래방도 영업 가능 (0) | 2021.01.18 |
정의선 현대차 회장, 60억원짜리 뉴욕 아파트 샀다 (0) | 2021.01.15 |
효연 “내가 호구로 보이나, 참는건 오늘까지” (0) | 2021.01.15 |