티스토리 뷰

이슈

이루다, 데이터3법

상어악어 2021. 9. 9. 16:17
반응형

이번에는 최근에 유명했던 이루다에 대해 한 번 다뤄보려고한다.

 

얘가 이루단데 실제 사람은 아니고 AI챗봇이다.

AI챗봇하면 우리한테는 익숙한 심심이 선배님이 계시지만

이루다는 실제 연인들의 대화를 딥러닝해서 정말 사람과 대화하는 듯한 느낌이든다.

나도 몇번 해봤는데 진짜 사람같기도 했다.물론 몇번해보니까

대화가 자연스럽게 이루어지진 않긴 했지만..

이렇게 인기를 끌었던 이루다가 서비스종료를 하게됐는데

잘나가다가 왜 서비스종료를 하게됐을까

그 이유는 개발 및 서비스 과정에서 개인정보 유출을 당했다고 주장하는 피해자가 있었기 때문이다.

실제로 구글에 쳐보면 집주소,은행계좌,실명이 아무런 필터링없이 나온 짤들도있다.

귀찮아서 가져오진않았지만 이건 심각한 문제다.

정보가 그대로 유출되는것도 문제지만, 또 하나 지적받는 사항은

이루다의 딥러닝의 재료는 '연애의 과학'이용자들의 카톡 데이터인데

자신들의 대화내용이 AI챗봇에 이용된다는 사항을 정확히 알리지않고 동의 또한 제대로 받지않았다.

이에 이루다 개발사 스캐터랩은 가명정보니까 괜찮다고 한다.

 

내가 이루다에 대한 글을 쓰는 이유는 최근 IT계의 이슈여서도 있지만

내가 예전에 올린 글 데이터3법과도 관련이있는 글이어서 데이터3법과 연관지어 한번 정리해보고 싶어서 올리게된거다.

데이터3법은 내가 예전에 올린 글에 잘 나와있지만, 가명정보라는 개념이 나왔으니 다시 한 번 정리하자면

개인정보가 홍길동 23세 010-1234-5678 이렇게 개인의 정보가 다 드러나있다면

가명정보는 홍OO 20대 010-12XX-XXXX 추가적인 정보없이는 개인을 특정지을 수 없게 만든 정보다.

그러면 이렇게 지적받고 있는 스캐터랩의 입장을 한 번 보겠다.

 

출처:"가명정보니까 괜찮다"는 이루다 개발사…네이버는 달랐다 - 매일경제 (mk.co.kr)

 

"가명정보니까 괜찮다"는 이루다 개발사…네이버는 달랐다

네이버 CPO "가명정보도 보호해야"…현행법보다 꼼꼼한 절차 수립 "AI 성능 뛰어나도 이용자가 불안하면 좋은 서비스 아냐"

www.mk.co.kr

 

여기서 내가 드는 의문이 두 가지 있다.

1.가명 처리를 하지 않은 정보는 가명정보인가 아닌가

2.가명 처리되지 않은 정보가 유출되면 위법인가 아닌가

사실 2번은 1번이 가명정보냐 아니냐에 따라 위법인지 아닌지 갈리니까

중요한건 1번이라고 보면 되겠다.

지금 아직 이루다 개인정보유출에 관한 사건은 개인정보보호위원회가 조사하고있는 중이라

어떻게 결과가 나올지는 조금 더 지켜봐야 안다.

아닐 수도 있지만 지금 개인정보보호위원회가 조사하는 것들 중에 하나가

이루다의 정보 유출을 개인정보로 보냐 가명정보로 보냐가 아닐까 생각한다.

왜냐하면 데이터3법에 의하면 기업의 상업적목적으로 이용하는 가명정보는 사용자의 동의 없이 사용할 수 있기 때문이다.

이미 데이터3법이 통과됐기때문에 기업이 가명정보를 사용하는 것은 문제 될 일이 아니다.

그런데 스캐터랩은 가명처리를 제대로 하지 않았다. 그리고 이 필터링되지 않은 정보가 유출되었다.

이걸 개인정보라고 봐야하나 가명정보라고봐야하나?

상당히 애매한거 같긴하다.

집주소,계좌번호,실명 등이 유출되었다고 했으니 얘네들을 좀 보자면

일단 집주소가 유출되어도 여기 사는사람이 누구인지 정확히 알 수 없긴하다.

계좌번호가 유출되어 예금주를 알 수 있다고 해도 이름만 알뿐이지 어디사는지 나이가 몇인지 등의 정보는 알지 못한다.

실명도 유출이 되었다고해도 이름만 알 뿐이지 추가적인 정보가 없으면 이러한 정보들은

특정인을 알 수 없게 돼있긴하다.

가명 정보의 개념에 의하면 특정인을 알 수 없게 돼있으니 가명정보라고 볼 수도 있지만

원래였으면 실명 홍OO 집주소 경기도 수원시 OO동 ..,계좌번호 942-XXX-XX-XXX 이렇게

가명처리를 해야하는게 맞다.

이미 집주소가 노출돼었는데 안전하다고 볼 수 있을까?

사용자의 다른 정보가 또 노출안된다는 보장이 있을까?

결과가 어떻게 나올지는 모르겠는데

내 생각으로는 위법은 아닐 수도 있을 거같다.

가명처리가 되지는 않았지만 가명정보는 맞으니까

그러나 개인의 데이터활용에 대한 공지를 명확히 하지 않은 점과

가명정보 처리 부실과 유출은 명백한 잘못이라 생각하고,

이 일로 인해 많은 사람들이 기업의 데이터 활용에 대한 불안과 관심을 갖게 될 것이라고 생각한다.

데이터3법글을 쓸 당시에는 가명정보로 활용한다면

충분히 괜찮을 것이라고 생각했는데

내가 카카오톡에 대화하던 내용이 그대로 챗봇에 사용된다고생각하면

조금 싫기도하고 두려울 수도 있을 것 같다.

4차산업에 들어가며 데이터활용이 중요해진만큼

데이터의 보호도 중요해져야 할 것 같다.

이번에 글을 쓰면서 내가 쓴글의 주제에 관련한 이슈들이 그것도

최근에 나타나면서 뭔가 뿌듯함을 느끼기도했고

스스로 더 흥미를 느끼기도했다.

반응형

'이슈' 카테고리의 다른 글

갤럭시 GOS 벤치마크 조작 논란  (0) 2022.03.06
백준 502 Bad Gateway  (0) 2022.01.24
공지사항
최근에 올라온 글
최근에 달린 댓글
Total
Today
Yesterday
링크
«   2024/05   »
1 2 3 4
5 6 7 8 9 10 11
12 13 14 15 16 17 18
19 20 21 22 23 24 25
26 27 28 29 30 31
글 보관함