1. 들어가며

지능형 서비스 intelligent service, 개인화 personalization이런 기술에 대해서 이야기하다보면,
가끔,
사람들이 개인 정보 보호에 대한 염려를 언급하곤 한다.

신문에서는 잊을만하면 개인 정보 유출에 대한 기사가 실린다.



지능형 서비스 또는 데이터마이닝 기술에서 개인 정보 보호에 대한 논의는 조심스럽다.
지능적인 기능이란 게 하늘에서 뚝 떨어지는 마술이 아니고,
아무렇게나 처리하는 것도 아닌 것이고,
결국은 데이터를 수집하고, 수집한 데이터에게 기반한 처리이기 때문이다.


개인 정보 보호에 대한 학문적 연구들도 있고,
법적인 문제들도 있지고,
사회적인 합의나 언론의 태도 여러 논의할 것들이 있지만,
관련된 모든 범위를 언급하기에는 본인 능력이 부족하다.


(특히, 정보기술자체에 대해 거부감을 가지거나,

정보화 사회 자체에 대해 반대하는 사람들에게 설명은 아예 포기한다.)

여기에선
Textcube.com 을 중심으로 개인 정보 보호에 대한
생각을 약간 두서없이 이야기하려고 한다.

워낙 언급할 부분들이 많고,
평소 공돌이 일과 관련 적은 부분에 대한 생각이 부족해서 ,
갑자기 질문받았던
지난 태터캠프에서는 충분히 설명할 시간이 없었다.


2. 자체 서비스와 지능형 서비스는 분리되어 있다.

가장 먼저 언급할 부분은,

Textcube.com 의 블로그 기능을 처리하는 자체 서비스와
Textcube.com 에서 통계나 추천을 처리하는 부분인 Intelligence Service는 분리되어 있다는 것이다.

왜 이런 분리에 대해 언급하냐 하면, 각각에서 유지하고 있는 데이터가 다르기 때문이다.
지능형 서비스를 구축하든 안하든,
자체 서비스에서의 개인정보유출 문제는 그대로 남는 것인데,
지능형 서비스에 대해 개인정보보호 문제를 이야기하면서,
자체 서비스의 데이터에 대한 걱정과 혼동이 되면 논의내용이 너무 혼란스러워진다.


textcube.com 에서의 구분을 말하자면,

블로그에 가입하고, 글을 남기는 기능 등 블로그의 본연의 서비스를 구현하는 부분과

전문가 태그 추출, 연관글 추출하는 기능 등은 분리된 형태로 유지된다.


손쉽게 구분하기 위해,
이후부터
Textcube.com Base Service (TCBS= 블로그 자체 기능 구현) 와
Textcube.com Intelligence Service(TCIS = 지능형 기능 및 통계 기능 구현)
로 구분해서 이야기 해보겠다.


[대부분의 개인정보 피해 사례는 자체 서비스에서 발생]

최근에 자체 서비스에서 개인 정보를 빼내간 사례로는 H 통신의 경우가 있었다.

이름, 전화번호, 주민등록 번호를 DB에서 추출해서 다른 회사에 팔았다. 이것은 휴대폰 자체 서비스에서 개인 정보를 불법적으로 직접 뽑아해는 것이 된다.

자체 서비스내의 정보가 유출되는 경우, 문제가 심각하다.
민감한 정보가 많기 때문이다.

대표적인 민감한 정보는 이름, 이메일, 전화번호, 주소 등 신상 정보와 은행, 카드 번호 등과 같은 금융 정보(때론, 물품 구매 내역도 포함) 등이다.

생각으로는, 이런 정보를 실수나 회사 내부의 범죄자 한두명이 빼낸 게 아니라 고의적 조직적으로 빼내서 쓰거나 판 기업은 벌금정도로 처리하면 안된다. 대충 넘어가는 우리나라 실정에서, 개인정보보호에 대해 논의하는 이런 글이 우스꽝스러울 지경이다.

지능형 서비스와 상관없는
자체 서비스(Textcube.com에서는 TCBS )내의 정보가 부당하게 이용되는 가능성에 대한  논외로 하겠다.
textcube.com 에는 자체 서비스에 개인 정보가 거의 없다.


[위치 정보]

전화를 걸고 받으려면, 각자의 위치를 시스템에서 완전히 알고 있어야한다.
또한, 요금을 산출하고 결제를 요청하기 위해서는 이름, 전화번호, 주소, 주민등록번호(세금문제나 기타 이유로 필요할 수 있다) 등을 가지고 있어야한다.

두 사람간의 전화 통화가 연결되기 위해서는, 시스템이 전화번호를 통해 그 사람의 위치를 알아내 연결해주어야만 한다. 시스템이 사람의 위치를 파악하고 있는 것은 당연하다.
그렇기때문에, 위치 정보 보호 문제를 이야기할 때, 개개인 위치 정보를 유지하느냐에 대해 논의한다면 말도 안되는 것이다.

사람들이 걱정하거나 기분나빠하고 있는 부분은
위치 정보 변동 내용을 누적해서 오랜 기간 저장하거나,
위치 정보를 해당 통신사 내부의 마케팅 시스템에 연동해서 대리점 안내 문자를 보내거나,
근처 음식점의 위치를 안내하는 경우에 대해 걱정하고 있는 것이다.


3. 지능형 서비스에서의 정보유출

사용자들이 걱정하는 정보는 다음의 두 가지로 나눌 수 있다.

1. 민감한 정보 : 이름, 전화번호, 이메일, 주소 등 신상 정보와 은행, 카드 번호 등과 같은 금융 정보(때론, 물품 구매 내역도 포함)

2. 내가 누구 블로그에 들어갔거나 그 글 또는 페이지를 읽었다는 사실, 모바일 서비스인 경우 내가 있는 위치 등(장소 지정의 상세함에 따라 다르다)

(글 발행 및 트랙백 전송 내역은 감추고 싶은 사람이 없을 것이라고 생각한다. 어차피 공개되는 것이니까. )

TCIS 에서는 1 정보는 아예 사용하고 있지 않다. Textcube.com 내(TCBS 든 TCIS든) 에는 이러한 의미의 개인 정보가 거의 없다. 거의 유일하게 이메일 정보가 그런 성격의 정보이다. 그런데, 이메일 정보는 TCBS에서만 있고, TCIS로는 이 정보가 전달되지 않는다.

Textcube에서는 2 의 정보만을 활용해서 통계나 지능형 서비스를 하고 있는 것이다.

이제 사용자의 걱정은 대략 다음의 두 부류로 나눌 있다.

A. 내가 감추고 싶은 정보가 노출되는 경우

B. TCIS의 개인 정보가 무단으로 활용되는 경우


A. 에 대해서 먼저 이야기 하겠다.


요즘 쇼핑몰들중에 최근 클릭한 상품 리스트를 보여주는 기능들이 많이 있다.

성인 상품을 클릭해서 봤지만, 이 리스트를 삭제하고 싶을 수 있다.

ExperTag에서 내가 감추고 싶은 키워드가 나타날 수 있다.

또는 개인화된 페이지에 내가 평소에 좋아하는 기사들이 나타나는 것이 싫을 수 있다.


이런 상황서 개인 정보 보호는 다음과 같은 경우를 들어서 이야기 하고 싶다.

L는 동네 비디오 가게 단골이다. L는 일본 에로, 미국 SF, 이 두 장르 영화를 좋아한다.
오랜만에 비디오 가게에 들렸다. 그사이 괜찮은 일본 에로 신작, 미국 SF신작이 나와 있었다.
친절하고 똑똑한 비디오 가게 주인이라면, 미국 SF 신작이 대해서 나왔다고 말하면서, 일본 에로 신작 출시에 대해서는 조용하게 눈짓을 하거나, "Akira Watase어때요라며 속삭이며 꺼내서 전해줄 것이다.
눈치없고 바보같은 주인은 "L군, 일본 포르노 끝내주는게 방금 나왔어" 라고 확성기에 대고 말하면서 디스크 케이스를 흔들면 보여줄 것이다. 그런 눈치없는 비디오 가게가 장사가 될 리가 있나?
(혹시나 동네에 평소에 눈여겨 둔 아가씨가 옆에서 그 말과 그 케이스를 보았다면... L의 단골 비디오가게 아저씨는 평생 살면서 지은 범법행위에 대해 모두 죄값을 치르게 될 수도 있다.)

지능형 서비스는 가게 주인을 위한 것이 아니다.
쇼핑몰에서는 성인 상품에 대해서는 상당히 조심스럽게 추천한다.

혹시나 지마켓이나 GSeShop에서 성인 물품을 산사람들 중에 신상품 나왔다고 메일 받아본적 있는가? 아마 거의 없을 것이다.

A 걱정에 대한 답변은 이렇다.

그건 서비스의 질 quality 문제이지, 개인정보 보호 문제가 아니다.

N사 블로그에는 자신의 방문 여부 기록을 삭제하는 기능이 있다.
이 기능이 필요한 사람이 있을 것이다.
반대로
이 기능이 필요없는 사람에게는 쓸데 없는 정보가 전달되고 있는 셈이 된다.

당연한 얘기지만,
불편함을 느끼지 않도록 하면서,
필요한 기능은 다 제공하는 서비스를 만들어야한다.

그것이 바로 애인같은 비서 역할을 하는 지능형 서비스다.

펼쳐두기..


아직 미묘한 문제가 남아 있다.

포탈 D사 뉴스를 보면, "이 기사 누가봤을까" 라는 기능이 있다.
해당 페이지를 보면, 연령별 많이 본 기사 리스트가 나온다.
쇼핑몰이나 컨텐츠몰에서도 성별, 연령별 많이 구매한 상품 등의 리스트가 제공되는 경우가 흔하다.

연령, 성별도 개인 정보의 일부이다.
이것은 개인정보를 활용한 사례가 아닌가?
(내가 동의를 했는가 기억을 더듬어 볼수도 있지만, 약관에 다 포함되어 있을것이다)

맞다.
개인 정보의 활용이다.
그러나, 이런 정도의 활용은 개인 한명한명의 정보는 없는 채로
여러 사용자를 묶어서 처리하는 것으로 익명성이 보장된다.
또한, 서비스의 질을 높이고, 결과적으로 사용자의 이익에 도움이 된다고 받아들여지기 때문에,
이런 정도의 활용에 대해 개인정보보호 우려는 거의 없는 상황이다.
(최근 이러한 개인화, 추천, 지능형 서비스 도입을 위해 각 사이트들이 약관을 바꾸고 있다. 최근 날아온 메일들을 자세히 살펴보기 바란다)

만일 어떤 한 사람이, 이러한 통계에 자신의 정보가 활용되는 것을 원치 않는다고 주장한다면 어떻게 될까?

동의한 사람만의 행동 정보만을 기준으로 통계를 내는 시스템도 가능하기는 하지만, 그런 예를 들어보지는 못했다.

구현이 귀찮은 부분도 있고, 사회적으로 그런 정도의 의견을 가진 사람까지 배려해줄 필요를 못느끼는 것 같다.

B 언뜻 보면 불법적으로 보인다.
그렇지만 그리 간단하지는 않다. 다음의 예를 생각해보자. 어떤 포탈에서 다음과 같은 일이 일어났다고 하자. 각각의 경우에, 개인 정보를 무단으로 활용한 것일까?

1. 가입자수 및 연령/성별 분포 정보를 보고서로 만들고 웹에서 노출해준다.
2. 가입자수 및 연령/성별 분포 정보와 각 연령/성별 별로 자주 이용하는 카테고리 요약 정보를 만들고 웹에서 노출해준다.
3. 가입자수 및 연령/성별 분포 정보와 각 연령/성별 별로 자주 이용하는 카테고리 요약 정보를 보고서로 만들어서, 마케팅 조사 업체에 팔았다.
4. 개개인이 자주 이용하는 카테고리 요약 정보를 만들고 카테고리내 새 컨텐츠가 올라오면 로긴화면에 먼저 보여준다. (아주 편리하고 예쁜 UI로)
5. 개개인이 자주 이용하는 카테고리 요약 정보를 보고서로 만들어서, 마케팅 조사 업체에 팔았다.
 
사람마다 다를 수도 있지만, 1,2 를 개인 정보가 무단으로 활용되는 경우라고 판단한 사람은 없을 것이다. 이미 널리 활용되고 있는 기능이고, 개인이 드러나지 않기 때문이다.

3 에 대해서는 논란이 있다. 여기서는 더이상 논의하지 않겠다.
개인적인 생각으로는 3과 같은 활용은 안하는 것이 바람직하지만, 서비스를 제공하는 입장에서 정말 궁하다면(서버도 사야하고 네트웍 비용도 내야하니..), 할수도 있다고 생각한다.

4 지능형 서비스가 만들려는 대표적인 기능이다.
개개인에게 좀더 나은 서비스를 제공하기 위한 지능형 기술이 구현된 것으로도 해석할 수있다.
어떤 관점에서 본다면, 휴대폰 통화 연결을 위해서 위치 추적을 하고 있는 것과 비슷한 상황이다. 사용자를 위해 데이터가
 활용되는 것이고 제 3자가 그 데이터를 보거나 활용하지 않는 상황이다.
논쟁의 여지는 남아 있지만,
다른 용도로는 쓰이지 않고, 개인이 경험하는 서비스의 질을 높이기위해서만 쓰인다면,
이런 기능에 대해 고객들의 거부감은 거의 없는 상황이라고 판단할 수 있다.

5 는 누구나 개인정보침해 사례로 판단했을 것이다.

자체 서비스에서 사용자에게 직접받은 개인 정보와
지능형형 서비스에서 추출한 사용자의 성향 정보가
한꺼번에 외부에 유출되는 경우이다.

[웹과 휴대폰]

개인적인 경험으로는, 웹과 휴대폰에서 개인 정보 보호에 대한 사용자 인식은 매우 차이가 난다.

휴대폰에서 훨씬 민감하게 느끼는 것같다.
아마도 사람들이 위치 정보가 아주 개인적인 것이라고 느끼고 있고, 휴대폰에서는 위치 정보가 쉽게 추적될 수 있다고 생각하는 이유인 것같다.
그러나 웹에서도 위치 추적이 불가능한 것은 아니다.
(궁금하면, 중요기관에 협박글을 게시판에 남겨보면 알 수 있을 것이다. 단, 뒷일은 책임못진다)
단지 비용이 들고 정확도가 떨어질 뿐이다.

또한 사람들이 느끼기에 웹에 나타난 개인화 서비스는 팝업창이 아닌 경우 그냥 무시할 수 있기 때문에 덜 귀찮아하는 것같다.

휴대폰에서도 sms 나 팝업창으로 전달되는 개인화 서비스는 부정적 반응이 많았지만, 휴대폰에서 접속한 인터넷 페이지에 나타난 개인화 서비스에는 부정적 반응이 훨씬 적었다.



4. 정리

개인의 행동정보를 활용한 지능형 서비스 기술은 전세계적으로 경쟁이 심해지고 있는 기술중의 하나이므로, 이 기술이 확산되는 것은 피할 수 없는 선택으로 보인다.


일반적인 선입관과는 달리,
지능형서비스에서는 사용자가 입력한 개인정보가 거의 활용되지 않으며, 개인의 행동정보가 주로 활용된다.

또한 현실적으로는
다른 용도로는 쓰이지 않고, 개인이 경험하는 서비스의 질을 높이기위해서만 쓰인다면,
이런 기능에 대해 고객들의 거부감은 거의 없는 상황이다.

우려되는 상황은
자체 서비스에서 사용자에게 직접받은 개인 정보와 지능형 서비스에서 추출한 사용자의 성향 정보가 합쳐져서 외부에 유출되는 경우이다. 단순히 내 전화번호와 계좌번호만 유출된 것이 아니라 내가 샀던 물건, 관심 가졌던 물건의 종류까지 같이 유출되기 때문이다.

이를 방지하기 위해서는 학문적, 시스템적, 법적인 장치가 더 강화되야할 것이다.


그렇지만, 가장 중요한 것은 개개인의 의식 문제이다.


개인정보 유출이 일어난 회사에 대해 모든 사용자가 등돌린다면, 회사는 돈을 투자해서 제도적, 시스템적 방지장치를 것이고, 범죄자에게 구상권을 청구해서 이런 범죄가 발을 못붙이게 될 것이다.

조직적인 개인 정보 유출한 회사에 대해 관대한 사회에서는
법을 만드는 조직이나 서비스를 회사가 진심으로 개인 정보 유출 방지에 노력할 리가 없다.


====

이런 내용을...

이야기 하고 싶었는데...

앞으로도 이런 질문은 가끔 받을 것같기도 하고.
몇줄로 요약한다면 어떻게 해야할까??