생명윤리를 배우다
연재
[생명윤리를 배우다] 유전정보와 보건의료 빅데이터 활용 가이드라인에 대한 생각(2)

유전정보 가명처리
작년 9월에 제정된 보건의료 데이터 활용 가이드라인에서는 민감정보 중 ‘건강’에 관한 정보들을 데이터 유형에 따라 세분화하여 제시하고 있습니다. 개인정보 보호법 시행령 제18조 1항에 의하면 민감정보의 범위를 규정하면서 유전자검사 등의 결과로 얻어진 유전정보를 민감정보에 해당합니다. 또한 가명처리란, 앞서 언급한 것처럼 대부분 추가정보와 결합 없이는 특정 개인을 알아볼 수 없도록 식별자, 인적사항, 속성값에 대한 특별한 처리를 시행하도록 하는 것입니다. 여기서 추가정보란 개인정보의 전부 또는 일부를 대체하는 데 이용된 수단이나 방식(알고리즘 등), 가명 정보와의 비교ㆍ대조 등을 통해 삭제 또는 대체된 개인정보 부분을 복원할 수 있는 정보(매핑 테이블 정보, 가명처리에 사용된 개인정보 등) 등입니다. 이러한 추가정보(원본정보와 알고리즘·매핑테이블 정보)와 가명정보는 관리적 또는 기술적으로 각각 분리하고, 접근권한을 분리하여야 합니다.
유전정보 가명처리 가능 여부를 유보한 것은 현 시점에서 적절한 선택
건강정보 중 재식별이 될 경우 정보 주체에게 중대한 피해를 줄 수 있는 정신질환 및 처방약정보, 성매개감염병정보, 에이즈정보, 희귀질환정보, 학대 및 낙태 관련 정보는 가명처리하지 않고 직접 본인의 동의를 통해 사용하도록 하였습니다. 다행히도 유전정보의 경우 몇 예외를 제외하고는 가명처리 가능여부를 유보하고 본인 동의 기반으로만 사용가능하도록 하였는데, 적절한 가명처리 방법이 아직 개발되지 않았기 때문을 그 이유로 들었습니다.
구체적으로 내용을 살펴보면, 유전체 정보의 경우, 유전체 정보는 그 안에 담긴 정보의 내용을 모두 해석해내지 못하고 있고, 부모·조상·형제·자매·자손·친척 등의 제3자 정보를 담고 있을 수 있으므로 적절한 가명처리 방법이 개발될 때까지는 몇 가지 예외적인 경우를 제외하고는 가명처리 가능여부 유보가 적절하다고 하고 있습니다. 첫 번째 예외적인 상황으로는 항암제 사용시 유전자 변이 환자의 치료반응 연구와 같이 널리 알려진 질병에 관한 유전자 변이 유무 또는 변이 유형으로써, 구체적 변이정보가 아닌 큰 단위의 유전자 정보를 제공함으로써 개인 재식별 가능성을 낮출 수 있기 때문입니다. 두 번째 예외는 생식세포 변이 정보를 제거한 신생물(neoplasm, 세포의 이상증식 현상으로 종양(tumor)으로 알려져 있음) 고유의 신규변이 정보로 생식세포 변이(정상조직 변이)를 제거한 신규 생성 변이 정보는 암의 원인이 되는 변이 정보만 포함하게 되므로 개인 식별 가능성 없다고 봅니다.
위 내용으로 보아 가이드라인에서는 원칙적으로는 유전정보의 경우, 가명처리 가능여부 유보를 통해 사용을 제한하고 있는 것인데 이는 현 컴퓨터 알고리즘 보안 수준에서 매우 적절한 조치라고 생각합니다. 물론 이는 난치 질환의 연구에 유전정보 빅데이터를 활용하는 데 장애처럼 느껴질 수 있겠습니다. 생명윤리법 제47조 제1항에서는 유전자치료를 위한 연구에 대한 허용 조항을 설명하면서 다음의 각호 모두에 해당하는 경우에만 할 수 있다고 말하는데, 제1호에서는 유전질환, 암, 후천성면역결핍증, 그 밖에 생명을 위협하거나 심각한 장애를 불러일으키는 질병의 치료를 위한 연구, 제2호는 현재 이요 가능한 치료법이 없거나 유전자치료의 효과가 다른 치료법과 비교하여 현저히 우수할 것으로 예측되는 치료를 위한 연구에 한한다고 언급합니다. 즉, 난치 질환과 같은 질병은 유전자치료만이 현재 치료법으로 생각되는데, 이를 위해서는 기존 환자들의 유전정보의 빅데이터가 도움이 될 것으로 과학자들은 생각하고 있으므로 위 사항은 컴퓨터 보안 알고리즘이 발전함에 따라 과학자들의 개정 요구가 생길 가능성도 큽니다.
유전정보에 대한 적절한 가명처리 방법의 개발이 필요
따라서 적절한 가명처리 방법을 개발하는 일이 계속해서 필요하지만, 과연 적절하다고 하는 것이 어떠한 것인지에 관하여는 더 많은 논의가 필요합니다. 또한 적절성에 대해 논의하기 전에 왜 유전정보를 익명정보(익명정보란, 시간,비용,기술 등을 합리적으로 고려할 때 어떠한 다른 정보를 사용하여도 더 이상 개인을 알아볼 수 없는 정보이다.)가 아닌 가명정보(가명정보란, 개인정보의 일부를 삭제하거나 일부 또는 전부를 대체하는 등의 방법으로 추가 정보가 없이는 특정 개인을 알아볼 수 없도록 처리한 정보이다. 이러한 처리를 가명처리라고 하는데 원래의 상태로 복원하기 위해서는 추가정보의 사용과 결합이 없이는 특정 개인을 알아볼 수 없게 된다.) 로 활용하게 된 것일까요?
유전정보를 다시 재식별하게 되어 활용해야 하는 경우는 어떤 경우일까요? 연구를 하면서 재식별하여 원 유정정보를 제공한 대상자를 확인해서 다시 연구자료를 작성하거나 유전정보 대상자의 재동의가 필요하거나, 2차나 3차연구로 활용할 때 재식별이 필요한 경우들도 있을 것입니다. 물론 현재로서는 적절한 가명처리 방식이 없기 때문에 가명처리를 유보하였지만 가명처리의 방식이 개발되어 가명정보로 유전정보를 활용하게 될 경우 사실상 개인 1인의 정보 뿐 아니라 가족들의 정보까지도 포함하는 정보를 활용하는 것이므로 이에 대해서는 정보 활용을 하고자 하는 사용자인 보험회사나 병원, 직장과 같은 곳에서의 제한적 사용과 활용 연구에 대한 제한범위를 설정한 후 가명정보로써 활용하는 방식을 고려해보아야 할 것입니다.
* 다음 연재에서 계속됩니다.
참고자료
2020년 9월 보건복지부 개인정보보보호위원회가 발간한 <보건의료 데이터 활용 가이드라인> 참조
본 기사는 네티즌에 의해 작성되었거나 기관에서 작성된 보도자료로, BRIC의 입장이 아님을 밝힙니다. 또한 내용 중 개인에게 중요하다고 생각되는 부분은 사실확인을 꼭 하시기 바랍니다. [기사 오류 신고하기]