▲(출처=픽사베이)

범죄 해결에 유전자 혈통 데이터베이스를 사용하면서 70년대와 80년대 캘리포니아 주민들을 공포에 떨게 만들었던 범죄자, 일명 ‘골든 스테이트 킬러’를 추적하는 것이 가능해졌다. 연구팀은 이제 이 같은 수사 유형을 확장할 방법을 찾고 있다.

법 집행기관의 데이터베이스에 기록된 사람과 유전자 혈통 데이터베이스에 기록된 사람을 연결 짓는 계산 방법이 개발됐다. 시스템은 완전히 다른 유전자 지표를 사용하고 있다. 원칙 검증 측면에서 조사관들은 두 가지 데이터베이스에서 수집한 비중첩 유전자 지표를 사용해 30% 이상의 정확성으로 추적할 수 있게 됐다고 밝혔다.

기존 및 새로운 데이터베이스의 연결

이번 연구의 선임 저자인 스탠포드대학의 노아 로젠버그 생물학과 교수는 “기존 DNA 문제는 대부분 1990년대 이후 법 집행기관이 사용한 오래된 유전자 지표 시스템을 사용하기 때문에 발생한 것”이라고 주장했다. 과거 시스템 설계는 현재 필요한 조사에 적합하지 않아 골칫거리가 되고 있다. 이번 연구는 기존 시스템과 최신 시스템을 비교 테스트해 성공적 결과를 찾아내는 것이 취지다.

DNA 정보종합시스템(CODIS)은 FBI와 다른 법 집행기관이 활용하는 데이터베이스로, 짧은 연쇄 반복 서열(STR) 지표 데이터가 저장돼 있다. 이러한 DNA 정보는 DNA의 비암호화 부위에서 채취할 수 있는 것으로 유전자 복제 변이 유형이다. 본래 13가지 지표만 사용하지만, 최근에는 20가지로 늘었다. 유전자 혈통 데이터베이스로는 유전체의 단일염기다형성(SNP)에서 볼 수 있는 차이점을 조사할 수 있다.

▲(출처=픽사베이)

지난 해, 로젠버그 교수 연구팀은 유전자형 데이터세트의 공유 지표 없이 두 가지 데이터베이스에 기록된 사람을 찾아내는 소프트웨어의 가능성을 확인했다. 13가지 지표를 사용하는 코디스(CODIS) 버전을 사용해 90%의 정확성으로 찾아낼 수 있었다. 20가지 지표를 사용하는 경우 정확성은 99%였다. 사용 방법은 내재적인 SNP가 각각의 STR 지표를 감싸고 있는 방식을 구분하는 것이었다. 특정 SNP를 가지고 있는 사람의 유전자형으로 인접 STR 유전자형을 예측할 수 있으며 반대로도 사용이 가능했다. 수많은 STR 상관관계에 대한 데이터를 축적해 SNP와 STR 프로파일을 일치시키는 것이 가능해졌다.

여기에서 더 나아가 가까운 가족과 연결시킬 수 있는 응용법이 개발됐다. STR 지표와 SNP 지표에서 부모-자녀의 30~32%, 형제자매의 35~36%가 서로 연결돼 있다는 것을 확인할 수 있게 됐다.

‘골든 스테이트 킬러’의 경우, 법 집행기관은 범죄 현장에서 수집한 DNA와 SNP 유전자형을 연결시켰다. 오픈소스 유전자 혈통 데이터베이스를 통해 데이터베이스에 기록된 다른 사람과 프로파일을 비교할 수 있었다.

이번 연구의 의도는 범죄과학수사의 유전자와 유전체 프라이버시를 둘러싼 문제를 논의하기 위해서다. 연구팀은 여러 가지 데이터베이스를 서로 연결시키는 범위를 조사하길 원했다. 두 가지 유전자 데이터 유형의 정보를 이해하는 것이 중요하기 때문이다. 예를 들어, 법 집행기관 STR 데이터베이스에 기록된 특정 개인에 대한 정보를 지나치게 공개하게 된다는 문제가 발생할 수 있다. 즉, 수사관들이 데이터베이스의 프로파일에 접속해 개인 정보를 열람할 수 있기 때문에 이 같은 관행을 바꿔야 한다는 것이다.

또 다른 응용 분야

법 집행기관의 조사를 넘어선 또 다른 응용 분야가 있다. 살아있는 유기체를 연구하는 생태학자들은 이 접근법을 사용해 특정한 지리학적 지역에서 존재하는 동물의 DNA 조사로 혈통을 연구할 수 있다. 고대 인류의 흔적에서 채취한 DNA 파편을 연결시켜 고대 매장 지역을 찾을 수 있다.

저작권자 © 리서치페이퍼 무단전재 및 재배포 금지