‘플로피 디스크’가 무엇인지 아는가? 지금은 ‘파일’이나 ‘저장’ 기능을 나타내는 아이콘으로 우리에게 친숙한 플로피 디스크(Floppy Disk)는 1971년 IBM에서 최초로 개발한 보조 기억 장치의 일종이다. 표준 플로피 디스크는 사람 얼굴만한 크기로 지금 생각하면 휴대성이 한참 떨어지지만, 당시에는 미래에 이것이 책을 대체할 것이라고 예상했을 정도로 매우 획기적이고 대중화된 상품이었다. 이후 USB 메모리와 SD 카드가 개발, 보급되면서 플로피 디스크는 시장에서 사라졌고, 요즘은 CD조차도 특정 분야를 제외하고는 거의 사용하지 않게 되었다. 이처럼 데이터 저장 기술은 빠르게 발전하여 같은 양의 데이터를 저장하는데 필요한 하드드라이브의 크기와 필요한 비용이 많이 줄어들었다.

그러나 데이터 저장 매체의 개발 속도는 점점 느려지는 반면, 데이터 생산량은 기하급수적으로 증가하고 있다. 손가락만 까딱하면 새로운 데이터가 만들어지는 시대 아닌가. 미국의 클라우드 소프트웨어 회사 DOMO에 따르면, 2021년 인터넷에서는 1분 동안 570만 건의 구글 검색이 이루어지고, 유튜브 사용자들은 70만 시간 분량의 동영상을 시청했으며, 페이스북에 24만 개의 사진이 공유되었다. 앞으로 생성될 수많은 데이터를 저장하기 위해서는 이와 같은 데이터 홍수 문제를 해결하고, 도태될 걱정이 없는 새로운 데이터 저장 매체를 개발해야만 했다. 이번 기사에서는 미래의 데이터 저장 매체로써 다양한 분야에서의 활용이 기대되는 기술, ‘DNA 메모리’에 대해 알아보자.

왜 DNA인가?
DNA는 간단히 말하자면 생명체의 유전 정보를 담고 있는 물질이다. 컴퓨터가 정보를 저장할 때 ‘0’과 ‘1’이 나열된 이진법을 사용한다면, DNA는 A (Adenine, 아데닌), T (Thymine, 티민), G (Guanine, 구아닌), C (Cytosine, 사이토신), 이렇게 4가지의 염기로 구성된 일종의 4진법을 사용한다. ‘00’은 A, ‘01’은 G, ‘10’은 C, ‘11’은 T로 대응되어 이진법으로 표현된 정보를 염기서열의 형태로 바꿀 수 있는데, 예를 들어 ‘011110001100011010’은 ‘GTCATAGCC’가 된다. 길이가 짧아진 것이 눈에 띄지 않는가? 18개의 숫자가 나열된 긴 문장이 단 9개의 알파벳으로 구성된 짧은 문장으로 바뀐 것을 볼 수 있다. 이를 이용한 데이터 저장 매체는 기존 매체에 비해 정보의 밀도가 굉장히 높다. 사람의 유전 정보를 담고 있는 DNA는 약 30억 개의 염기를 가지고 있으며 길이는 자그마치 2m에 달하지만, 이렇게 긴 물질은 고작 2~4μm(1μm는 100만분의 1m)인 세포핵 안에 저장된다. 즉, 사람의 핵 하나에는 무려 30억 비트, 375MB의 정보를 저장할 수 있는 것이다! 같은 양의 정보를 저장하는데 3.5인치 플로피 디스크는 약 260개가 필요하다. 이렇게 되면 우리는 아주 작은 크기의 생물(미생물)에도 많은 양의 정보를 저장할 수 있고, 가루 형태의 DNA 1kg에는 전 세계의 모든 데이터를 저장할 수 있다고 한다.
DNA 메모리 기술의 발전
DNA는 이중나선 구조의 특성상 매우 안정적인 분자이므로 유지 비용이 적게 들고, 합성 등의 기술이 연구를 통해 계속 발전하고 있다. 물리적 한계와 짧은 데이터 보존 기간 등으로 인해 더 이상의 획기적인 변화가 어려운 기존 방식의 데이터 저장매체와는 달리, DNA 메모리 기술은 아직 무궁무진한 발전가능성이 남아있는 것이다. 다른 기술들과 마찬가지로 개발 초기에는 DNA 메모리에도 치명적인 한계가 있었는데, 정보를 저장해둔 DNA가 가루 형태로 존재하기 때문에 원하는 정보만을 분리하여 저장하고 검색할 수 있는 기술이 없고, 정보를 반복적으로 읽을 수 없다는 점이었다. 이러한 문제점을 해결하기 위한 연구는 2020년, 경희대 전자정보융합공학과 박욱 교수, 서울대 전기정보공학과 권성훈 교수, 하버드대학교 Wyss Institute 최영재 박사와 서울대 전기정보공학부 배형종 박사로 이루어진 국내 공동연구팀에서 진행한 바 있다. 연구팀은 DNA 메모리를 파일 단위로 분리하여 저장할 수 있는 ‘DNA-디스크’를 개발함에 따라 저장된 데이터를 용이하게 관리하고, 기존 DNA 메모리와는 달리 정보를 여러 번 안정적으로 읽을 수 있도록 하였다. QR코드 형태의 DNA-디스크에는 데이터를 인코딩한 DNA 염기서열과 프라이머(DNA 복제를 시작하는 역할을 하는 짧은 염기서열) 정보가 포함되어 있다. 이후 사용자는 QR코드를 스캔하여 필요한 정보를 얻고, 이를 이용한 DNA 복제 과정을 거쳐 저장된 데이터를 읽을 수 있게 된다. 이들은 해당 연구를 통해 DNA 메모리의 저장성과 안정성을 크게 향상시키고, 미래 연구의 선제적 방향을 제시하였다.

DNA 메모리, 어디에 쓰일까?
연구자들은 이러한 혁신적인 아이디어를 생각해낸 것도 모자라 기술을 실생활에 활용하는 방안까지 연구하기 시작했다. DNA 메모리는 데이터 저장 기술의 가장 기본적인 기능, 말 그대로 문서, 사진, 동영상, 음악 등의 파일을 저장하는 기능을 수행할 수 있다. 실제로, 컴퓨터에서 사용하는 이진법으로 코드화 되어 있는 동영상의 디지털 정보를 DNA 염기서열로 변환하고, 이를 주입하여 증식한 세균으로부터 원본과 90% 일치하는 동영상을 재생하는데 성공하기도 했다. 이미 16GB에 해당되는 Wikipedia(영문판)의 전체 텍스트를 겨우 0.1mL(1280억 개의 염기)의 DNA 분자에 저장하는 등 상당히 큰 용량의 파일 저장에서도 성공을 거두었기에, 점차 대용량의 데이터를 저장하는 것은 앞으로의 시간 문제로 보인다.
앞서 언급한 권성훈 교수는 과학기술정보통신부 리더연구 사업의 지원으로 ‘차세대 헬스케어를 위한 디지털 면역 프로세싱 연구단’을 이끌고 있는데, DNA-디스크에 개개인의 헬스케어 정보를 보관하여 관련 산업에 획기적인 변화를 가져올 것으로 전망했다. 실제로 몸 속 미생물 엔지니어링을 통해 몸의 변화를 모니터링하고 질병 치료 물질을 분비하는 등 의학적인 활용 방안도 제시되고 있다.
MIT에서 같은 합성생물학 연구 그룹에 속해 있었던 박현준 박사와 Nathaniel Roquet 박사가 공동설립한 미국의 벤처기업 카탈로그(Catalog Technologies)는 DNA를 기반으로 무려 컴퓨터를 개발 중에 있다. 카탈로그는 앞서 소개한 Wikipedia 문서 저장에 이어, 캠브리지 컨설턴트의 하드웨어 기술 지원을 받아 세계 최초로 DNA 메모리 ‘쉐넌(Shannon)’을 시제품 형태로 개발하여 화제가 되었다. 이들은 해당 제품을 만들기 위해 DNA를 고체화시켜 용액 상태로 보관하고, 잉크젯 프린터로 출력하는 방식을 채택했다. 정보를 읽어낼 땐 여기에 물을 더해 다시 용액 상태로 만들고, DNA의 염기서열을 읽어내는 기계로 어떤 분자들이 있는지 파악하여 원래 데이터로 번역하는 과정을 거친다. 2020년 워크투데이와의 인터뷰에서 박현준 대표는 ‘기록’과 ‘연산’에 초점을 두고 연구한 결과라고 밝혔으며, 다른 기업에서 연구하는 방식의 DNA 합성비용에 비해 약 1만분의 1 정도로 저렴할 것이라고 설명했다. 이로부터 카탈로그가 DNA 기반 컴퓨터를 개발하여 상품화하고자 하는 목표에 맞는 연구 방향을 추구하는 모습을 엿볼 수 있다.

쉽게 접근할 수 없는 DNA의 특성을 이용한 활용 방안 또한 제시되고 있다. 매우 중요한 정보를 DNA에 저장하여 안전하게 보호하거나 기밀 전달에도 이용할 수 있게 기술을 개발하는 것을 말하며, 이를 전문 용어로 DNA 스테가노그래피(DNA steganography)라고 한다. 중앙대학교 융합공학부 나도균 교수는 2020년 인간 게놈의 가변영역에 기밀 정보를 숨기는 DNA 스테가노그래피 방법론을 개발하였다. 나 교수가 연구에 사용한 SNP(single nucleotide morphisms)는 본질적으로 사람에 따라 염기서열이 다른 DNA 부위이기 때문에, 해당 영역에 암호화된 메시지를 숨기는 경우 원래 서열과 구별하기 어렵다. 이러한 특징을 이용하여 기밀 사항을 삽입한 SNP를 포함하는 DNA를 가지고 있는 세포와 해당 메시지가 숨겨진 SNP 위치를 수신자에게 전달하면, 수신자는 주어진 정보를 바탕으로 SNP의 염기서열을 풀어내고 암호를 해독할 수 있다. 이와 같은 기술을 보안성과 안정성 측면에서 더욱 발전시키면 실제 상황에서도 효과적인 보안 기술로 활용될 수 있을 것이다.
지금까지 데이터 저장 매체의 새로운 패러다임, DNA 메모리에 대해 알아보았다. 이진법이 사용되던 기존 데이터 저장 기술의 틀을 깨고, 4진법의 DNA 염기서열을 사용하는 획기적인 데이터 저장 기술. 기존 매체에 비해 정보의 밀도가 높아 적은 양에도 많은 정보를 저장할 수 있고, 분자 특성상 안정적이고, 지속적인 발전이 이루어지고 있는 DNA 메모리는 앞으로 컴퓨터, 보안 기술, 의학 등 다양한 분야에서 활용되며, 현대의 데이터 홍수 문제를 해결할 수 있을 것으로 기대된다.
최은서 학생기자 | Chemistry & Biology | 지식더하기
참고자료
[1] Robust direct digital-to-biological data storage in living cells, Sung Sun Yim, Nat Chem Biol. 2021
[2] 과학기술정보통신부 블로그 – 내 몸 속의 이것이 차세대 정보 저장장치? DNA 데이터 저장 기술
[3] 동아사이언스 – 데이터 홍수 걱정 없는 저장장치의 차세대 주자들
첨부한 이미지 출처
[1] https://commons.wikimedia.org/wiki/
[2] https://www.domo.com/
[3] https://www.snu.ac.kr/research/
[4] https://www.cambridgeconsultants.com/
