20년전 배운 컴퓨터 비전이 현실이 된 이유

IT와 세상 2010.02.03 06:59

20년 전 배운 기술이 짜릿하게 다가 온 까닭은?

아바타를 제작한 제임스 카메론 감독의
TV 인터뷰를 최근 본 적이 있다. 그에 따르면 감독으로서 영화에 담고 싶은 장면을 상상 속에서 그려 보지만 제작하기에는 현실적으로 기술의 한계가 있어 아쉬운 점이 많다고 한다. 자연히 영화 제작 시점에 사용 가능한(available) 기술을 활용할 수 밖에 없다. 그런데, 좋은 기술이 많이 나오게 되면서 상상의 나래를 실현하는데 장벽이 없어지고 있다고 한다.

 

판도라의 모습 (아바타)

이를 테면 터미네이터 2’의 경우 당시 3D 그래픽 전용 워크스테이션이 있었기에 자유자재로 변신이 되는 터미네이터를 표현할 수 있었다. 아바타도 오래 전부터 상상한 ‘판도라를 애니메이션과 3D 기술로 마음껏 실현할 수 있었다. 특히 '아바타'는 '반지의 제왕', '해리 포터'와 같은 판타지 영화의 애니메이션 기술을 뛰어 넘어 극중 인물의 눈망울까지 표현했다. 그만큼 인간다움에 더 접근했다.

사실 3D 기술은 50년대에 나온 것으로 이미 3D 영화는 70년 대부터 종종 나오곤 했지만 실험이나 별개의 재미에 그치곤 했다. 그러나, 이번에 애니메이션과 그래픽이 결합되면서 3D는 우리 문화 속 콘텐츠로 자리잡게 되었다. 영화는 물론 동계 올림픽, 월드컵 등으로 3D의 영역은 급속도로 퍼지고 있다. 이와 같이 기술이 시의적절하게 활용되면서 우리에게 윤택함과 즐거움을 주고 있다.

타임스퀘어의 주차 안내 시스템

영등포에 있는 타임스퀘어에 갔을 때 주차 안내 시스템이 인상적이었다. 큰 쇼핑몰에 가면 주차장이 너무 커서 나중에 주차 위치를 찾느라 애를 먹는 경우가 이따금 있다. 그런데, 타임스퀘어 안내판에서 자신의 차량 번호 4자리를 입력하면 바로 자신의 자동차를 사진으로 보여준다. 현 위치에서 어떻게 가야 하는지 그 동선(動線)도 알기 쉽게 보여 준다.

차량 사진을 보여 주는 화면

주차 지점까지의 동선


사실 이 시스템을 구성하는 기초 기술을 생각하면 오래 전 추억에 젖게 된다. 80년대 중반 박사 과정 시절 컴퓨터로 물체를 인식하는 기술을 연구한 적이 있다. 소위 컴퓨터 비전(Computer Vision)이라는 기술로서 로보트, 인공 지능과 관련된 연구 분야로 각광을 받았다. 인식 기술도 문제지만 카메라의 위치, 차량을 바라보는 시각, 주변 조명의 구성에 따라 결과가 들쑥날쑥해서 실험하는데 애로 사항이 많았다.

물론 차량 계기판의 경우 인식의 대상이 숫자로 한정되어 있어 인식 알고리즘은 아주 간단하다
. 또한 20년도 넘은 지금의 시점에는 카메라 기술도 발달했고 컴퓨터 성능도 좋아졌다. 아무리 그런 점을 가정하더라도, 또한 내가 보고 있는 주차 안내 시스템이 어떠한 기술로 구성되어 있는지 알고 있음에도 불구하고 정작 나에게 피부에 와 닿는 편리함을 체험하니 짜릿함을 느끼게 된다. 그러니 일반인은 어떻겠는가?


인상적인 아이폰 어플리케이션

Midomi의 Sound Hound

또 한가지 흥미로운 제품이 앱스토어에서 인기리에 판매되는
‘Sound Hound’이다. 이 소프트웨어의 목적은 명확하다. 카페나 길거리에서 흘러 나오는 음악을 들으면서 그 곡목이 생각나지 않는 경우가 있다. 좋은 멜로디라 기억은 하면서도 아예 곡의 제목을 모르거나,  제목이 기억이 나지 않는 경우다. 이런 상황에서 그 곡을 찾아 주는 어플리케이션이다.

몇 가지 테스트를 해 보니 전율을 느낄 정도로 정확하다. 일부러 곡의 중간 정도를 발췌해서 해 보아도 2-3초 안에 찾는다. 배우의 대사가 섞여 있는, 그래서 잡음(noise)이 어느 정도 있는 드라마의 배경 음악도 비교적 잘 잡아 낸다. 아직 한국 곡은 수록된 데이터베이스가 적지만  미국 팝음악은 거의 다 잡아낸다.


이 소프트웨어의 핵심 기술도 오래 전 체험한 적이 있다
. 80년대 초반 대학원에서 전자공학을 전공할 때 신호 처리를 통해 패턴 인식을 하는 기술을 연구했다. 바로 그 기술이 이 소프트웨어의 핵심이다. 즉 특정 음악의 주요 특징(feature)을 추출해서 네트워크로 보내서 음악 데이터베이스에서 끄집어 낸다. 물론 기술적으로는 크게 발전했지만 핵심 이론은 크게 바뀌지 않는다. 이론적으로 어떻게 동작하는지를 뻔히 알면서도 정작 음악을 거의 실시간으로 잡아 내는 것을 보면 신기하게 느껴진다.

 

각종 기술들이 융합되어 활용되면서 삶의 윤택함과 활력을 주고 있다. 특히 이미 등장하거나 연구된 기술을 어떻게 응용하느냐가 관건이다. 그만큼 가용될 수 있는 기술이 많이 나와 있기 때문이다. 그러나, 더 눈여겨 볼 것은 이러한 기술에 대한 정보가 더 이상 특정 개인이나 집단에 한정되어 있지 않는 평평함(flatness)’의 시대에 살고 있다는 점이다.

 

노하우(know-how)보다 정보를 찾는 노웨어(know-where) 기술의 가치가 더 인정을 받는다고 하지 않는가? 요컨대 어떻게 창의력과 혁신 정신으로 가치(value)를 창출할 수 있느냐가 관건이다. 산업 시대를 넘어 선 지식기반시대는 이미 막을 올렸다. 꿈을 가지고 도전하는 젊은 디지털 세대에게는 더욱 많은 기회가 주어질 것이다. 


신고