'데이터 개방'에 해당하는 글 1건




소셜 웹 서비스들의 활성화와 웹 2.0 철학의 일반화가 진행되면서 바야흐로 개방의 철학이 꽃을 피우기 시작하고 있습니다.  오픈소스를 기치로 내걸고 리눅스가 나와서 오랫동안 진행시키면서 숙성시킨 원리들이 현실세계로 내려오는 모습을 바라보면서 격세지감을 느끼기도 합니다.  IT 기술이 과거 신산업 영역에 있을 때에는 되려 개념에 있어서 건축산업이 가지고 있던 많은 방법론 및 개념을 가져왔습니다.  우리가 흔히 이야기하는 빌딩(building) 이나 아키텍처(architecture) 등의 용어들도 그런 산업에서 가지고 왔지요?  그런데, 이제는 IT 에서 발전한 철학이 우리 생활과 다른 산업영역으로 파급되는 시기가 왔습니다.  오늘은 개방이 대세인 사회에서 과연 데이터의 개방은 어떻게 해야 하는지?에 대한 글을 써볼까 합니다.  


개방에도 기술이 필요하다

개방이 워낙 유행이다보니 무조건 개방!만 외치는 경우가 많습니다.  물론 닫혀있는 것보다는 개방하면 어떻게든 가치가 더 많이 만들어지는 것은 사실입니다.  소위 생데이터(raw data)라도 의미는 있습니다.  그렇지만, 이왕이면 개방이 더욱 효율적으로 가치를 상승시킬 수 있으면 더욱 좋겠지요?  이와 관련한 개념과 기술은 이미 소프트웨어 분야에서는 리눅스(Linux) 프로젝트와 같은 오픈소스 프로젝트를 진행하면서 많이 축적되었습니다.  데이터는 소프트웨어가 아니지요?  그렇지만 기본개념과 철학은 비슷합니다.  개방을 위한 효율적인 철학은 어떤 것들이까요?

  • 무엇이 바뀌었는지 안다
원본이 공개되고, 이 공개된 데이터에 대해 누군가가 접근을 해서 수정을 했다면 이렇게 바뀌었다는 것을 누구나 알 수 있어야 하며, 경우에 따라서는 시간 순으로 돌아갈 수 있는 장치가 되어 있어야 합니다.  이런 장치가 없다면 애써 공개한 데이터가 악의적인 시도를 통해 왜곡되거나 손상을 입을 수 있습니다.
  • 패치가 가능하다.
오픈소스 프로젝트에서도 그렇지만, 데이터를 수정하고자 하는 사람들이 쉽게 접근을 해서 수정내용을 전송할 수 있는 어떤 형태의 서비스가 있는 것이 좋습니다.
  • 버전 관리
비슷한 원칙입니다만, 동시에 여러 곳에서 진행된 변경내용이 적절하게 시간에 따라 반영될 수 있도록 버전을 관리하는 것이 협업에서는 매우 중요합니다.  
  • 릴리즈 (Release)
프로그램을 개발할 때에는 개발자와 사용자들의 사이는 릴리즈(release)라는 프로세스를 통해서 접하게 됩니다.  중간에 수정되고 있는 완결되지 않은 프로그램으로 인해 사용자들이 문제를 겪을 가능성을 배제하기 위해서, 프로젝트 관리자 적절한 테스트를 통해 일정시간을 기준으로 끊어서 문제가 최소화되었다고 판단할 때 릴리즈를 하는 것입니다.  데이터 역시 같은 원칙이 적용될 수 있습니다.  시간과 패치, 그리고 버전 관리를 하면서 지속적 업데이트를 허용하지만 민감한 데이터 들이나 진실에 대한 문제가 있을 수 있는 부분들은 적절하게 릴리즈를 하도록 전체적인 관리를 하는 것이 효과적입니다.

이런 개념을 적용해보면 개방된 데이터라도 어느 시기에 작성되어, 어떤 업데이트 과정을 거치고 있는지를 명확히 알 수 있어야 합니다.  그리고, 가능한 최신의 데이터와 정보가 사용자들에게 전달되도록 하는 것이 좋을 것입니다.  


데이터 개방의 시대, 사용자들도 똑똑해져야 ...

이런 원칙이 적용된다면 자연스럽게 사용자들도 데이터에 대한 버전 개념을 알아야 합니다.  현재 누구나 버전 개념을 알고 있습니다.  일반화가 되었지요?  마이크로소프트 윈도가 2000 인지 7 인지와 같이 이름이 달라지는 경우도 있고, 1.0, 2.0 하는 숫자들도 잘 알고 있습니다.  데이터와 정보에도 버전 개념이 들어간다면 손쉽게 언제 어떻게 업데이트가 된 데이터이고 정보인지 알 수 있게 될 것입니다.

경우에 따라서는 데이터를 활용한 분석 및 2차 가공 정보를 만드는 동안에 새로운 버전의 데이터가 릴리즈될 수도 있습니다.  아마도 과거 데이터로 작업하던 사람에게는 참 괴로운 일이겠지요? 그렇지만, 이런 과정은 너무나 자연스러운 것이니 쉽게 받아들여질 것입니다.  

더욱 들어간다면 소프트웨어 개발의 경우에는 라이브러리나 운영체제 등에 의해 의존성(dependency)가 발생합니다.  개방형 데이터는 어떨까요?  데이터 역시 2차 가공 데이터나 데이터-서비스 융합과 관련한 변화가 발생하는 경우라면 역시 의존성이 발생할 가능성은 많습니다.  이를 어떻게 슬기롭게 대처할 것인지에 대해서도 사용자들이 구체적인 방안을 가지고 있어야 합니다.


무엇보다 중요한 것은 사람입니다.  프로그램을 개발할 때에도 개발자들이 어떤 역할을 맡아서 무엇을 하는지가 중요하고, 이것이 오픈소스 프로젝트라고 하더라도 마찬가지입니다.  그들을 존중하는 것이 대단히 중요합니다.  데이터와 정보는 흔히 개방한 사람들은 잊혀지기가 쉽습니다.  그렇지만, 이를 통한 새로운 가치창출이 될 때에도 관여하는 것은 모두 사람들입니다.  그렇기 때문에 데이터를 단순한 객체로 보지 말고 사람들이 협업을 통해서 만들어낸 성과물로 보는 태도를 가져야 합니다.  

저작자 표시 비영리
신고
크리에이티브 커먼즈 라이선스
Creative Commons License

WRITTEN BY
하이컨셉
미래는 하이컨셉, 하이터치의 세계라고 합니다. 너무 메마르고 딱딱한 이야기보다는 글로벌 시대에 어울리는 세계 각국의 이야기, 그리고 의학과 과학을 포함한 미래에 대한 이야기의 세계로 여러분을 초대합니다.

받은 트랙백이 없고 ,