정부공공IT

공공기관 문서포맷 33년만의 대변혁…hwp서 hwpx로 바뀐다

박세아

[디지털데일리 박세아 기자] 지난 30여년 간 정부 및 공공기관 등에서 쓰여 왔던 공공문서 표준 포맷이 인공지능 시대에 맞춰 새롭게 개정된다.

10일 관련업계에 따르면 행정안전부는 전자문서 관련 기관과 전문가들 자문을 통해 공공기관에서 사용되는 현재 문서 표준 포맷을 개방형 문서 포맷으로 바꾸기로 하고 이를 위한 ‘공무원전자문서저장 가이드라인’을 배포하기로 했다. 정부는 11일 국무회의 보고를 거쳐 해당 가이드라인 배포에 나설 것으로 관측된다.

가이드라인은 공공문서 작성 방식을 과거 폐쇄형 문서 포맷에서 개방형 문서 포맷으로 바꾸는 것을 골자로 한다. 인공지능 시대에 정부에서 생산되는 문서가 의미 있게 사용될 수 있게 하는 목표다. 또 방대한 공공데이터 활용성을 극대화하는 차원으로도 풀이된다.

가이드라인 형태로 법적인 구속력을 갖는 것은 아니지만 국무회의를 통해 보고된 내용이 전파되는 만큼 사실상 정부 및 공공기관에서의 개방형 문서포맷 활용이 증대될 것으로 보인다.

현재 정부 및 공공기관에서 사실상 표준으로 사용되고 있는 한컴 ‘아래아한글’과 같은 문서포맷의 경우 문서 내에서 키워드나 파일명 검색은 유효했지만, 파일 내용 전체를 검색하는 것은 어려웠다. 하지만 개방형 문서 포맷으로 변화하면 파일 내용 전체 검색 등 지능형 문서 사용이 가능해진다.

정부 및 공공기관에서는 ‘아래아한글’과 외부 기안 방식 문서 등으로 공문서를 생성했는데 이 안에서 특정 데이터를 추출하기 힘들었다. 전자문서 상에서 의미있는 정보를 추출하기 위해선 기계가 자동으로 읽어 들일 수 있는 바탕이 마련돼야 한다.

하지만 기존 문서 포맷에서는 OCR 등에서 가장 중요한 위치 지정 등의 기능 구현이 어려웠다. 예를 들어 문서 상단 오른쪽에 사진과 이름이 위치해 있는 공문서 양식이라면 이를 특정해 정보를 추출할 수 있지만 현재 포맷에서는 이러한 명령이 불가능하다.

이를 해결하기 위해서 국가 간 무역을 할 때 등에 쓰이던 고도화된 문서 표준인 XML방식을 활용해 인공지능 시대에 새로운 전자문서 형식을 지원하게 된 것이다.

그동안 공공문서에 아래한글이 독점적으로 사용되던 것에 대한 지적이 이어지면서 특정업체에 대한 종속성을 탈피하기 위한 시도도 있었다. 하지만 이번 가이드라인은 단순히 아래한글 등 특정 포맷을 쓰지 않도록 하는 게 아니라, 어떤 문서 포맷에서도 데이터를 잘 추출할 수 있는 형식을 위한 접근법이라는 것이 관련 업계 설명이다.

이번 가이드라인 대로라면 예컨대 아래아한글 hwp확장자가 개방형 문서 표준인 hwpx로 모두 바뀐다. 이와 같은 변화는 33년만이다.

전자문서 업계의 한 전문가는 "정부 문서를 머신리더블한(기계판독할 수 있는)형태로 작성함으로써 데이터 활용성을 확대시키는 것은 시대적 흐름"이라며 "공직사회가 문서 형식에 치중돼 있어 많은 업무 비효율이 있었던만큼, 이번에 발표될 새로운 문서 표준이 공공기관 종사자뿐만 아니라, 일반 시민 입장에서도 정보 접근성 측면에서 개선되는 결과로 나타날 것"이라고 설명했다.

박세아
seeall@ddaily.co.kr
기자의 전체기사 보기 기자의 전체기사 보기
디지털데일리가 직접 편집한 뉴스 채널