감리

공공데이터 관리지침_기계판독이 가능한 형태, 특성별 제공방식 선정 권고사항, RDF, LOD, 품질관리

스윙스윙 2021. 9. 20. 13:19

▣ 공공데이터 관리지침_기계판독이 가능한 형태, 특성별 제공방식 선정 권고사항, RDF, LOD, 품질관리

공공데이터 관리지침

[시행 2021. 10. 26.] [행정안전부고시 제2021-70호, 2021. 10. 26., 전부개정]

 제2조(정의) 이 지침에서 사용하는 용어의 정의는 다음과 같다.   

1. "공공기관"이란 국가기관, 지방자치단체 및 「지능정보화 기본법」 제2조제16호에 따른 공공기관을 말한다. 

2. "공공데이터"란 데이터베이스, 전자화된 파일 등 공공기관이 법령 등에서 정하는 목적을 위해 생성 또는 취득하여 관리하고 있는 광(光) 또는 전자적 방식으로 처리된 자료 또는 정보로서 다음 각 목의 어느 하나에 해당하는 것을 말한다. 

가. 「전자정부법」 제2조제6호에 따른 행정정보 

나. 「지능정보화 기본법」 제2조제1호에 따른 정보 중 공공기관이 생산한 정보 

다. 「공공기록물 관리에 관한 법률」 제20조제1항에 따른 전자기록물 중 공공데이터법 시행령(이하 "대통령령" 또는 "영"이라 한다) 제1조의2에서 정하는 전자기록물 

라. 그 밖에 대통령령으로 정하는 자료 또는 정보 

3. "기계 판독이 가능한 형태"란 소프트웨어로 데이터의 개별내용 또는 내부구조를 확인하거나 수정, 변환, 추출 등 가공할 수 있는 상태를 말한다. 

4. "오픈포맷"이란 기계 판독이 가능한 형태로서 비용 또는 그 밖의 사용에 제약 없이 최소 하나 이상의 소프트웨어로 처리할 수 있는 파일 포맷을 말한다. 

5. "제공"이란 공공기관이 이용자로 하여금 기계 판독이 가능한 형태의 공공데이터에 접근할 수 있게 하거나 이를 다양한 방식으로 전달하는 것을 말한다. 

6. "주기성 공공데이터"란 일정 시간을 간격으로 지속적으로 생성ㆍ수집되는 공공데이터를 말한다. 

7. "오픈API"란 불특정 다수의 사용자가 이용할 수 있도록 외부에 개방된 API(Application Programming Interface)로서, 갱신되는 공공데이터를 실시간으로 이용자가 받을 수 있도록 하는 표준화된 방식을 말한다. 

8. "데이터베이스(DB)"란 정보가 체계적으로 구조화되어 저장된 전자적 집합물을 말한다. 

9. "개방DB"란 이용자에게 공공데이터를 제공하기 위해 공공기관의 원천DB로부터 제공대상 공공데이터를 수집ㆍ가공하여 구축한 DB를 말한다. 

10. "메타데이터"란 공공데이터베이스 내 데이터의 체계적인 관리와 편리한 검색 및 활용을 위해 데이터의 구조, 속성, 특성, 이력 등이 표현된 자료를 말한다. 

 제3조(기본원칙)   공공기관은 누구든지 공공데이터를 편리하게 이용할 수 있도록 제공해야 하며, 보편적 이용권 확대를 위해 필요한 조치를 취해야 한다. 또한 다른 법률에 특별한 규정이 있는 경우 또는 법 제28조제1항 각 호의 경우를 제외하고는 공공데이터의 영리적 이용인 경우에도 이를 금지 또는 제한해서는 아니 된다. 

공공기관은 공공데이터를 원천데이터로 제공하도록 노력하여야 하며, 통계처리한 데이터 등을 제공하는 경우에도 이용자의 활용성을 고려하여 최대한 상세한 형태로 제공해야 한다. 

공공기관은 이용자가 공공데이터를 효율적으로 이용할 수 있도록 소관 공공데이터를 기계 판독이 가능한 형태로 정비하고 오픈포맷으로 제공해야 한다. 

공공기관은 해당 기관이 생성ㆍ취득하여 관리하는 공공데이터의 적정한 품질수준 확보를 위하여 지속적으로 품질을 관리해야 한다. 

⑤ 공공기관은 소관 정보시스템을 통합하거나 폐지하는 경우 공공데이터의 제공과 보존을 위해 노력하여야 한다. 

 

 제5조(관리체계)   ① 공공기관의 장은 법 제12조에 따라 공공데이터제공책임관 및 실무담당자를 임명하고 이를 해당 기관의 인터넷 홈페이지를 통해 공표해야 한다. 공공데이터제공책임관 및 실무담당자는 법 제12조제2항 각 호의 사항을 담당한다. 

② 공공기관의 공공데이터를 직접 생성ㆍ취득ㆍ관리하는 부서(이하 "업무부서"라 한다.) 및 담당자("이하 업무담당자"라 한다.)는 다음 각 호의 사항을 수행하고, 이를 해당 기관의 공공데이터제공책임관과 실무담당자에게 상시 통보해야 한다. 

1. 생성ㆍ수집 단계: 공공데이터 제공을 고려한 정보시스템의 구축ㆍ설계, 제공제외 대상의 분리 기반 마련 등 

2. 제공을 위한 처리 단계: 공공데이터 제공대상의 확인, 제공제외 대상의 기술적 분리 및 제3자 이용허락 확보, 제공방식의 결정 등 

3. 등록ㆍ제공 단계: 소관 공공데이터 목록 및 데이터를 공공데이터 포털의 공공데이터목록등록관리시스템(이하 "목록등록관리시스템"이라 한다)에 등록, 현행화 관리, 제공신청 처리 등 

4. 제공 사후관리 단계: 소관 공공데이터의 목록 제외, 제공중단 및 내용변경, 오류신고 및 이용불편사항 처리 등 

5. 품질관리 및 제공표준: 소관 공공데이터 품질관리 활동, 제공표준 데이터셋 관리 등 

6. 기타 : 공공데이터 정책 수립지원, 신규 서비스 개발ㆍ정보시스템 구축 시 사전 협의 진행, 중복ㆍ유사 서비스 실태조사 및 정비결과 이행 등 

③ 공공기관의 장은 공공데이터 포털을 통한 원활한 공공데이터 제공 관리를 위해 해당 기관의 공공데이터제공책임관 및 실무담당자 정보와 업무부서 및 업무담당자 정보를 목록등록관리시스템에 등록해야 한다. 공공기관의 장은 전단의 등록사항에 변경이 있는 경우 지체 없이 변경사항을 등록해야 한다. 

④ 공공기관의 장은 필요한 경우 공공데이터제공책임관 및 실무담당자의 지정ㆍ역할 등에 관한 규정을 제정하고 정비해야 한다. 

 

제6조(공공데이터 생성ㆍ수집) 공공기관의 장은 국민의 공공데이터 이용권의 보편적 확대를 위해 다음 각 호의 사항을 고려하여 공공데이터를 생성ㆍ수집해야 한다.   

1. 공공기관이 보유ㆍ관리하는 정보시스템을 고도화하거나 신규로 구축하는 경우 공공데이터의 제공을 고려한 데이터베이스 설계ㆍ구축 

2. 공공데이터를 기계 판독이 가능한 형태로 정비 

3. 법 제17조제1항단서에 따른 제공대상이 아닌 정보가 포함된 공공데이터의 분리ㆍ제공 기반의 마련 

4. 오픈API 방식의 실시간 공공데이터 제공을 위한 개방DB 구축 

5. 「공공기관의 데이터베이스 표준화 지침(행정안전부 고시)」에 따른 해당 기관의 데이터베이스에 대한 표준화 

6. 법 제22조와 본 지침 제3장에 따른 공공데이터 품질확보 

7. 법 제23조와 본 지침 제4장에 따른 제공표준의 준수

 

제7조(제공대상 여부의 확인)   ① 공공기관의 장은 다음 각 호의 어느 하나에 해당하는 정보를 포함하는 경우를 제외하고 해당 기관이 보유ㆍ관리하는 모든 공공데이터를 제공해야 한다. 

1. 「공공기관의 정보공개에 관한 법률」 제9조에 따른 비공개 대상 정보 

2. 저작권 등 다른 법령에서 보호하고 있는 제3자의 권리가 포함된 정보. 단, 권리자의 정당한 이용허락을 받은 경우에는 제공대상에 해당한다. 

② 공공기관의 장은 제1항 각 호에 따라 제공대상에 해당하지 않는 데이터라 하더라도, 해당 부분을 기술적으로 분리할 수 있는 경우에는 이를 제외한 공공데이터를 제공해야 한다. 

 

제8조(저작물이 포함된 공공데이터의 관리)   ① 공공기관의 장은 저작물이 포함된 공공데이터를 관리하는 경우 제3자의 권리가 침해되지 않도록 권리 소재 및 권리자의 이용허락 범위를 명확히 파악해야 한다. 이 경우 권리자의 이용허락은 서면 등 명시적으로 의사를 확인할 수 있는 방법으로 받아야 한다. 

② 공공기관의 장은 저작물이 포함된 공공데이터를 제공할 때에는 「저작권법」 등 관련 법령에 따른 공공누리 유형을 부착하여 공공데이터의 이용허락 범위를 표시해야 한다. 이 경우 소관 공공데이터에 제3자의 권리가 포함된 경우라도 권리자가 허락하는 경우에는 이용자가 저작물을 자유롭게 이용할 수 있도록 제공해야 한다. 

③ 공공기관의 장은 소관 공공데이터에 포함된 저작물이 업무상 작성하여 공표된 것이거나 계약에 따라 해당 저작물의 저작재산권 전부를 보유한 경우에는 「저작권법」 제24조의2제1항 각 호의 어느 하나에 해당하는 경우를 제외하고 이용자가 별도의 이용허락 없이 자유롭게 이용할 수 있도록 제공해야 한다. 

 

제10조(공공데이터 목록의 등록)   ① 공공기관의 장은 해당 기관의 소관 공공데이터 목록을 생성 또는 수집ㆍ취득한 날부터 15일 이내 별표 1의 등록기준을 준수하여 목록등록관리시스템에 등록해야 한다. 

② 공공기관의 장은 목록등록관리시스템에 등록된 공공데이터 목록이 변경된 경우에는 변경사항이 발생한 날부터 10일 이내에 목록등록관리시스템에 변경등록 해야 한다. 

③ 행정안전부장관은 누락된 공공데이터 목록에 대해 20일 이내의 기간을 정하여 해당 공공기관의 장에게 등록을 요청해야 하고, 해당 공공기관의 장은 정해진 기간 내에 등록해야 한다. 

④ 공공기관의 장은 기관의 웹사이트 등을 통해 이미 공개된 데이터는 특별한 사유가 없으면 공공데이터 포털에도 등록해야 한다.

 

제11조(공공데이터의 등록)   ① 공공기관의 장은 공공데이터를 등록할 때 별표 1의 등록기준을 준수하여 등록해야 한다. 

② 공공기관의 장은 법 제17조제1항 각 호에 따라 제공제외된 공공데이터의 제외 사유가 소멸하는 경우에는 해당 데이터를 지체 없이 제공해야 한다. 

  

제12조(공공데이터의 현행화)   ① 공공기관의 장은 공공데이터 포털에서 제공하는 공공데이터의 최신성, 정확성이 유지되도록 해야 한다. 

② 공공기관의 장은 주기성 공공데이터를 현행화하는 경우 최신 공공데이터를 추가하는 형태로 관리하여 과거 공공데이터(최신 공공데이터를 추가하기 전의 ‘지난 주기에 해당하는 공공데이터’를 말한다)와 최신 데이터를 함께 제공해야 한다.

 

제15조(제공신청에 의한 공공데이터의 제공)   ① 법 제27조에 따른 공공데이터의 제공신청을 받은 공공기관의 장은 요청을 받은 날부터 10일 이내에 제공 여부를 결정해야 한다. 다만, 부득이한 사유가 있는 경우 그 기간의 만료일 다음 날부터 기산하여 10일 이내의 범위에서 제공 여부 결정기간을 연장할 수 있다. 이 경우 공공기관의 장은 연장된 사실과 연장사유를 신청인에게 지체 없이 통보해야 한다. 

② 공공기관의 장은 제1항에 따라 공공데이터 제공을 결정한 때에는 지체 없이 제공 방법ㆍ절차 등을 신청인에게 통지하고, 제10조부터 제11조까지 규정에 따라 공공데이터 목록 및 제공 공공데이터를 목록등록관리시스템에 등록해야 한다. 

③ 법 제17조제1항의 제공제외 대상에 해당하여 공공데이터의 제공거부결정을 한 때에는 지체 없이 거부결정의 내용과 사유를 신청인과 행정안전부장관에게 통보해야 한다. 

 

제16조(제공비용의 부담)   공공기관의 장은 공공데이터를 무상으로 제공해야 한다. 다만 공공데이터 제공에 비용이 드는 경우 필요최소한의 비용을 이용자에게 부담시킬 수 있다.

② 제1항 단서에 따른 필요최소한의 비용은 공공데이터 제공에 드는 실비 수준의 경비를 말하며, 공공데이터 이용을 저해하는 과도한 제공비용은 부과할 수 없다. 이용자에게 비용을 부담시키려는 기관은 영 제28조를 참고하여 비용 부과기준을 해당 기관의 규정으로 마련하고 기관 홈페이지 등을 통해 공개해야 한다. 

③ 공공기관의 장은 제1항과 제2항에도 불구하고 필요한 예산을 확보하는 등 공공데이터를 무상으로 제공하기 위해 노력해야 한다. 

 

제25조(공공데이터의 표준 관리)   ① 공공기관의 장은 데이터 간의 연계ㆍ활용성 제고를 위해 제공하는 공공데이터의 용어와 형식이 소관 데이터베이스에 저장된 용어와 형식과 일관성을 유지하도록 관리해야 한다. 다만, 공공데이터를 제공할 때 준수해야 할 표준이 별도로 정해져 있는 경우는 예외로 한다.

② 공공기관의 장은 공공데이터의 체계적인 관리와 편리한 검색 및 활용을 위해 공공데이터와 해당 공공데이터의 메타데이터를 함께 제공해야 한다. 

③ 공공기관의 장은 제공대상 공공데이터의 표준 및 품질관리를 위해 제공대상 공공데이터가 생성된 원천 데이터베이스 등 생성경로 또는 출처를 관리해야 한다. 

 

제26조(제공표준)   ① 행정안전부장관은 민간의 활용수요 등을 고려하여 동일한 항목과 형식으로 제공해야 하는 데이터의 묶음 및 집합(이하 "데이터셋"이라 한다)을 정할 수 있으며, 데이터셋 제공 시 적용해야 하는 표준(과거 "개방표준"을 말한다)(이하 "제공표준"이라 한다)을 제시할 수 있다.

② 공공기관의 장은 제1항의 제공표준 제정ㆍ개정에 대한 수요가 있는 경우 별지 제2호서식의 공공데이터 제공 표준 제정요구서 또는 별지 제3호서식의 공공데이터 제공 표준 개정요구서를 작성하여 행정안전부장관에게 제출할 수 있으며, 행정안전부장관은 제출된 수요를 검토하여 그 결과를 기관에 통보해야 한다. 

③ 행정안전부장관은 제1항과 제2항에 따른 제공표준 마련을 위해 소관 기관 등 이해관계자와 사전에 협의ㆍ조정해야 하며, 필요한 경우 공공기관 및 전문가로 구성된 협의체를 구성하여 제공표준에 대한 의견을 수렴할 수 있다. 

④ 행정안전부장관은 제공표준 데이터셋 목록 및 제공표준을 공공데이터 포털에 공개해야 한다. 

⑤ 공공기관의 장은 행정안전부장관이 정한 데이터셋을 보유하고 있는 경우에는 제공표준을 준수하여 데이터셋을 제공해야 한다. 

⑥ 행정안전부장관은 이미 정한 제공표준 데이터셋과 제공표준을 변경 또는 폐기하는 등 개정이 필요한 때에는 소관 공공기관의 장과 협의하여 개정을 진행해야 한다. 

 제28조(중복ㆍ유사 서비스 개발ㆍ제공 금지)   ① 공공기관의 장은 공공데이터를 활용하여 민간이 제공하는 서비스와 중복되거나 유사한 서비스를 개발ㆍ제공해서는 아니 된다. 

② 행정안전부장관은 법 제15조의3 및 영 제14조의3에 따라 실태조사를 실시하고, 법 제5조에 따른 공공데이터전략위원회가 개선 또는 시정이 필요하다고 심의ㆍ의결한 중복ㆍ유사 서비스에 대해서는 개선 또는 시정을 권고해야 한다.

 제29조(중복ㆍ유사 서비스 정비 기준) 행정안전부장관은 법 제15조의3제2항에 따른 개선 또는 시정을 권고하는 경우 다음 각 호의 사항을 종합적으로 고려해야 한다.   

1. 공공데이터의 활용 여부 

2. 서비스의 공공성 여부 

3. 민간서비스와의 중복ㆍ유사성 정도 

4. 민간서비스로 대체가 가능한지 여부 

 제30조(중복ㆍ유사 서비스 정비 방식) 행정안전부장관은 제29조에 따른 개선 또는 시정 권고 대상인 중복ㆍ유사 서비스에 대해 다음 각 호의 기준에 따라 정비 방식을 결정할 수 있다.   

1. 민간서비스와 유사성이 높고 민간대체성이 충분한 경우 : 서비스 폐지 

2. 일부 기능이 민간과 중복되거나 유사한 경우 : 중복기능 제거 또는 고도화 중지 

3. 민간대체성이 충분하지 않거나 상호 보완적 관계 유지가 필요한 경우 : 기술이전 또는 상생협력

 

 

▣ 공공데이터 제공 관리 실무 매뉴얼(21년 10월)

■ 기계판독이 가능한 형태의 포맷 단계별 구분비교

구분 1단계 2단계 3단계 4단계 5단계
기계판독이
가능한 형태
미충족포맷
(포털등록불가)
최소충족포맷 오픈포맷*
특징 특정
소프트웨어에서
읽을 수만 있는
데이터로
자유로운 수정,
변환 불가
특정
소프트웨어에서
읽고 수정 , 변환
가능
최소 한가지 이상의 비독점적 소프트웨어에서 읽고 수정, 변환 가능 URI 기반으로
데이터 속성 특성
관계를 기술하고
있는 데이터 구조
웹상의
다른
데이터와
연결, 공유
가능
예시 PDF HWP, XLS CSV,
JSON, XML
RDF LOD

* 오픈포맷(open format) : 비용 또는 그 밖의 사용에 제약없이 최소 한 가지 이상의 무료/자유/오픈소스 소프트웨어로 처리(수정, 편집 등) 할 수 있는 기계판독 가능한 데이터포맷(관리지침 제2조 제4호)

- 오픈포맷의 형식은 이미지, 텍스트, 테이블 또는 지리데이터 등 데이터 유형에 따라 다를 수 있으며, 비정형 데이터는 국제표준규격을 준수하여야 함

 

* URI(Uniform Resource Identifier, 통합자원식별자) : 웹 상의 특정 콘텐츠를 다른 콘텐츠(텍스트, 이미지, 동영상 등)들과 구별하여 인식, 확인할 수 있는 고유값(유일식별자)

 

* RDF(Resource Description Framework)

XML등을 이용한 웹에 관련된 메타데이터에 대한 범용적인 시멘틱 웹 기술 언어임

메타데이터의 속성(프로퍼티)을 정의함으로써 서로 다른 응용 프로그램끼리의 데이터 교환 등이 효율적임

 

* LOD(Linked Open Data)

시멘틱 웹이 표방하는 데이터웹(Data Web)을 구체적으로 구현하는 방법으로 인터넷 상의 각 사이트에서 RDF(Resource Desciption Framework)형식의 데이터를 RESTful프로토콜을 사용하여 정형화 데이터를 제공하는 것을 말함. Linked Data를 통해 관련된 다양한 데이터를 서로 연결함으로써 하나의 지식베이스처럼 사용 가능

자유롭게 사용이 가능하며, 저작권 표시 및 변경 허락 조건하에 재배포가 가능한 링크 기반 개방형 데이터이다.

데이터를 RDF형식으로 변환하여 웹상에 Linked Open Data 형식으로 발행

 

*ODF(Open Document Format) : XML 파일 형식을 바탕으로 구현된 사무용 전자문서 파일 형식으로 많은 오픈 사용 오피스 소프트웨어(아래아 한글, MS Word, Libre 등)에서 활용 가능함. 워드프로세서(문서)는 ODT 확장자를 사용하여 오피스 소프트웨어에서 '다른 이름으로 저장'하는 경우 파일 형식을 ODT포맷으로 변환할 수 있다.(워드프로세서 : ODT, 스프로데시트 : ODS, 프로젠테이션 : ODP 등)

 

■ 특성별 제공방식 선정 권고사항

 

 


2018년 14번

정답 : 3번

XML 은 3 단계 기계 판독이 가능한 형태로 정의되어 있다

 


2021년 21번

정답 : 2번

업데이트가 빈번한 대용량 데이터 : 오픈API

주기적으로 업데이트 되는 파일 형태의 데이터 : 파일데이터

정적데이터 형태로 연관성이 높은 데이터가 많은 경우 : LOD

 

 

 


2015년 21번

정답 : 3번

PDF는 특정 소프트웨어에서 읽을 수만 있는 데이터로 자유로운 수정, 변환 불가

 

* 법 변경 2021. 10. 26., 전부개정

 


2014년 2번

정답 : 2번

공공데이터 구축단계 - 데이터 구조 일관성 확보

공공데이터 운영단계 - 연계 데이터 정합성 관리(?) -> 구축단계임

 

*법령변경

계획단계 기관 데이터베이스 품질관리 조직 및 인력
기관 데이터베이스 품질목표 정의
기관 중점 데이터베이스 품질관리 대상 선정
기관 데이터베이스 품질 진단,개선 계획
기관 데이터베이스 표준화 방안
연계데이터 품질확보 방안
그 밖에 기관 데이터베이스 품질관리를 위해 필요한 사항
구축단계 데이터 표준화 (코드, 데이터사전, 도메인, 명명규칙 등의 표준화)
연계 데이터 표준화(연계 대상 데이터 및 연계 절차, 규칙 등)
데이터 구조의 일관성 확보 및 오류 데이터 입력 방지 등
연계 데이터 정합성 관리
데이터베이스 구축 관련 산출물 관리
- 엔터티속성 정의서, 테이블, 컬럼 정의서, 논리물리 ERD
- 연계 데이터 정의서, 업무규칙(BR:Business Rule) 정의서 등
운영단계 데이터 품질 진단 및 개선
데이터 품질관리 관련 산출물 점검
데이터 변경에 따른 문서 최신성 확보 및 이해관계자 통지
활용단계 데이터 품질 오류 신고 관리
품질 오류 신고 접수 및 처리
품질 오류 조치 결과 통보
품질 오류 현황 및 보고 관리
데이터 활용 성과 평가