
국가 수준의 데이터 기반 의사결정을 위한 분산된 교육데이터 관리시스템 설계 및 구현
초록
최근 사물 인터넷(IoT), 클라우드 컴퓨팅, 인공지능(AI), 빅데이터 등 정보통신기술(ICT)을 플랫폼으로 구축·활용하여 기존 전통적인 운영 방식과 서비스 등을 혁신하는 디지털전환(DX)이 활발하게 추진되고 있다. 교육분야도 코로나19를 경험하며 급격하게 디지털전환의 필요성이 대두되었으며 복잡한 교육정책과 교육행정분야에서 보다 과학적 의사결정을 위해 데이터를 활용하기 시작하였다. 또한 AI와 빅데이터 기술을 접목한 디지털교과서를 활용하여 학습자와 교수자의 상호작용을 촉진하고 학습자의 학습성과를 진단하고 처방하려는 국가 수준의 사업들이 추진중에 있다. 하지만 교수학습 및 교육행정 데이터는 (대)학교, 교육청, 교육유관기관, 민간기관 등에 산재되어 있고 통합 및 연계를 위한 데이터 표준화, 데이터 거버넌스 등 지원체제가 필요하다. 특히, 지속가능성, 객관성, 효율성 등을 필요로 하는 대학에서 기관 연구(IR)가 활발하게 추진하고 있다. 본 연구는 17개 시도교육청에 분산된 학생과 교사의 정보를 포함하고 있는 교육행정정보시스템(NEIS), 교육재정정보시스템(K-edufine) 등에 축적된 데이터와 학업성취도, 학교시설현황 등 교육유관기관이 보유한 데이터를 통합하고 나아가 AI디지털교과서 허브플랫폼에 쌓이게 될 학습활동 데이터를 연계하기 위한 교육데이터관리(EDMGR)시스템의 아키텍쳐를 소개하고 시스템 개발한 결과를 소개한다.
Abstract
Recently, digital transformation (DX) is actively promoted by building and utilizing information and communication technology(ICT) such as the Internet of Things (IoT), cloud computing, artificial intelligence(AI), and big data as platforms to innovate existing traditional operation methods and services. The education sector has also experienced COVID-19, and the need for digital transformation has emerged rapidly, and data has begun to be used for more scientific decision-making in the field of complex education policy and educational administration. In addition, national-level projects are being promoted to promote interaction between learners and instructors using digital textbooks that combine AI and big data technology, and to diagnose and prescribe learners' learning outcomes. However, teaching and learning and educational administration data are distributed across schools, MPOE(Metropolitan and Province offices of education), education-related organizations, and private institutions, and support systems such as data standardization and data governance are needed for integration and linkage. In particular, institutional research (IR) is actively promoted in universities that require sustainability, objectivity, and efficiency. This study introduces the architecture of the education data integration system to integrate the data accumulated in the Educational (Administration) Information System(NEIS) and the Education Finance Information System(K-edufine), which contain the information of students and teachers distributed in 17 MPOE, and the data held by education-related organizations such as academic achievement and the status of school facilities, and etc, to link the learning activity data that will be accumulated on the AI digital textbook hub platform, and introduce the results of the system development.
Keywords:
DDDM(Data-Driven Decision-Making), Education Data, EDMGRS(Education Data Manager System), Education Cloud, DataPlatform, ScientificEducationAdministration키워드:
데이터기반의사결정, 교육데이터, 교육데이터관리시스템, 교육클라우드, 데이터플랫폼, 과학적 교육행정1. 서론
1.1 교육데이터의 정의
데이터는 어떠한 사실, 개념, 명령을 과학적인 실험이나 관측 결과로 얻은 수치, 정상적인 값 등 실체의 속성을 숫자, 문자, 기호 등으로 표현한 것이다. 즉 잘 정리되지 않은 원천 자료(Raw data)로써 처리되는 대상으로 가공 처리하여 유용한 형태로 잘 정리된 것은 정보(Information)이라고 한다. 법률적으로 데이터를 정의한 데이터기반행정 활성화에 관한 법률 제2조1항은 "데이터란" 정보처리능력을 갖춘 장치를 통하여 생성 또는 처리되어 기계에 의한 판독이 가능한 형태로 존재하는 정형 또는 비정형의 정보를 말한다". 또한 교육관련기관의 정보공개에 관한 특례법 제2조1항에서 ""정보"란 교육관련기관이 학교교육과 관련하여 직무상 작성 또는 취득하여 관리하고 있는 문서(전자문서를 포함한다)·도면·사진·필름·테이프·슬라이드, 그 밖에 이에 준하는 매체 등에 기록된 사항을 말한다". 일반적으로 데이터는 정보 보다는 작은 단위로 정의되고 사용되고 교육분야에서는 교육정보라는 용어를 많이 사용해 왔다. 해외에서는 2000년대 초반부터 교육데이터에 대한 용어를 사용하여 왔고 학생들의 학습 과정과 교사의 교육활동 과정, 교육행정업무 처리 과정에서 생성되는 데이터를 총칭한다고 했다. 국내에서는 2023년 이후 한국교육학술정보원 교육데이터센터에서 다음과 같이 정의한 바 있다[1].
"교육분야에서 교수자, 학습자, 행정가 등의 교수학습 주체와 사물인터넷(IoT) 등 정보처리능력을 갖춘 장치를 통하여 생성 또는 처리되어 기계에 의한 판독이 가능한 형태로 존재하는 정형 또는 비정형의 데이터"
1.2 교육데이터의 분류
교육데이터는 형태와 목적에 따라서 분류가 가능하다. 먼저 형태에 따라서 Table 1과 같이 정형, 반정형, 비정형으로 구분한다[2]. 정형데이터는 학교, 교사, 학생 등의 기본 정보를 기반으로 대부분 정제된 텍스트 데이터로 저장되고, 비정형데이터는 이미지, 동영상, 음성과 같은 멀티미디어 데이터 형태로 저장된다. 반정형데이터는 디지털텍스트북, 이러닝 콘텐츠 등과 같이 두 가지 형태가 혼합되어 있는 경우로써 분류가 애매한 경우에 해당한다.
교육데이터는 형태외에 목적과 수준에 따라서 정의할 수 있다. 교수학습 과정에 생성되는 학습데이터와 교육행정 과정에 생성되는 데이터와 통계성 데이터로 나눌수 있다. 또는 교수학습데이터와 교육 관리용 데이터로 구분하기도 한다[3].
UNESCO 보고서에서는 학습 데이터 분석 수준을 세 가지 단계로 구분하고, 이를 "거시(Macro), 중간(Meso), 미시(Micro) 수준 분석 간 융합(Convergence of Macro, Meso and Micro-level Analytics)"이라는 개념으로 설명하고 있다. 먼저 거시 수준(Macro-level Analytics)은 교육 정책 결정, 기관 차원의 학습 성과 및 전반적인 교육 환경을 분석하는 단계. 국가 또는 기관 단위에서 학습 데이터를 활용한다. 둘째, 중간 수준(Meso-level Analytics)은 교육 기관 내에서의 특정 과정, 교수법, 학과 및 교직원 간의 데이터 분석을 다루며 교육 프로그램의 효과성을 평가하는 데 중점을 둔다. 셋째, 미시 수준(Micro-level Analytics)은 개별 학습자의 행동, 성취도, 학습 패턴을 분석하는 단계로써 개인 맞춤형 학습 지원에 활용된다[4].
1.3 교육데이터의 활용 목적
맞춤형 교수학습 지원을 위해 교수자에게 HTHT(High Tech High Touch) 기반의 서비스를 지원한다. HTHT는 빅데이터와 AI 기술을 활용하여 교사의 행정 및 교수학습 과정에 도움을 제공하여 확보한 시간과 학생의 정보를 이용하여 보다 상호작용과 감성적 접근을 가능하게 하는 개념이다. 이를 위해 교육데이터를 기반으로 한 대시보드(Dashboard)를 활용하여 개인별 학습을 지원하며, 축적된 교육데이터를 학습하여 AI 기술(분류, 예측 등)을 적용함으로써 개별 학습자의 특성에 맞춘 맞춤형 학습을 가능하게 한다. 특히, 학습자의 교육과정에 평가 방법에 적용하고 맞춤 학생지원을 통한 교육의 품질을 높이려는 목적으로 사용되고 있다[5,6].
교육 행정과 정책의 결정과정에서 이해 관계자들의 설득을 위해 데이터를 기반으로 증거를 제시하면 직관이나 경험에 의하여 의사결정하는 것보다 매우 과학적인 결정을 할 수 있다[7]. 일반적으로 조직에서 데이터 기반 의사졀정을 해야하는 이유를 수 많은 문헌을 학습한 가장 많이 알려진 생성형 AI 5개에게 질의한 결과 Table 2와 같이 객관성(Objectivity),효율성(Efficiency),경쟁력(Competitiveness),책임성(Accountability),정확성(Accuracy),성과측정(Performance Measurement),예측(Predict),신뢰성(Reliability),위험최소화(Risk Minimization) 등의 순으로 조사되었다[8-12].
2. 선행 및 관련연구
2.1 공공분야 의사결정 및 데이터플랫폼 사례
2013년 서울시 심야 버스(올빼미 버스) 운행 노선 결정올 위해 전화 통화 데이터를 사용한 사례가 있다. 서울시는 KT와 MOU를 맺고 휴대전화 정보를 새벽 0시부터 5시까지 통신자료 30억 건을 활용하여 해당 시간 내 지역 통화량과 서울시가 보유한 교통데이터를 종합하여 유동인구 통계를 추출하여 최적의 버스 노선을 결정하였다. 2018년 행정안전부는 정부 빅데이터 공통기반 시스템인 혜안(慧眼)을 개발하여 각 부처 공무원에게 내부 행정망을 통해 빅데이터 분석·시각화 서비스를 지원하고 있다[13]. 국토교통부의 데이터 통합 채널은 국토 교통 분야 데이터(공공데이터, 통계 데이터, 민간산업 데이터, 메타데이터 등)의 통합 관리를 통한 데이터 접근성 및 활용성 확대를 목적으로 2020년부터 구축을 시작한 사업으로, 국토교통부와 산하기관의 데이터 수집·관리, 데이터 제공, 데이터 품질 관리, 데이터 분석, 가명 정보 처리 등의 내용을 포함하며, 데이터 검색, 데이터 분석 활용, 국토교통 통계, 참여·정보 등과 같은 기능을 제공하고 있다[14]. 보건복지부의 보건의료 빅데이터 플랫폼은 보건의료 분야 4개 기관(국민건강보험공단, 건강보험심사평가원, 질병관리청, 국립암센터)의 데이터를 개인 단위로 연계해 공공 목적의 연구에 활용할 수 있도록 연구자에게 개방하는 사업을 위해 구축된 플랫폼으로, 2018년 7월부터 2021년 8월까지 시범사업을 하였다. 여기에서 제공되는 데이터는 모든 국민에게 개방되는 것은 아니며, 중앙행정기관·지방자치단체, 공공기관·지방 공공기관, 국내 의료기관·학계·연구기관 소속 연구자가 이용할 수 있다[15].
2.2 교육분야 데이터 개방 및 데이터플랫폼 사례
교육분야는 2000년대 초반부터 교육행정정보시스템(NEIS:National Education Information System)을 모든 학교에서 사용하고 이후 교육재정정보시스템(K-Edufine)까지 사용하고 있으므로 효율적이고 과학적인 행정을 위해 기반이 일찍부터 갖춰져 있다. 또한 교육부는 2008년부터 「교육관련기관 정보공개법」을 시행하여 교육행정의 투명성·책임성 제고를 위한 공시제도를 운영하여 행정과 정책연구에 교육데이터를 적극 활용하고 있다. 하지만, 학생성적, 건강정보, 생활기록부 등 민감한 정보를 많이 포함하고 있어서 개인정보보호, 비교육적인 서열화 방지 등의 이유로 데이터 활용이 소극적인 분야이다. 교육관련기관의 정보공개에 관한 특례법과 지방재정법에 의거 유치원, 초중등학교, 대학, 지방재정 공시를 통하여 각각 알리미 서비스를 운영하고 있다. 유치원 정보공시는 매년 전국 국·공립 및 사립유치원을 대상으로 4월과 10월에 실시하며 기본현황, 유아 및 교원현황, 교육과정, 원비 및 예·결산, 급식·보건관리·환경위생 및 안전관리, 시정명령, 그 밖에 교육여건 및 운영상태 등 7개영역 23개 세부 범위로 구성되어 있다. 4월 정기공시에는 19개 항목, 10월 정기공시에는 13개 범위를 제공하고 있다. 학교정보공시는 전국 초·중·고등학교가 보유·관리하는 주요 정보 14개 항목 44개범위로 구성되어 있으며, 연 4회 정시 공시되고 있다. 대학정보공시는 고등교육법 제2조, 그 밖에 다른 법률에 따라 설치된 학교를 대상으로 학과, 학부별 전공단위, 모집단위 또는 학교 단위로 고등교육기관이 보유하고 있는 공시 정보 14개 분야, 65개 항목, 104개 세부 항목에 대한 조사를 실시하며, 연 4회 정기 공시 및 수시 공시하고 있다. 지방교육재정공시는 교육부와 시·도교육청은 「지방재정법」 제96조의2(지방재정정보화)에 따라 지방교육재정의 쓰임새를 한 곳에서 쉽고 편리하게 파악할 수 있도록 17개 시·도교육청의 재정 정보와 결산통합공시(5종), 예산통합공시(3종), 교육청 예결산서, 교육청 공시보고서, 학교정보 자료를 제공하고 있다. 2011 교육부는 수동으로 데이터를 수집하여 취합하는 통계성 업무 경감을 목적으로 NEIS, K-edufine, 8개 교육 유관기관의 데이터를 통합하여 교육정보통계시스템(EDS:Education Data Systems)을 개발했다[16]. 그리고 연구자들이 신청하면 심사를 통하여 원천(Raw) 데이터를 제공하는 EDSS(EduData Service System)이 있고 이 서비스는 데이터 기반 교육정책연구 및 학술연구에 도움을 주고 있다. 2020년 빅데이터분석 기술을 추가하여 자주 사용하는 통계자료를 쉽게 조회하여 시각화한 자료와 통계보고서를 제공하고 이를 시도교육청과 공유할 수 있도록 시스템을 개선했다.
3. 교육데이터관리시스템 개발
3.1 교육데이터관리(EDMGR)카드
EDS는 Fig. 1과 같이 NEIS와 K-edufine, 교육유관기관에서 데이터를 수집하여 시각화하고 보고서로 만들어서 교육부와 교육청에서 의사결정에 사용한다. EDS와 EDMGR시스템의 가장 큰 차별점은 자주 사용되는 데이터셋(DataSet)을 관리카드(Card)로 정형화하여 공동으로 사용하고 개별 교육청은 추가로 데이터관리카드를 생성하여 관내에서 사용할 수 있고 타 교육청으로 공유할 수도 있도록 설계되었다.
데이터관리카드는 표제부(데이터 설명), 항목(메타데이터), 데이터(대상 데이터)로 구성되어 있으며 NEIS, K-edufine, 기타 기록물관리시스템의 데이터에서 데이터를 수집·연계하는 구조로써 사용자별로 생성,삭제,공유 등 권한별로 사용자가 관리가능 하다. 기존의 EDS에서 사용되었던 정형 또는 비정형 보고서와 유사하지만 EDS에서는 생성 주체만 사용할 수 있었지만 데이터관리카드는 단위 객체(Object Unit)로써 유통 및 재가공이 가능한 장점이 있다. 또한 EDS가 보고서 관리를 위한 분류체계가 없었다면, EDMGR시스템은 정부기능분류체계(BRM: Business Reference Model)를 적용하여 데이터셋 분류체계를 표준화 하였다[17]. BRM은 공공기관이 수행하고 있는 모든 업무를 기능·조직·목적별로 구분한다. 관리카드는 교육청의 업무관리시스템문서대장, 자료집계시스템집계양식, 국감요청내역, EDS정형보고서, 업무메뉴얼 등에서 약 2,200개, 교육부 업무이관시스템문서대장, KEDI 고등교육통계, EDS 자료집계, 공공데이터포털 등에서 1,800개 등 약 4,000개를 관리카드로 설계하였다. 이중에서 교육감의 정책공약, 기존 EDS에서 사용한 정형보고서, 교육부 업무보고, 과제발굴 수요조사 등에 각각 가중치를 부여한 결과를 합산하여 우선순위가 높은 22개(돌봄운영,기초학력, 방과후학교, 특수교육, 진로진학, 학교폭력, 학교급식, 교원연수, 학교시설, 학교일반, 디지털교육 등)의 관리카드를 우선 데이터 검증을 통하여 개발하였다.
3.2 교육데이터관리(EDMGR)시스템 개발
EDMGR시스템의 구성은 17개 교육청에 공통 시스템을 구축하고 자체 교육청의 NEIS, K-edufine, 기타 보관 데이터 등을 관리한다. 교육부의 총괄센터 EDMGR시스템은 시도교육청간 데이터관리카드를 유통하는 허브(Hub) 역할과 일반 국민에게 공개하는 데이터관리카드와 데이터지도(Map), 연구데이터개방을 위한 EDSS 등로 구성되어 있다. Fig. 2, Table 3과 같이 교육부/KERIS(총괄센터)와 시도교육청의 수직연계(VL:Vertical Linkage), 교육부/KERIS와 외부 유관기관과 외부연계(EL:External Linkage), 교육청 간 수평연계(HL:Horizontal Linkage)로 데이터와 관리카드가 유통된다. 외부연계는 한국교육개발원, 한국교육과정평가원 등 14개 교육유관 기관과 타부처 산하기관과도 API를 활용하여 데이터 공유가 가능하다.
시도교육청(MPOE)은 NEIS, K-edufine, 기타 자관의 데이터를 ETL(Extract Transform Load)프로그램을 통하여 DW(DataWare House), DS(Data Store)를 매월 구축하여 총괄센터에 전송하고 총괄센터로부터 17개 교육청에서 전송받은 공통 교육데이터관리카드를 공유하도록 구현하였다.
3.2 교육데이터관리(EDMGR)시스템 부가 기능
EDMGR시스템은 데이터관리카드의 데이터셋을 활용하여 직관적으로 의사결정할 수 있도록 Fig. 3과 같이 막대, 선, 그리드, 파이, 지도, 히트맵, 히스토그램, 시계열, 네트워크 등 40여종의 다양한 시각화 화면을 지원한다.
또한, EDMGR시스템은 3가지 검색 기능을 구현하였다. 가장 쉬운 키워드 검색, 여러 키워드를 조인하는 상세검색 그리고 최근 유행하는 자연어 질의를 통한 생성형 검색을 개발하였다. 예를 들어 "경기 지역 학교의 교사수가 8천명 이상인 교육지원청을 찾아서 10개만 바 차트로 그려줘"라고 프롬프트를 작성하면 결과를 생성해주는 기능을 시범적으로 구현하였다. 이 기능은 개방된 정보공시데이터를 학습하여 맞춤형 소형거대언어모델(sLLM:Small Large Language Model)과 시각화 솔루션을 결합하여 개발하였다.
4. 결론 및 향후 연구 과제
교육분야에서 데이터를 기반으로 의사결정을 하는 사례는 점차 증가하고 있으나 교육분야 특유의 보수적인 환경과 이념적 영향으로 활성화가 더디 진행되고 있다. 특히, 우리나라와 같이 국가 단위의 교육과정과 수학능력시험과 같은 대학입학제도, 디지털교과서 보급과 같은 디지털교육 등 추진함에 있어서 국가 수준에서 데이터 기반의 과학적 의사결정을 하는 것이 교육정책의 책임성과 지속가능성을 위해 매우 중요하다. EDMGR시스템은 산재된 교육데이터를 표준화하고 수집 및 관리를 위한 거버넌스를 구축하여 교육데이터의 통합 및 분석·활용을 위한 기반을 마련하였다. 디지털 플랫폼정부가 추구하는 데이터 칸막이의 근원을 해소함으로써 데이터를 연계함으로써 업무의 효율화과 과학화가 가능해 졌다. 특히, 데이터관리카드를 개인단위, 교육청단위, 국가단위로 생산 및 유통함으로써 우수한 관리카드의 공유를 통하여 데이터를 활용해야하는 통계성 업무 부담을 절감하고 상호 협력할 수 있는 체제를 구축하였다. 추가적으로 데이터관리카드를 바로 시각화하여 직관적인 의사결정과 각종 보고서의 가독성을 높였으며, 생성형 AI를 시범적으로 도입하여 교육행정가들의 데이터 및 통계 관련 업무의 편리성도 지원하게 되었다. 또한, 나이스 클라우드 기반으로 17개 교육청의 시스템을 구축함으로써 자원의 효율성을 극대화 했으며, 향후 GPU 도입 및 이기종의 교육정보시스템 간에 통합 및 연계를 고려한 시스템 설계 및 구현으로 확장성이 매우 좋은 사례를 제시하였다. 향후 EDMGR스템은 교육행정데이터 뿐만아니라 AI디지털교과서를 사용하게됨으로써 생산되는 교육분야의 학습데이터까지 연계하기 위한 연구와 고용, 의료, 보육 등의 타 분야 데이터 등과도 연계하여 국민의 생애주기에 필요한 교육정책과 교육행정을 지원할 수 있는 방안을 마련해야하며, 교육분야 특화된 생성형 AI 기술을 도입하여 교육 분야 행정업무 뿐만아니라 교수학습을 지원하는데 연구와 개발이 필요하다. 마지막으로 정책이나 행정외에도 일반 국민과 기업이 안심하고 편리하게 교육데이터를 사용할 수 있는 교육데이터 개방 확대와 온오프라인 안심존 구축을 통하여 다양한 부가가치를 창출할 수 있도록 EDMGR시스템의 확대가 필요하다.
References
- Sanghyun Jang. (2023). Ministry of Education, A Material of Annual Edutech Performance Report Meeting
- Sanghyun Jang. (2012). BigData and Smart Education, Communications of the Korean Institute of Information Scientists and Engineers, 30(6), 59-64.
-
Chang, Y.-S., & Cho, J. (2017). Design and implementation of information system based on educational data. Journal of Korea Contents Association, 17(6), 436–451.
[https://doi.org/10.5392/JKCA.2017.17.06.436]
- Buckingham Shum, S. (2012). Learning analytics. UNESCO Institute for Information Technologies in Education. https://iite.unesco.org/files/policy_briefs/pdf/en/learning_analytics.pdf
-
Kaspi, S., & Venkatraman, S. (2023). Data-Driven Decision-Making (DDDM) for Higher Education Assessments: A Case Study. Systems, 11(6), 306.
[https://doi.org/10.3390/systems11060306]
-
Jiang, Y., Huang, Y., & Li, Q. (2024). Data-driven instructional decision-making: Framework , instrument, and process. World Journal of Educational Research, 11(3), 72.
[https://doi.org/10.22158/wjer.v11n3p72]
-
Joo, Y. H. (2020). Promoting Sustainable Data-Based Decision-Making in the Korean Educational Information Disclosure System. Sustainability, 12(17), 6762.
[https://doi.org/10.3390/su12176762]
- OpenAI. (2025). ChatGPT (4o). https://chatgpt.com
- Anthropic. (2025). Claude. https://claude.ai/
- Google. (2025). Gemini. https://gemini.google.com/
- DeepSeek. (2025). DeepSeek. https://www.deepseek.com/
- Naver. (2025). Clova X. https://clova-x.naver.com/
- Ministry of the Interior and Safety. (2025). Government data analytics systems. https://insight.go.kr/
- Ministry of Land, Infrastructure and Transport. (2025). Data integrated channel. https://data.molit.go.kr/
- Ministry of Health and Welfare. (2025). Health and medical bigdata platform. https://hcdl.mohw.go.kr/
-
Noh, Y., & Park, Y.-H. (2014). A study on the improvement of the BRM classification system for policy information service. Journal of the Korean Society for Library and Information Science, 48(4), 135–171.
[https://doi.org/10.4275/KSLIS.2014.48.4.135]
· 1996년 동국대학교 전자계산(공학사) *정교사 2급자격 취득
· 1998년 동국대학교 컴퓨터공학과 (공학석사)
· 2007년 동국대학교 컴퓨터공학과 (공학박사)
· 1997년 ~ 현재 한국교육학술정보원 수석연구위원
관심분야 : 컴퓨터비젼, AI융합교육, 데이터사이언스, 에듀테크, 학습분석, 데이터 표준
shjang@keris.or.kr