기계학습과 CONCOR 기법을 활용한 AI 교육 동향 분석
초록
본 연구에서는 기계학습의 단어 추출에 따른 빈도 분석과 CONCOR(CONvergence of iteration CORrelation) 기법을 활용하여 AI 교육에 대한 흐름을 탐색하였다. 2022년부터 현재까지의 등재된 학술지에서 'AI 교육' 키워드로 컴퓨터교육학술지에서 63개의 논문을 검색하였으며, 체계적 문헌 리뷰를 통해 AI 교육과 관련된 38편의 논문을 선정하였다. 논문의 국영문 제목과 요약의 키워드를 추출하였다. 단어의 키워드와 문헌 빈도 및 지표 데이터는 기계학습의 TF-IDF 방식을 활용하여 키워드 빈도 분석을 수행하였으며, 문헌의 동시 출현 빈도 단어를 분석하여 49개의 중심어를 추출하였다. 관련된 단어 간의 연결 구조와 연결 강도 분석을 위해 단어와 문헌의 상대적인 중심성을 분석하여 관계의 정도를 검증하고, CONCOR 분석을 통해 유사성을 가진 단어들로 구성된 상대 빈도와 중심성을 도출하였다. 분석 결과에 따르면, 첫째로 '교육', '윤리', '생성형', '연구', '개발'이 주요 키워드로 나타났다. 둘째로, N-GRAM 네트워크 그래프 분석에서는 ‘개발’, ‘강조’, ‘교육’, ‘결과’가 상대 빈도와 중심성이 높은 단어로 나타났다. 이러한 결과를 토대로, AI 교육 연구 동향의 분석 및 트렌드 파악을 통해 AI 교육 현황에 필요한 연구의 방향을 제시할 수 있을 것으로 기대한다.
Abstract
This study explored the landscape of AI education by employing frequency analysis based on machine learning word extraction and the CONCOR (CONvergence of iteration CORrelation) techniques. This study combed through 63 papers in the Korean Association of Computer Education journals by using the keyword “AI education,” focusing on registered academic journals spanning the period 2022 to the present. Through a systematic literature review, this study identified and selected 38 papers related to AI education. Keywords were then extracted based on the titles and summaries of these papers. A keyword frequency analysis was performed on the keywords, document frequencies, and indicator data using the machine learning TF-IDF method. A total of 49 core words were extracted by analyzing co-occurring words in the literature. To analyze the connection structure and strength among these related words, the relative centrality of words and documents was analyzed. This analysis verified the degree of relationship, and a cluster composed of words with similarities was derived through CONCOR analysis. According to the findings of the analysis, “education,” “ethics,” “generative,” “study,” and “development” emerged as the main keywords. Furthermore, in the N-GRAM network graph analysis, words such as “development,” “emphasis,” “education,” and “results” exhibited high relative frequency and centrality. These results indicate that research necessary for practical AI education can be conducted by analyzing and identifying trends in AI education research.
Keywords:
AI Education, Machine Learning, Keyword Occurrence Frequency, CONCOR Technique, Trend Analysis키워드:
AI 교육, 기계학습, 키워드 출현 빈도, CONCOR 기법, 동향 분석1. 서론
과거의 인터넷 혁명은 인간의 일상과 비즈니스, 교육, 의료 등 다양한 영역에 혁신을 가져왔다. 인터넷이란 정보를 교환하고 연결하는 도구로서, 그 기능과 활용성은 우리의 삶을 크게 변화시켰다. 인공지능은 기계가 학습하고 문제를 해결할 수 있는 능력을 지니고 있으며, 인공지능은 우리의 일상생활에 효율성과 편의성을 제공하면서도 동시에 새로운 도전과 질문을 제기하고 있다.
이러한 디지털 대전환에 따라 인공지능(AI)과 정보기술(IT)의 급속한 발전과 적용은 사회 전 분야에 영향을 미치고 있고, 이에 따라 교육 분야에서도 새로운 AI 기술을 도입하여 교수-학습 방식을 혁신하고 있다.
정보통신기술과 AI 기술의 진보로 학습자에게는 맞춤형 학습이 가능해지고, 학습자 수준에 맞는 유연한 평가를 제공하며, 온라인, 모바일, 또는 혼합된 학습 경험에서 교수자와 학습자 간 의미 있는 상호 작용을 촉진하는 기법에 대한 연구가 활발히 이루어지고 있다[1].
그러나 현실적인 교육 환경에서는 정보통신기술과 AI 교육 기술의 역량과 실제 적용 간에 격차가 있어 중요한 주제어를 추출하고 이를 통해 연구 동향에서 주목할 만한 지점과 활용 방향을 도출하는 연구가 필요하다.
UNESCO의 미디어와 정보 리터러시 교육 콘텐츠 및 교육과정에 대한 연구는 이러한 동향과 주요 시사점을 도출한 사례 중 하나이다. 이 연구는 문헌정보학 관점에서 정보 리터러시의 개념 및 교육 내용을 분석하였다[2]. 또 다른 사례로 중등 컴퓨터 교육 연구 주제 동향을 분석하는 연구가 토픽 모델링 기법을 활용하여 각 연도별 토픽의 추이를 분석했다[3].
AI 교육에 대한 국내외 동향 및 사례 분석은 빠르게 발전하고 있는 분야 중 하나이다. 이 분야에서의 연구들은 교과 과정 및 학습 방법 등에 대한 깊은 이해를 제공하며, 미래 교육 동향을 예측하는 데 도움이 되고 있다.
국내외의 AI 교육에 대한 연구에서는 정보 교육 과정에 대한 교과 시수와 학습 요소를 다루는 사례가 있다[4]. 이러한 연구는 교육 과정의 설계와 진행에 있어서 국내와 국외 간의 차이점을 이해하고, 효과적인 교육 방법을 도출하기 위해 중요한 정보를 제공한다. 특히, 미래 교육 동향을 예측하기 위한 언어 네트워크 분석을 활용한 연구가 있다[5]. 이 연구에서는 자료의 제목과 키워드를 대상으로 한 빈도 분석과 언어 네트워크 분석을 통해 교육 동향을 분석하였다. 이러한 방법을 통해 어떠한 주제가 미래 교육에 영향을 미칠 것인지에 대한 통찰력을 얻을 수 있다.
이러한 국내외의 연구들은 AI 교육 분야에서의 발전과 함께, 교육 방법과 콘텐츠에 대한 혁신을 촉진하고 있다. 미래 교육에 대한 논의와 예측은 학문적 연구와 현장 경험을 결합하여 전략적이고 효과적인 교육 방향을 모색하는 데 큰 기여를 하고 있다.
본 연구에서는 AI 교육 분야에서의 중요한 키워드와 관련된 주제들을 정리하고, AI와 관련된 최신 기술의 적용과 교육 효과에 관한 내용을 주로 다룬다. 이를 위해 기계학습의 단어 빈도 분석을 수행하였고, 수집된 문헌 연구를 CONCOR(CONvergence of iteration CORrelation) 기법을 활용하여 분석하였다. 이를 통해 AI 교육 분야에서의 현재 동향과 이슈를 파악하고, 미래에 대한 시사점을 도출하고자 한다. 본 연구의 결과는 AI 교육에 대한 이해를 높이고, AI 교육의 발전을 위한 연구 방향 설정에 기여할 것으로 기대된다.
2.1 기계학습 기반의 문헌 연구
2022년부터 2023년까지 AI 교육 연구 분야에서의 지식 진화를 탐색하기 위해 AIED(Artificial Intelligence Education, 인공지능 교육)에 대한 1,830개의 연구 기사를 검토한 연구가 있다[6]. 해당 연구에서는 AIED 내의 지식 구조, 지식 클러스터, 그리고 트렌드 키워드를 시간에 따라 식별하기 위해 키워드 동시 발생 네트워크(KCN)를 도입하였다[6]. 이 연구는 교육 분야에서의 인공지능 관련 연구를 체계적으로 정리 및 분석하고, 체계적인 연구 기법을을 통해 지식과 기본 패턴을 확인하면서 향후 연구 개발에 대한 통찰력을 제공하였다. AIED 분야에서의 키워드 동시 발생 네트워크 분석을 통해 시간에 따른 트렌드와 함께 지식의 발전을 종합적으로 조망할 수 있다.
토픽 모델링 기법을 적용한 다른 연구에서는 기계학습의 키워드 추출을 통해 중등 컴퓨터 교육의 연구 주제를 탐색하였고[3], 미래 교육 동향 분석을 위해 키워드의 빈도 분석과 키워드의 연결 네트워크 분석을 시행한 연구가 있다[5].
또 다른 기계학습 모델을 활용한 연구는 금융시장의 가격 예측에 관한 것으로, 다양한 애플리케이션에서 복잡한 패턴을 인식하는 데에 기계학습 모델이 사용되었다[7]. 특정 주제에 관련된 참고 문헌 중, 관련성 분석을 통해 57개의 논문 요약을 체계적으로 검토하여 시장, 자산 및 변수에 대한 분류를 제안한 연구가 있다[7, 8]. 이 연구는 최신 동향을 반영하여 다양한 관점에서 AI 교육에 대한 이해를 확장하고자 하였으며, 선택된 키워드와 관련하여 주요 변수들을 분석하여 그 결과를 종합적으로 제시하고 있다. 해당 연구를 통해 AI 교육 분야에서의 현재 동향과 미래 전망을 파악할 수 있을 것으로 기대된다.
2.2 문헌 키워드 분석 연구
문헌 키워드 분석에 관한 연구 중 SNS의 빅데이터 분석을 통해 여가 활동의 트렌드를 파악과 맞춤형 서비스 제공을 하기 위한 연구가 활발히 이루어지고 있다[8]. 이 연구에서는 네이버와 다음과 같은 플랫폼에서 제공되는 블로그, 카페, 웹페이지, 지식인/다음팁을 분석 정보로 선정하고, 빅데이터 검색을 위한 여가 활동을 주요 키워드로 추출하여 연구를 진행하였다. 트렌드 분석과 맞춤형 서비스 제공을 위해 단어 간의 연결 구조와 중심성을 분석하고, 유사성을 가진 단어 군집 도출을 위해 CONCOR 분석을 실시하였다[8].
또한, 블로그와 온라인 카페의 글을 기반으로 키워드를 파악하고 주요 토픽을 발견하는 다른 연구도 있다[9]. 이 연구에서는 '코로나'와 '가족' 등이 함께 언급된 문서 351,734건을 분석하고, 토픽 모델 분석을 시행하였다[9].
현재의 트렌드와 연구 동향을 파악하기 위해서 자연어 처리 기반와 LDA, 토픽 모델링, 키워드 분석, 단어들의 빈도수 및 상관관계 분석 등이 활용되고 있다[3, 5, 6]. 이러한 연구들은 여가 활동과 관련된 키워드를 다각도로 탐색하고 이를 통해 사회적 트렌와 관련된 인사이트를 얻는 데 기여하고 있다.
3. 연구 방법
3.1 연구 대상 및 자료수집 기법
AI 교육의 최신 동향을 분석하기 위해, 본 연구에서는 AI 교육에 대한 최신 정보를 반영하고자 국내외 문헌에 접근성이 뛰어난 구글 스칼라와 컴퓨터교육학회지 웹사이트를 활용하여 'AI 교육'이라는 키워드와 함께 논문 제목과 내용을 AI 혹은 AI 교육에 대한 주제로 검색된 63건의 논문을 선정하는 과정을 체계적인 문헌 연구 기법에 따라 진행하였다. 이 과정을 통해 최종적으로 38편의 논문을 선정하였다. 체계적 문헌 연구 기법의 단계는 Figure 1과 같다.
검색 자료는 2022년부터 2023년 11월까지 발행된 문헌 중 등재지 중에서 컴퓨터교육 관련된 내용이 포함된 학술지 논문을 대상으로 선정하였다. 선정 기준은 한국어로 작성된 논문이며, 논문의 제목과 초록을 기반으로 자료를 수집하였다.
선정된 논문은 제목 또는 초록이 기준에 충족하지 않을 경우에는 연구 대상에서 제외되었다. 그 결과, 79개의 문헌이 선별되었고, 이 중에서 주제와 적합하지 않은 16개의 문헌을 제외한 나머지 63개의 논문에 대해 초록을 검토하였다. 마지막으로 본문 내용 검토를 통해 총 38개의 문헌을 최종 선별하였다.
3.2 조사 도구 및 데이터 전처리 방법
본 연구에서는 AI 교육의 최신 동향을 분석하기 위해 수집된 문헌의 제목과 요약을 활용하여 기계학습과 자연어 처리를 통한 키워드 출현 빈도 분석을 수행하였다. 이를 위해 형태소 분석을 실시하고 키워드 추출하여, 추출된 키워드의 빈도수를 제시하여 키워드의 순위, 유사성, 연관성을 파악하였다. 또한, 추출된 키워드를 본문 전체의 내용과 비교하여 적절성을 검토하였다[10-13].
AI 교육에 대한 최신 동향을 반영하기 위해 본 연구에서는 AI 교육과 관련 없는 단어를 제거하고, 동의어나 유사한 의미를 가진 단어들을 통합하면서 키워드를 정제하였다. 이를 통해 분석의 정확성과 일관성을 확보하였다.
3.3 자료 처리 방법
본 연구에서는 AI 교육의 최신 동향을 반영하기 위해 키워드 출현 빈도를 기반으로 의미 연결망 분석 기법 중 사회연결망 분석을 활용하였다[14, 15, 16]. 사회연결망 분석은 문서 내에서 단어들의 구조적 관계를 분석하고, 구조 패턴과 의미를 파악하는 기법으로, 단어 간의 연결 구조를 파악하고, AI 교육과 관련된 주제어들의 네트워크를 분석하고 시각화한 뒤, 유사한 단어들의 군집을 도출하기 위해 CONCOR 분석을 수행하였다.
사회연결망 분석은 문서 내에서 단어들 간의 구조적 관계를 파악하고 의미를 이해하는 기법이다[14, 16]. 관련 연구에서는 AI 교육과 관련된 주제어들의 네트워크를 분석하고 시각화한 후, CONCOR 분석을 활용하여 유사한 단어들의 군집을 찾아내고, 이를 통해 문서에서 주요 주제어들이 어떻게 연결되어 있는지와 유사한 의미를 가진 단어들의 군집을 이해하는 데에 기여하고 있다 [14-16]. 이를 통해 AI 교육 분야의 핵심 주제와 연구 동향을 더욱 정확하게 이해할 수 있다.
4. 연구 결과
4.1 데이터 분석 결과
본 논문에서 추출된 키워드의 출현 빈도를 워드 클라우드로 시각화한 결과는 Figure 2와 같다.
키워드 빈도수는 인공지능이 163, ai가 120회로 나타났지만, 인공지능과 ai 키워드가 포함되면 상대 빈도 값에서 편향성이 심하게 나타나서 인공지능과 ai 키워드는 제외하였다.
키워드 네트워크 시각화의 한계성으로 빈도수가 높은 상위 60개의 키워드를 중심으로 AI 교육 주제에 적합한 키워드 출현 빈도를 분석하였다. AI 교육 분야의 최신 동향을 반영하기 위해 키워드 출현 빈도를 분석한 결과, ‘윤리’, ‘생성형’, ‘연구’, ‘개발’, ‘프로그래밍’ 등과 같은 주요 키워드의 출현 빈도가 높게 나타났다.
문서 전처리 과정에서 중복을 제거하기 전에는 5,006개의 키워드가 나타났는데, 중복을 제거한 뒤에는 859개의 키워드가 추출되었다. 그 중에서 출현 빈도가 가장 높은 단어를 빈도수 기준값 103으로 정한 뒤, 빈도수 상위 10개의 추출된 단어 출현 빈도와 TF-IDF 수치를 제시한 결과는 Table 1과 같다. 이를 통해 AI 교육 분야의 핵심 키워드와 최신 연구 동향을 파악할 수 있다.
연결 정도 중심성은 각 단어의 빈도수를 기반으로 단어들이 중심에 위치하는 정도를 나타내는 지표로, IDF 수치가 적을수록 키워드의 영향력이 높다고 해석할 수 있다[11]. 본 연구에서는 '교육'이라는 주요 키워드가 가장 높은 출현도(빈도수: 103, IDF: 0.874)을 나타내었다. 이를 통해 '교육'이 AI 교육 분야에서 중심적이며, 빈도수와 IDF 수치를 종합적으로 고려할 때 해당 키워드의 영향력이 높다는 것을 확인할 수 있다.
이어서 '윤리(빈도수: 50, IDF: 0.908)', '생성형(빈도수: 45, IDF: 1.016)', '연구(빈도수: 30, IDF: 1.047)' 등이 순서대로 나타났다. 이러한 결과를 통해 최신 동향을 반영한 AI 교육 분야에서 '교육', ‘생성형’, ‘윤리’, '연구', ‘개발’, ‘프로그래밍' 등이 주요 연구 키워드로 강조되고 있음을 확인할 수 있었다.
4.2 데이터 시각화 결과
키워드의 중심성을 시각적으로 파악하기 위해 N-GRAM 네트워크 그래프를 작성하였고, 결과는 Figure 3에 나타나 있다. AI 교육 분야에서의 키워드 간 연결 관계를 네트워크로 시각화한 이 그래프는 각 키워드 간의 관련성을 나타내며, 중심적인 키워드는 ‘개발’, ‘강조’, ‘교육’, ‘결과’로 나타났고, 그 주변 키워드들 간의 상호작용을 효과적으로 보여준다. 이를 통해 AI 교육 분야에서의 핵심 주제와 키워드 간의 유사성을 파악할 수 있다.
본 연구에서는 AI 교육의 현재 동향과 주요 주제를 파악하기 위해 키워드 출현 빈도를 기반으로 의미연결망 분석을 수행하였고 단어의 중심성을 파악하기 위해 연결 정도의 상대 빈도와 중심성을 계산한 결과는 Table 2와 같다. [14, 15].
‘개발(빈도: 4225, 중심성: 0.291)'이 가장 높은 중심성을 보였으며, 그 다음으로 '강조(1573, 0.108)', '교육(1140, 0.079)', '결과(714, 0.049)' 등이 나타났다. 중심성이 높은 키워드는 해당 주제에서의 영향력이 크다고 해석할 수 있다. 이러한 다양한 키워드 간의 상대 빈도와 중심성을 통해 AI 교육 분야의 다양한 이슈와 연구 동향을 파악할 수 있다.
5. 결론
본 연구는 AI 교육 분야의 최신 동향을 조사하고자, 체계적인 문헌 연구 기법을 활용하여 'AI 교육'이라는 키워드를 중심으로 구글 스칼라를 통해 2022년부터 2023년 11월까지 발행된 63건의 논문을 선정하였다. 이를 토대로 제목과 초록을 분석하여 38편을 최종 선정하였다. 수집된 자료를 바탕으로 자연어 처리 및 기계학습을 활용하여 키워드 출현 빈도를 분석하고, CONCOR 분석을 통해 군집을 도출하였다.
분석 결과, AI 교육 분야에서 '교육', '연구', '분석', '활용' 등의 키워드가 높은 출현 빈도를 나타냈고, 상대 빈도와 중심성에서는 ‘개발’, ‘강조’, ‘교육’, ‘결과’ 등이 나타났다.
향후 연구에서는 다양한 검색 사이트를 활용하여 다양한 국내외 학술지의 논문을 수집함으로써 높은 품질의 데이터를 획득하고, 보다 심층적인 토픽 분석 및 연구 동향 파악을 목표로 할 필요가 있다.
Acknowledgments
이 연구는 2023년도 서울교육대학교 교내연구비를 지원받아 수행되었음
References
- Oakyoung Han (2023). A Study on Components for Designing Personalized Education Systems Based on Generative AI. The Journal of Korean Association of Computer Education, 26(6), 127-141. [https://doi.org/10.32431/kace.2023.26.6.011]
- Park Joo-hyun. (2020). A Study on the Analysis of Educational Content and Curriculum of UNESCO’s Media and Information Literacy. Journal of the Korean Library and Information Society, 54(2), 349-374.
- Jeongwon Min, Jaekwoun Shim. (2021). A Study on Domestic Research Trends in Secondary School Computer Education. The Journal of Korean Association of Computer Education, 24(1), 29-36. [https://doi.org/10.32431/kace.2021.24.1.004]
- Seokjun Woo, Dukhoi Koo. (2021). Trend of ICT Education in Korea and Analysis of Overseas Cases. 2021 Proceedings of the Korea Association for Information Education Summer Conference, 259-265.
- Kim Seulki, & Kim Taeyoung (2021). A Study of the Definition and Components of Data Literacy for K-12 AI Education. Journal of The Korean Association of Information Education, 25(5), 691-704. [https://doi.org/10.14352/jkaie.2021.25.5.691]
- Feng, S., & Law, N. (2021). Mapping Artificial Intelligence in Education Research: a Network‐based Keyword Analysis. International Journal of Artificial Intelligence in Education, 31(2), 277-303. [https://doi.org/10.1007/s40593-021-00244-4]
- Henrique, B. M., Sobreiro, V. A., & Kimura, H. (2019). Literature review: Machine learning techniques applied to financial market prediction. Expert Systems with Applications, 124, 226-251. [https://doi.org/10.1016/j.eswa.2019.01.012]
- Hyorim Kim, & Ikki Jeon. (2018). Leisure activity keyword analysis using text mining technique. Journal of the Korean Society of Leisure and Recreation, 42(3), 59-69. [https://doi.org/10.26446/kjlrp.2018.9.42.3.59]
- Sunyoung Park, & Jaerim Lee. (2021). COVID-19 and family life through social big data: Topic model approach. Journal of Korean Contents Society, 21(3), 282-300. [https://doi.org/10.5392/JKCA.2021.21.03.282]
- Song Eui-seong, & Lim Hwa-kyung. (2021). Necessity of elementary school information subject through analysis of overseas SW·AI education status. Journal of Information Education Society, 25(2), 301-308. [https://doi.org/10.14352/jkaie.2021.25.2.301]
- Sungyoon Moon, & Subeom Shin. (2020). Investigation and analysis of suitability of content selection for data structure education in elementary school curriculum. Journal of the Korea Information and Communications Society, 24(2), 311-320. [https://doi.org/10.6109/jkiice.2020.24.2.311]
- Younghoon Sung. (2021). Exploration of independent application of elementary information subject through analysis of digital literacy status of elementary textbooks. Journal of Information Education Society, 25(2), 265-277. [https://doi.org/10.14352/jkaie.2021.25.2.265]
- Eunkyoung Lee. (2018). Perspectives and Challenges of Informatics Education: Suggestions for the Informatics Curriculum Revision. The Journal of Korean Association of Computer Education, 21(2), 1-10. [https://doi.org/10.32431/kace.2018.21.2.001]
- Hyeok Yun, & Jeong-Rang Kim (2022). A Study on the Perception of Artificial Intelligence Literacy and Artificial Intelligence Convergence Education Using Text Mining Analysis Techniques. Journal of The Korean Association of Information Education, 26(6), 553-566. [https://doi.org/10.14352/jkaie.2022.26.6.553]
- Ji-suk Hong, Ick-keun Oh. (2016). Image difference of before and after an incident using social big data analysis : Focusing on a ramp return of “K” airline. International Journal of Tourism and Hospitality Research, 30(6), 119-133. [https://doi.org/10.21298/IJTHR.2016.06.30.6.119]
- Youngseok Lee. (2023). Analysis of ICT Education Trends using Keyword Occurrence Frequency Analysis and CONCOR Technique . Journal of Industrial Convergence, 21(1), 187-192. [https://doi.org/10.22678/JIC.2023.21.1.187]
1999년 서울교육대학교 초등교육과(교육학사)
2001년 서울교육대학교 컴퓨터교육과(교육학석사)
2009년 한양대학교 전자통신전파공학과(공학박사)
2016년 ∼ 2022년 강남대학교 KNU참인재대학 교수
2022년 ∼ 현재 서울교육대학교 컴퓨터교육과 교수
관심분야: 정보(컴퓨터) 교육, 스마트러닝, 지능형 웹 정보 시스템, 컴퓨터 비전
E-mail: yslee38@snue.ac.kr