도서관에서 텍스트 데이터의 통찰과 혜안을 구해볼까?

  • 등록 2021.06.16 11:08:17
크게보기

국립중앙도서관, 6월 온라인 교육 운영

[우리문화신문=윤지영 기자] 국립중앙도서관(관장 서혜란)은 오는 6월 28일(월)부터 7월 1일(목)까지「텍스트마이닝*을 활용한 데이터 분석」프로그램을 운영하며, 14일(월)부터 참여 신청을 받는다. 이는 최근 텍스트 데이터와 같은 다양한 유형의 데이터에 대한 분석 수요의 증가에 따라 파이썬** 초급자를 대상으로 텍스트 데이터 분석 및 시각화 기초 역량을 강화하기 위함이다.

 

* 텍스트 마이닝(Text Mining): 텍스트 데이터에 숨겨져 있는 관계를 발견해 새롭고 유용한 정보를 추출하는 기술
** 파이썬(Python): 누구든지 소스 코드를 보고 사용할 수 있는 오픈소스 고급 프로그래밍 언어 중 하나로 다른 프로그래밍 언어보다 사용자 친화적임

 

 

 

이 강좌는 텍스트 데이터의 수집과 처리부터 분석과 시각화까지 다룬다. 총 4회차로 구성된 이번 교육은 ▲ (1차) 파이썬을 활용한 텍스트 마이닝의 개념과 환경 준비하기, ▲ (2차) 텍스트 데이터의 수집과 전처리(pre-processing) 방법, ▲ (3차) 텍스트 데이터 분석, ▲ (4차) 텍스트 데이터의 시각화 방법에 대해 학습한다.

 

특히, 텍스트 데이터 분석 방법을 중점적으로 다루는 3차시에는 모든 분야 연구자에게 필수적인 빈도‧군집‧주제‧감성 분석 방법을 학습하여 교육 활용도를 최대화한다. 또한 프로그램 전체 과정에서 초보자들이 가장 쉽게 파이썬을 구현할 수 있는 구글 코랩(Google Colab)*과 주피터 노트북(Jupyter Notebook)**을 개발 환경으로 사용할 예정이다.

 

* 구글 코랩: 클라우드 기반의 무료 주피터 노트북 개발 환경으로 웹 브라우저에서 코드를 작성하고 실행할 수 있음
** 주피터 노트북: 웹 브라우저에서 파이썬 등 40여 개의 프로그래밍 언어를 코드로 작성하고 실행이 가능한 오픈소스 기반의 웹 어플리케이션

 

국립중앙도서관 관계자는 “올해 신설한 이번 프로그램을 통해 새로운 지식을 창출하는 연구 시사점을 얻을 뿐만 아니라 데이터 분석으로 통찰과 혜안을 얻는 기회가 되기를 기대한다.”라고 밝혔다.

 

이 교육은 무료이며, 국립중앙도서관 이용자라면 누구나 도서관 누리집(nl.go.kr 로그인 > 신청·참여 > 교육/문화프로그램 > 정보활용교육)에 접속하여 신청할 수 있다. 수강 대상 60명은 서면 검토를 통해 선발하여 6월 21일(월)에 발표된다.

 

윤지영 기자 qdbegm@hanmail.net
Copyright @2013 우리문화신문 Corp. All rights reserved.


서울시 영등포구 영신로 32. 그린오피스텔 306호 | 대표전화 : 02-733-5027 | 팩스 : 02-733-5028 발행·편집인 : 김영조 | 언론사 등록번호 : 서울 아03923 등록일자 : 2015년 | 발행일자 : 2015년 10월 6일 | 사업자등록번호 : 163-10-00275 Copyright © 2013 우리문화신문. All rights reserved. mail to pine9969@hanmail.net