[Colab] 코랩 사용 팁 정리 - 캐글 데이터 로드, 구글 드라이브 데이터 로드, 런타임 끊김 방지, 한글 깨짐 해결

자주 활용하는 코랩 사용 관련 팁을 정리합니다.

캐글 데이터 로드

1. 캐글 사이트에서 account 페이지 > API > CREATE NEW API TOKEN > 다운로드된 파일 ( kaggle.json )
2. 컴페티션의 DATA 섹션에서 API 복사
3. COLAB에서 API 호출

# json 파일 업로드
!pip install kaggle --upgrade
from google.colab import files
files.upload() 
# kaggle.json 파일 업로드 


# 파일 업로드 확인
!ls -1ha kaggle.json

# 파일 옮기기, 권한부여
!mkdir -p ~/.kaggle
!cp kaggle.json ~/.kaggle/
!chmod 600 ~/.kaggle/kaggle.json

# 참가중인 대회 True
!kaggle competitions list

# 캐글 데이터 API로 불러오기
! kaggle competitions download -c tabular-playground-series-aug-2021

# zip파일 풀기
!unzip '*.zip'

# 파일 리스트
!ls

# 데이터 불러오기
import pandas as pd
pd.read_csv('train.csv')

8월 tabular data 불러오기

런타임 끊김 방지

콘솔 창에서 자바스크립 코드 입력시 1분마다 체크

# 60초마다 ClickConnect 함수 실행 
function ClickConnect(){
    console.log("런타임 끊김 방지"); 
    document.querySelector("colab-toolbar-button#connect").click() 
}
setInterval(ClickConnect, 60 * 1000)

구글 드라이브 데이터 로드

하기 코드 입력 후 인증 절차를 거쳐 데이터를 로드할 수 있다.

# drive를 colab에 연결해서 데이터 로딩하기
from google.colab import drive
drive.mount('/content/drive')

한글 깨짐 해결

!sudo apt-get install -y fonts-nanum
!sudo fc-cache -fv
!rm ~/.cache/matplotlib -rf

# 런타임 재시작 후
import matplotlib.pyplot as plt
plt.rc('font', family='NanumBarunGothic')