자주 활용하는 코랩 사용 관련 팁을 정리합니다.
캐글 데이터 로드
1. 캐글 사이트에서 account 페이지 > API > CREATE NEW API TOKEN > 다운로드된 파일 ( kaggle.json )
2. 컴페티션의 DATA 섹션에서 API 복사
3. COLAB에서 API 호출
# json 파일 업로드
!pip install kaggle --upgrade
from google.colab import files
files.upload()
# kaggle.json 파일 업로드
# 파일 업로드 확인
!ls -1ha kaggle.json
# 파일 옮기기, 권한부여
!mkdir -p ~/.kaggle
!cp kaggle.json ~/.kaggle/
!chmod 600 ~/.kaggle/kaggle.json
# 참가중인 대회 True
!kaggle competitions list
# 캐글 데이터 API로 불러오기
! kaggle competitions download -c tabular-playground-series-aug-2021
# zip파일 풀기
!unzip '*.zip'
# 파일 리스트
!ls
# 데이터 불러오기
import pandas as pd
pd.read_csv('train.csv')
런타임 끊김 방지
콘솔 창에서 자바스크립 코드 입력시 1분마다 체크
# 60초마다 ClickConnect 함수 실행
function ClickConnect(){
console.log("런타임 끊김 방지");
document.querySelector("colab-toolbar-button#connect").click()
}
setInterval(ClickConnect, 60 * 1000)
구글 드라이브 데이터 로드
하기 코드 입력 후 인증 절차를 거쳐 데이터를 로드할 수 있다.
# drive를 colab에 연결해서 데이터 로딩하기
from google.colab import drive
drive.mount('/content/drive')
한글 깨짐 해결
!sudo apt-get install -y fonts-nanum
!sudo fc-cache -fv
!rm ~/.cache/matplotlib -rf
# 런타임 재시작 후
import matplotlib.pyplot as plt
plt.rc('font', family='NanumBarunGothic')
'Data Science > Python' 카테고리의 다른 글
[Python] 특정 경로에 있는 데이터 한번에 불러오기 (0) | 2022.04.29 |
---|---|
주피터/코랩 노트북 환경 설정 관련 - 리셋/결과출력형식 (0) | 2021.11.22 |
[Python] 자주 쓰는 메소드 정리 - 판다스, 날짜, 함수, 인덱싱 (0) | 2021.07.18 |