Analytics/Study
파이썬머신러닝300제 강의 시작! (기본 라이브러리 정리_1)
Unicorns
2023. 2. 20. 00:33
살짝 늦은 새해 맞이 다짐을 위해 새롭게 공부를 시작해보았다.
마침 괜찮아보이는 주제와 좋은 조건(환급!!!)으로 구성된 강좌가 있어 일단 저지르고 보았다.
앞으로 꾸준히 공부하겠다는 다짐으로 시작했는데, 모쪼록 유종의미를 거두었으면 좋겠다.
본격적인 시작에 앞서 기본 라이브러리 설명 부분이 있었는데,
그동안 아는건 아는만큼 모르는건 모르는데로 사용했던 라이브러리들이라서 이참에 정리를 해보았다.
각 라이브러리별 자세한 내용(하이퍼파라미터 세팅, 실제 활용, 모델 고도화 등)은 이후 각 케이스에 따라 업데이트를 해야겠다
fbprophet
- 시계열 데이터 분석 목적
from fbprophet import Prophet
kaggle
- kaggle 데이터셋 또는 노트 등을 활용할 수있는 라이브러리 (실전 문제 활용 시 필요 라이브러리)
- 이후 자세한 설명 강의가 있지만, 실제 문제 활용에서 자연스럽게 활용 방법을 체득할 수 있을 것 같다.
!pip install kaggle
import os
os.environ['KAGGLE_USERNAME'] = 'username'
os.environ['KAGGLE_KEY'] = 'key'
keras
- 딥러닝 모델 구현을 위한 라이브러리
- Tensorflow, Theano, CNTK 등과 같은 딥러닝 라이브러리와 함꼐 사용 가능
lightgbm
- 트리 기반 머신러닝 라이브러리
- 여러개의 결정트리를 만들어 학습시킨 후 결과를 종합하여 예측
- 특히 대용량 데이터 처리에 있어 빠르고 안정적인 성능이 장점
!pip install lightgbm
numpy
- 자주 쓰는 라이브러리 중 하나
- 다차원 배열과 행렬을 처리하는 라이브러리
- array 함수를 사용하여 행렬에 대한 데이터 분석
import numpy as np
matrix_a = np.asarray([[4, 5, 2],
[5, 2, 6],
[6, 1, -2]])
matrix_b = np.asarray([[5, 9, 2],
[2, 0, 3],
[1, -4, 5]])
matrix_c = matrix_a + matrix_b
print(matrix_c)
## 결과
[[ 9 14 4]
[ 7 2 9]
[ 7 -3 3]]
* 구글 Colab 결과 예시
opencv
- Open Source Computer Vision Library
- 이미지 처리와 컴퓨터 비전을 위한 라이브러리
- 이를 활용하여 머신러닝 및 딥러닝을 위한 인터페이스 제공
- 이미지를 활용한 분석 경험이 없어 개인적으로 궁금한 라이브러리 중 하나
Pandas
- Python을 사용할 때 가장 기본적으로 사용하는 라이브러리로, 대용량 데이터 처리 및 분석 목적
- 데이터 구조를 2가지로 볼 수 있는데
- 시리즈(Series)는 1차원 배열
- 데이터프레임(DataFrame)는 행/열로 이루어진 2차원 테이블
- 흔히 활용하는 형태는 데이터프레임 (테이블 단위)
- csv, excel, sql을 통해 추출한 데이터 등을 python에서 활용하고자 할 때 기본이 되는 라이브러리
이후로 추가 라이브러리들이 있기는한데,
이거 정리하는것도 은근 시간이 많이 걸린다. 강의시간은 정말 짧은편인데...
다음에 정리할 라이브러리들에는 머신러닝쪽 내용들이 조금 더 많이 있어서
내일 자세히 정리해보도록 해야겠다.
차근차근 하나씩 채워나가보도록...!!
본 포스팅은 패스트캠퍼스 환급 챌린지 참여를 위해 작성되었습니다.