python:pandas
Pandas
Python기반 데이터 분석 라이브러리
상관관계 분석
import matplotlib.pyplot as plt import pandas as pd from pandas.tools.plotting import scatter_matrix infile = 'test-in.csv' outfile = 'test-out.csv' df = pd.read_csv(infile) coff = df.corr() coff.to_csv(outfile) scatter_matrix(df, alpha=0.2, figsize=(10, 10), diagonal='kde') plt.savefig('test-fig.png') print(df) print(coff)
- 데이터 전처리
- 최소문법
multiprocessing
Out-of-Memory, Out-of-cores
병렬/분산처리로 더 빠른 Dataframe를 제공하는 도구들
- Polars
- Modin
- Dask
- Vaex
속도 개선
python/pandas.txt · 마지막으로 수정됨: 2024/03/23 02:42 저자 127.0.0.1