-
Jupyter-data filteringCording/Python 2021. 1. 9. 00:59
#txt 파일 읽어오기
df2=pd.read_csv("푼다.txt",engine='python')
df2
df2=pd.read_table("푼다.txt",engine='python',sep=',')
df2
import pandas as pd
df=pd.read_excel('highwaybus.xlsx',sheetname='highway',encoding='cp949')
df.head()
# 필터링1=우등 고속 데이터 대상
df_ex=df[df.차종=='우등']
df_ex.head()
# 필터링2=경부선 총이용인원 1000명 이상인 데이터 분석
df_gx=df[(df.선별=='경부선')&(df.총이용인원>=1000)]
df_gx.head(3)
df_gx.sort_values(by='총이용인원',ascending=0).head(3)
#그룹화 작업-1
df.groupby('선별').count()
#그룹화 작업-2
d_group1=df.groupby('선별')
d_group1['차종'].count().sort_values(ascending=False)
%matplotlib notebook
d_group1['차종'].count().plot(kind='bar')
d_avg=df.groupby(['차종','선별')]
d_avg['총이용인원'].mean
# 교차 테이블 작성
pd.crosstab(df['차종'],df['선별'],margines=True)
'Cording > Python' 카테고리의 다른 글
Jupyter-data(re) (0) 2021.01.12 Jupyter-str (0) 2021.01.10 Jupyter_CSV (0) 2021.01.07 Jupyter-결측값 (0) 2021.01.03 Jupyter-Dataframe(2) (0) 2020.12.30