ABOUT ME

-

Today
-
Yesterday
-
Total
-
  • Jupyter-data filtering
    Cording/Python 2021. 1. 9. 00:59

    #txt 파일 읽어오기

    df2=pd.read_csv("푼다.txt",engine='python')

    df2

     

    df2=pd.read_table("푼다.txt",engine='python',sep=',')

    df2

     

    import pandas as pd

    df=pd.read_excel('highwaybus.xlsx',sheetname='highway',encoding='cp949')

    df.head()

     

    # 필터링1=우등 고속 데이터 대상

    df_ex=df[df.차종=='우등']

    df_ex.head()

     

    # 필터링2=경부선 총이용인원 1000명 이상인 데이터 분석

    df_gx=df[(df.선별=='경부선')&(df.총이용인원>=1000)]

    df_gx.head(3)

    df_gx.sort_values(by='총이용인원',ascending=0).head(3)

     

    #그룹화 작업-1

    df.groupby('선별').count()

     

    #그룹화 작업-2

    d_group1=df.groupby('선별')

    d_group1['차종'].count().sort_values(ascending=False)

     

    %matplotlib notebook

    d_group1['차종'].count().plot(kind='bar')

     

    d_avg=df.groupby(['차종','선별')]

    d_avg['총이용인원'].mean

     

    # 교차 테이블 작성

    pd.crosstab(df['차종'],df['선별'],margines=True)

     

     

     

    'Cording > Python' 카테고리의 다른 글

    Jupyter-data(re)  (0) 2021.01.12
    Jupyter-str  (0) 2021.01.10
    Jupyter_CSV  (0) 2021.01.07
    Jupyter-결측값  (0) 2021.01.03
    Jupyter-Dataframe(2)  (0) 2020.12.30

    댓글

Designed by Tistory.