-
Kaggle Titanic analysis #1 PclassTo infinity/Data analysis 2024. 1. 1. 18:16
1. 클래스 (좌석등급)은 총 3가지가 있다. 1등급, 2등급, 3등급
각각 클래스 별 총 인원수와 그 중 몇명이 생존했는지를 확인해보면 될 것 같다.
pd.crosstab(df_train['Pclass'], df_train['Survived'], margins=True)
시각화로 표현해보자
1. 클래스별로 생존한 사람 중앙값 찾기
df_train[['Pclass', 'Survived']].groupby(['Pclass'], as_index=True).mean().sort_values(by='Survived', ascending=False).plot.bar()
클래스가 높을수록 생존한 사람이 많다.
그렇다면 정말 클래스가 높을 수록 생존한 사람이 많을까?
그걸 한번 비율로 표현해보자.
[비율로 표현하는 방법 찾기]
y_position = 1.02 f, ax = plt.subplots(1, 2, figsize=(18, 8)) df_train['Pclass'].value_counts().plot.bar(ax=ax[0]) ax[0].set_title('Number of passengers By Pclass', y=y_position) ax[0].set_ylabel('Count') sns.countplot( x = 'Pclass', hue='Survived', data = df_train, ax=ax[1]) ax[1].set_title('Pclass: Survived vs Dead', y=y_position) ax[1].set_ylabel('Count')
'To infinity > Data analysis' 카테고리의 다른 글
1. 시각화 기법 : 단일변수 (histogram, countplot) (0) 2024.01.01 데이터 시각화 분석이 처음이니까. (0) 2024.01.01 library (0) 2024.01.01 데이터 받으면 가장먼저 확인할 것 (0) 2024.01.01 Data analysis 101. 기초 용어 (정형, 비정형, 연속, 범주, 데이터프레임) (0) 2024.01.01