전체 글(20)
-
파이썬 데이터 분석 예제 _ 인구 총 조사 sav파일 원시데이터 분석 및 시각화 / pivot
파이썬 1. 개요주제 : 한국인 삶의 질 파악 데이터 분석 절차 1. 변수(열) 검토 및 전처리 : 변수의 특징 파악 : 이상치, 결측치 정제 - 분석의 용이성(변수의 값 처리) 전처리 - 분석할 변수 각각 진행 2. 변수 간 관계 분석 : 2-1 요약 테이블 2-2 시각화 2. 모듈 import 및 파일 읽기1-1. 모듈 import sav파일 읽기 : 아나콘다 프롬프트에 pip install pyreadstat 설치 필수import pandas as pdimport numpy as npimport matplotlib.pyplot as pltimport seaborn as sns 2-1. 파일 읽기 및 복사본 저장raw_welfare = pd...
2025.03.21 -
파이썬 데이터 분석 _ 시각화 결과 파일로 저장하기 : .savefig()
파이썬 1. 모듈 import 및 데이터 추출, 시각화import pandas as pdimport matplotlib.pyplot as pltplt.rcParams['font.family'] = 'AppleGothic'myframe = pd.read_csv('./data/allStoreModified.csv', index_col=0, encoding='utf-8')print(myframe['brand'].unique())#한글화brand_dict = {'cheogajip':'처가집', 'goobne':'굽네', 'nene':'네네', 'pelicana':'페리카나'}mygrouping = myframe.groupby(['brand'])['brand']chartData =..
2025.03.09 -
파이썬 데이터 분석 예제 _ 우리 동네 인구 데이터 연령 및 성별 간단 분석 / 파이차트, 산점도, 추세선
파이썬 1. 모듈 import 및 데이터 추출, 시각화import csvimport matplotlib.pyplot as pltf = open('./data/gender.csv', 'r', encoding='cp949')data = csv.reader(f)m = [] #3:104 _ csv 상 데이터의 분포f = [] #106: _ csv 상 데이터의 분포name = input('찾을 지역을 입력하세요! _ ').strip()for row in data : if '신도림' in row[0] : for i in row[3:104] :#0기준으로 봤을 때 m의 자료가 왼쪽으로 위치한다고 하면, 모든 자료는 -int m.append(-int(i)) ..
2025.03.09 -
파이썬 데이터 분석 예제 _ 우리 동네 인구 데이터 간단 분석
파이썬 1. 개요 우리 동네 인구 파악 시각화 : 1. 모듈 import 및 파일 읽기2. 전체 데이터에서 한 줄 씩 반복해 읽기 : for문3. 특정 지역의 데이터 확인 : if문4. 특정 지역에 해당할 경우 인구 수를 0세부터 차례로 저장 : for문, append5. 저장된 연령 별 인구수 데이터 시각화 2. 데이터 추출 및 시각화import csvimport matplotlib.pyplot as pltf = open('./data/age.csv', 'r', encoding='cp949')data = csv.reader(f)result = []for row in data : if '신도림' in row[0] : for i in row[3:] : ..
2025.03.09 -
파이썬 데이터 분석 예제 _ 지하철 시간대 별 승하차 데이터 분석
파이썬 1. 개요지하철 시간대 별 승하차 인원 추이 1. 전체 역의 시간대 별 승차 및 하차 인원 각각 누적 집계2. 승하차 별 시각화 2. 모듈 import 및 데이터 읽기import csvimport matplotlib.pyplot as pltf = open('./data/subwaytime.csv')data = csv.reader(f)next(data)next(data) header 총 2개 행, 0행 : 사용월, 호선명, 역ID, 지하철역 표시 / AM4:00 ~ AM3:00까지 1시간 단위로 구분 1행 : 공백('') 4개와 승차와 하차 번갈아 표시 / header 2줄은 분석에 영향 없어 next()함수로 제외 (2회) 3. 승하차 별 데이터 저장3-1. 각 ..
2025.03.08 -
파이썬 데이터 분석 예제 _ 서울시 날씨 데이터 간단 분석 및 시각화 / 히스토그램, 박스플롯
파이썬 1. 최고 기온 추출 및 시각화 .hist() : 자료의 분포 상태를 막대그래프로 표현, 데이터의 빈도에 따라 그래프의 높이 결정 . boxplot() : 데이터를 박스 형태로 표현. 최댓값, 최솟값, 상위 1/4, 2/4(중앙), 3/4에 위치한 값을 표현한 그래프 1-1. 최고 기온 히스토그램과 박스플롯으로 각각 시각화import csvimport matplotlib.pyplot as pltf = open('./data/seoul.csv', 'r', encoding='cp949')data = csv.reader(f)next(data)result = []for row in data : if row[-1] != '' : #해당 행 -1번째 열에 값이 없는('..
2025.03.05