-
[Python/Matplotlib] 특정 월의 최고 기온 비교를 위한 박스 플롯 그래프 시각화Study/Python 2022. 1. 16. 18:31
특정 월의 최고 기온 비교를 위한 박스 플롯(box plot) 그래프 시각화
import csv import matplotlib.pyplot as plt f = open('seoul.csv') data = csv.reader(f) next(data) result = [] for i in range(31): result.append([]) for row in data: if row[-1] != '': if row[0].split('-')[1] == '08' : result[int(row[0].split('-')[2])-1].append(float(row[-1])) # 8월 1 일부터 31일까지의 최고 기온 데이터 plt.boxplot(result, showfliers = False) plt.show()
전체 코드
1. 라이브러리 및 모듈 import
import csv import matplotlib.pyplot as plt
- csv 파일을 읽기 위해 csv 모듈을 import한다.
- 그래프를 그려 시각화 하기 위해 matplotlib 라이브러리의 pyplot 모듈을 import한다.
2. csv 공공데이터 읽어오기
f = open('seoul.csv') data = csv.reader(f) next(data)
- open()을 이용하여 seoul.csv 파일을 f에 저장한다.
- csv.reader()를 이용하여 f에 저장된 공공 기온 데이터를 읽어와 data에 저장한다.
- next()를 이용하여 data 데이터에서 헤더를 제거한다.
3. 데이터 시각화를 위한 변수 선언
result = [] for i in range(31): result.append([])
- 해당하는 월의 모든 날짜의 데이터를 담기 위하여 31개의 리스트를 가진 2차원 리스트 result를 선언한다.
- for문을 이용하여 31개의 리스트를 result 리스트에 append시킨다.
4. 공공데이터로부터 원하는 데이터 추출 및 저장
for row in data: if row[-1] != '': if row[0].split('-')[1] == '08' : result[int(row[0].split('-')[2])-1].append(float(row[-1]))
- for row in data를 이용하여 모든 데이터를 한 줄 씩 읽는다.
- 만약 해당 데이터가 비어있지 않다면 (공백 데이터 처리)
- 해당 줄의 0번째 데이터(날짜)를 '-'로 split하였을 때 첫 번째 문자열(월)이 08이라면
- result의 row[0].split('-')[2]번째(일) 리스트에 해당 최고 기온 값을 append한다.
7. 그래프를 그리고 화면에 나타내기
plt.boxplot(result, showfliers = False) plt.show()
- plt.boxplot을 이용하여 박스 플롯 그래프를 그린다. result 리스트 데이터를 이용하여 그래프를 그리며,
- plt.show()를 이용하여 화면에 그래프를 나타낸다.
출력된 그래프
'Study > Python' 카테고리의 다른 글
[Python/Matplotlib] 특정 지역의 연령별 인구 수로 꺾은 선 그래프 그리기 (0) 2022.01.18 [Python/Matplotlib] 작년과 올해 특정 월의 최고 기온 차이 박스 플롯 그래프 그리기 (0) 2022.01.17 [Python/matplotlib] 월 최고 기온 데이터 비교를 위한 막대그래프 그리기 (0) 2022.01.14 [Python/Matplotlib] 기온 csv파일을 읽어와서 데이터 분석 (0) 2022.01.13 [Python] 데이터 분석 특강 정리2 (0) 2021.06.30