파이썬
1. NaN 사용
1-1. 숫자가 아닌 데이터 (NaN : Not a Number) 삽입
1st = [1, 3, 5, np.nan, 6, 8]
s = pd.Series(1st)
#결과
'''
[1, 3, 5, nan, 6, 8]
0 1.0
1 3.0
2 5.0
3 NaN
4 6.0
5 8.0
dtype: float64
'''
1-2. pandas의 data_range 사용 : data_range('시작날짜', periods=갯수)
dates = pd.date_range('20211208', periods=6)
#결과
'''
DatetimeIndex(['2021-12-08', '2021-12-09', '2021-12-10', '2021-12-11', '2021-12-12',
'2021-12-13'], dtype='datetime64[ns]', freq='D')
'''
1-3. numpy로 행열 형태의 난수(임의 수) 생성 : np.random.randn(행, 열)
np.random.randn(6, 4)
#결과
'''
array([[-0.78694227, -0.39382895, -1.30222199, -0.31517125],
[-1.33947656, 0.88645615, -1.03778297, -0.60052824],
[ 0.67206179, -1.20505304, 1.08646716, -0.55195954],
[ 0.4785254 , 0.38805122, 1.77204731, -0.27905548],
[-0.28070526, 0.87060175, -0.99529807, -1.16565425],
[ 0.79059187, 0.20672588, 0.51974029, 1.87050974]])
'''
1-4. numpy로 행열 형태의 난수(임의 수) 생성 : np.random.randn(행, 열)
#dates를 index로, np.random.randn(6, 4)를 데이터로 하는 DataFrame 객체 df 생성
dates = pd.date_range('20211208', periods=6)
df = pd.DataFrame(np.random.randn(6, 4), #values라는 매개변수 사용
index=dates, #index라는 매개변수 사용
columns=['A', 'B', 'C', 'D']) #columns라는 매개변수 사용
#결과
'''
A B C D
2021-12-08 -1.208131 -2.194505 -0.592236 0.080834
2021-12-09 -1.195402 -0.327135 -1.630431 1.326106
2021-12-10 0.111884 3.096611 -0.282745 0.513996
2021-12-11 1.032994 -1.051557 1.020307 1.172119
2021-12-12 0.223649 0.167089 -0.991968 1.080597
2021-12-13 0.992869 -1.636204 0.357904 -1.777964
'''
'LG U+ why not SW 5 > python' 카테고리의 다른 글
파이썬 데이터 분석 _ matplot 라이브러리의 plot함수 기본 정리 (0) | 2025.03.03 |
---|---|
파이썬 데이터 분석 _ pandas 라이브러리 활용 3 : 각종 함수 (0) | 2025.03.03 |
파이썬 데이터 분석 _ pandas 라이브러리 활용 1 : Series / DataFrame (0) | 2025.03.02 |
파이썬 데이터 분석 _ 라이브러리 모음 (0) | 2025.03.02 |
파이썬 기본 _ 입출력 : 함수, 입출력, 파일읽기쓰기 (0) | 2025.02.10 |