LG U+ why not SW 5/python

파이썬 데이터 분석 _ pandas 라이브러리 활용 2 : numpy

wangatheringdata 2025. 3. 2. 16:55

 

 

 

 

 

파이썬

 

 

 

 

 

1.  NaN 사용

 

1-1.  숫자가 아닌 데이터 (NaN : Not a Number) 삽입

1st = [1, 3, 5, np.nan, 6, 8]
s = pd.Series(1st)

#결과
'''
[1, 3, 5, nan, 6, 8]

0    1.0
1    3.0
2    5.0
3    NaN
4    6.0
5    8.0
dtype: float64
'''

 

 

 

1-2.  pandas의 data_range 사용 : data_range('시작날짜', periods=갯수)

dates = pd.date_range('20211208', periods=6)

#결과
'''
DatetimeIndex(['2021-12-08', '2021-12-09', '2021-12-10', '2021-12-11', '2021-12-12',
			 '2021-12-13'], dtype='datetime64[ns]', freq='D')
'''

 

 

 

1-3. numpy로 행열 형태의 난수(임의 수) 생성 : np.random.randn(행, 열)

np.random.randn(6, 4)

#결과
'''
array([[-0.78694227, -0.39382895, -1.30222199, -0.31517125],
       [-1.33947656,  0.88645615, -1.03778297, -0.60052824],
       [ 0.67206179, -1.20505304,  1.08646716, -0.55195954],
       [ 0.4785254 ,  0.38805122,  1.77204731, -0.27905548],
       [-0.28070526,  0.87060175, -0.99529807, -1.16565425],
       [ 0.79059187,  0.20672588,  0.51974029,  1.87050974]])
'''

 

 

 

1-4. numpy로 행열 형태의 난수(임의 수) 생성 : np.random.randn(행, 열)

#dates를 index로, np.random.randn(6, 4)를 데이터로 하는 DataFrame 객체 df 생성
dates = pd.date_range('20211208', periods=6)
df = pd.DataFrame(np.random.randn(6, 4),     #values라는 매개변수 사용
                  index=dates,               #index라는 매개변수 사용
                  columns=['A', 'B', 'C', 'D'])     #columns라는 매개변수 사용
                  
#결과
'''
                   A         B         C         D
2021-12-08 -1.208131 -2.194505 -0.592236  0.080834
2021-12-09 -1.195402 -0.327135 -1.630431  1.326106
2021-12-10  0.111884  3.096611 -0.282745  0.513996
2021-12-11  1.032994 -1.051557  1.020307  1.172119
2021-12-12  0.223649  0.167089 -0.991968  1.080597
2021-12-13  0.992869 -1.636204  0.357904 -1.777964
'''