상세 컨텐츠

본문 제목

Pandas

프로그래밍/University

by 셉인 2021. 10. 24. 00:45

본문

728x90

.index 속성을 사용해 Series의 인덱스를 확인할 수 있다.

#get only the index of the Series

s.index

인덱스 자체도 실제로는 하나의 pandas객체다.

따라서 그 결과로서 인덱스의 값과 데이터 유형을 볼 수 있다.

인덱스의 데이터 유형이 문자열이 아니라 dtype로 참조되는 객체

 

다수의 기술 통계 메소드를 제공

예) 기온 차의 평균

#calculate the mean of the values in the Series

temp_diffs.mean()

데이터 프레임을 사용하면 인덱스 레이블당 복수의 값을 가질 수 있다.

데이터 프레임은 인덱스 레이블을 기준으로 배열된 하나 이상의 Series를 나타낸다.

Series는 데이터 프레임의 칼럼, 각 칼럼은 자신만의 이름을 갖는다.

 

cloumns 속성을 사용하면 DataFrame 안의 모든 칼럼명을 볼 수 있다.

#get the columns, which is also an Index object

temps_df.columns

 

전체 칼럼에 있어서의 특정 로우 데이터를 보고 싶다면, .loc나 .iloc 속성 사용

.loc는 인덱스 레이블을 사용해 검색, 명시적으로 로우에 접근할 수 있다.

.iloc는 제로베이스 위치를 사용해 검색

 

DatetimeIndex 유형을 인덱스로 사용할 수 있게 하기 위해 pd.read_csv()함수의 index_xol파라미터를 사용해 인덱스로 쓸 칼럼을 지정하면 된다.

df = pd.read_csv('data/goog.csv',

                       parse_dates=['Date'],

                       index_col='Date')

df

 

 list item 함수 data가지고 series만드는것

pd.Series(list('abcde'))

 

 list item 함수 data가지고 series만드는것

pd.Series(np.arange(4,9))

 

linspace 동일한 간격의 값

pd.Series(np.linspace(0,9,5))

 

value속성 중요

s=pd.Series([1, 2, 3])

s.values

 

type을 보게되면 numpt.ndarray로 출력됨

type(s.values)

 

<Series객체의 아이템 개수를 알아낼 수 있는 여러 방법>

s=pd.Series([0, 1, 2, 3])

len(s)

 

s.size를 해도 동일한 결과가 나온다.

 

s.shape는 2개 요소의 튜플을 반환하는데, 다만 첫 번째 값만 존재하며 크기를 나타냄

 

 

<처음 몇 개의 로우나 마지막 몇 개의 로우를 확인할 수 있는 메소드 제공>

s.head => 처음 5개 로우 가져옴

s.tail => 마지막 5개 로운 반환 **숫자를 지정해 원하는 수만큼 가능

s.take => 지정한 위치의 로우 반환

 

728x90

관련글 더보기

댓글 영역