.index 속성을 사용해 Series의 인덱스를 확인할 수 있다.
#get only the index of the Series
s.index
인덱스 자체도 실제로는 하나의 pandas객체다.
따라서 그 결과로서 인덱스의 값과 데이터 유형을 볼 수 있다.
인덱스의 데이터 유형이 문자열이 아니라 dtype로 참조되는 객체
다수의 기술 통계 메소드를 제공
예) 기온 차의 평균
#calculate the mean of the values in the Series
temp_diffs.mean()
데이터 프레임을 사용하면 인덱스 레이블당 복수의 값을 가질 수 있다.
데이터 프레임은 인덱스 레이블을 기준으로 배열된 하나 이상의 Series를 나타낸다.
Series는 데이터 프레임의 칼럼, 각 칼럼은 자신만의 이름을 갖는다.
cloumns 속성을 사용하면 DataFrame 안의 모든 칼럼명을 볼 수 있다.
#get the columns, which is also an Index object
temps_df.columns
전체 칼럼에 있어서의 특정 로우 데이터를 보고 싶다면, .loc나 .iloc 속성 사용
.loc는 인덱스 레이블을 사용해 검색, 명시적으로 로우에 접근할 수 있다.
.iloc는 제로베이스 위치를 사용해 검색
DatetimeIndex 유형을 인덱스로 사용할 수 있게 하기 위해 pd.read_csv()함수의 index_xol파라미터를 사용해 인덱스로 쓸 칼럼을 지정하면 된다.
df = pd.read_csv('data/goog.csv',
parse_dates=['Date'],
index_col='Date')
df
list item 함수 data가지고 series만드는것
pd.Series(list('abcde'))
list item 함수 data가지고 series만드는것
pd.Series(np.arange(4,9))
linspace 동일한 간격의 값
pd.Series(np.linspace(0,9,5))
value속성 중요
s=pd.Series([1, 2, 3])
s.values
type을 보게되면 numpt.ndarray로 출력됨
type(s.values)
<Series객체의 아이템 개수를 알아낼 수 있는 여러 방법>
s=pd.Series([0, 1, 2, 3])
len(s)
s.size를 해도 동일한 결과가 나온다.
s.shape는 2개 요소의 튜플을 반환하는데, 다만 첫 번째 값만 존재하며 크기를 나타냄
<처음 몇 개의 로우나 마지막 몇 개의 로우를 확인할 수 있는 메소드 제공>
s.head => 처음 5개 로우 가져옴
s.tail => 마지막 5개 로운 반환 **숫자를 지정해 원하는 수만큼 가능
s.take => 지정한 위치의 로우 반환
[SOPT/34기] SOPT 34기 YB 서버 파트 서류 팁 / 서류 합격 후기 (1) | 2024.03.23 |
---|---|
[컴퓨터학부] 리눅스 시스템 프로그래밍 3월 8일 (chmod, umask, stat, st_mode, 파일 디스크립터 테이블 ) (0) | 2023.03.13 |
[SSU DevCamp] 선배님의 조언 - 개발자/숭실대/코딩/쿠팡 (6) | 2022.09.20 |
ssu_dev_camp [제 2탄] 깃허브 github main ->master (2) | 2022.08.23 |
ssu_dev_camp [제 1탄] 깃허브 설정 AOS project git master branch (2) | 2022.08.23 |
댓글 영역