[Pandas] 4. 결측치 처리
·
IT
결측치는 데이터 분석에서 중요한 정보를 제공하지 않기 때문에 제거하거나 다른 값으로 대체 해야 합니다. 결측치를 처리하는 방법으로는 결측치가 많은 열은 열을 제거합니다. 결측치가 아주 많지 않은 열의 경우, 결측치를 가진 행만 제거합니다. 결측치를 가진 데이터를 삭제하면 안되는 경우(결측치가 몇 개 안되거나, 전체 데이터가 적은 경우), 결측치를 다른 값으로 치환합니다. 1. 결측치 확인하기 : isnull() `df.isnull().sum()`을 통해 각 열 별 결측치 개수를 확인할 수 있습니다. `df.isnull()` : 결측치가 있는 위치에서 True를 반환합니다. df.isnull().sum() >>> MovieId 5430 ImdbId 5430 TmdbId 5443 Title 5430 Year..
[Pandas] 3. DataFrame 조회(필터링), 변경
·
IT
1. 특정 열 조회 `df.loc[:, [열 이름1, 열 이름2, ...]]` 형태로 조회할 열 이름을 리스트로 지정하여 특정 열을 조회할 수 있습니다. `df[[열 이름1, 열 이름2, ...]]` 형태로 인덱서를 생략함이 일반적입니다. `df[열 이름1]` : 조회할 열이 하나면 리스트 형태가 아니어도 됩니다. 하지만 이 경우에는 결과가 Series로 나오고, DataFrame 형태로 받고 싶다면 리스트로 넣어주면 됩니다. `df[[열 이름1]]` 2. 조건에 맞춰 필터링 DataFrame에서 조건을 충족하는 행을 가져올 수 있습니다. 조건식은 `==`, `>`, `
[Pandas] 2. DataFrame 결합과 정렬
·
IT
DataFrame 결합 : concat(), merge() DataFrame을 결합하는 방법으로는 `pd.concat()`과 `pd.merge()` 2가지가 있습니다. 1) pd.concat() concat 함수를 사용하면 단순히 데이터를 연결할 수 있습니다. 기본 사용 방법 `pd.concat([df1, df2])` : DataFrame df1과 df2를 이어 붙이기 옵션 axis : 축 (0 : 세로로[default], 1 : 가로로) join : 합치는 방법 : (outer : 합집합[default], inner : 교집합) # 기본 사용 df_concat = pd.concat([df1, df2]) # 세로로 합치기 (default) pd.concat([df1, df2], axis = 0) # 가로..
[Pandas] 1. 데이터 탐색
·
IT
Pandas에서 DataFrame을 탐색하는 방법에 대해서 알아보자 [참고] 주요 메서드 `head(n)` : 상위 데이터 확인 `tail(n)` : 하위 데이터 확인 `shape` : 데이터프레임 크기 `index` : 인덱스 정보 확인 `values` : 값 정보 확인 `columns` : 열 정보 확인 `dtypes` : 열 자료형 확인 `info()` : 열에 대한 상세한 정보 확인 `describe()` : 기초통계정보 확인 0) 데이터 불러오기 csv 파일로 불러오기 : `pd.read_csv({file_path})` import pandas as pd df = pd.read_csv("data.csv") 1) 데이터 확인하기 상위, 하위 일부 데이터 확인 `df.head(n)`, `df.tai..
[블로그] 코드 블럭에 copy 버튼 추가 (hELLO 스킨)
·
블로그
hELLO 스킨을 적용하면서 다시 코드 블럭에 copy 버튼을 추가하였다. 이전에 작성했던 방법과 달라져서 새로 작성해 보았다. 적용 결과! 코드블럭 copy 버튼 테스트! 이전 글 : 2024.02.05 - [블로그] - [블로그] 코드블럭 copy 버튼 추가 [블로그] 코드블럭 copy 버튼 추가 ++ 2024.02.24 티스토리 블로그 테마를 정상우 개발자님의 hELLO 테마로 변경함에 따라 아래 내용은 지금 보이는 글과 다를 수 있습니다. 내가 쓰는 Book Club 템플릿의 기본 코드블럭에는 copy(복사) 버 memoirlog.tistory.com clipboard.js 저번 포스팅에서와 마찬가지로 `clipboard.js`를 활용할 것이다. 저번에는 직접 다운로드하여서 적용했는데, 이번엔 c..
[블로그] 티스토리 블로그 백틱(`)으로 인라인 코드 입력하기 (hELLO 스킨)
·
블로그
2024.02.02 - [블로그] - [블로그] 티스토리 블로그 백틱(``)으로 인라인 코드 입력하기 [블로그] 티스토리 블로그 백틱(``)으로 인라인 코드 입력하기++ 2024.02.24 티스토리 블로그 테마를 정상우 개발자님의 hELLO 테마로 변경함에 따라 아래 내용은 지금 보이는 글과 다를 수 있습니다. 평소에 마크다운으로 글을 작성하던 것이 편했던 나에게 티memoirlog.tistory.comhELLO 스킨을 적용하기 전에 적용했던 방법이 적용되지 않아서 검색 후 적용해 보았다. 1. 기존의 방법이 적용되지 않았던 이유기존의 방법은 ``태그 하단에 코드를 추가하여 적용되도록 하는 방식이었다.이 방법이 안 되는 이유는 (정확히는 잘 모르지만) `hELLO 스킨에서 이미지 지연 로딩 기능의 추가로..
[블로그] 티스토리 hELLO 스킨 적용 (글쓰기 버튼, 코드블럭 꾸미기, 이미지 팝업 문제)
·
블로그
hELLO 스킨을 적용하면서 겪었던 내용들을 정리해 보았습니다. hELLO 스킨을 적용하려 하시는 분들께 조금이나마 도움이 되었으면 좋겠습니다. 대개 버전이 업데이트됨에 따라 적용되지 않는 사항들이 많이 있으니, 해당 github의 issue나 disccusions를 찾아보면 해결방법을 확인할 수 있을 것입니다. https://github.com/tidory/hello hELLO 스킨 티스토리 블로그에 정상우 개발자님이 만드신 hELLO 스킨을 적용해 보았다. 많은 분들이 사용하고 계시는 것 같다. 특히 개발자들에게 인기 있는 스킨이라고 한다. 아래의 링크를 통해 스킨을 다운로드할 수 있다. https://pronist.tistory.com/5 hELLO 티스토리 스킨을 소개합니다. hELLO 스킨은 초..
[Ubuntu] 우분투 Root 계정 비밀번호 설정
·
IT
ubuntu를 새로 들어가면 비밀번호가 없는데, 아래와 같은 명령어를 사용하면 설정할 수 있다. sudo passwd root 를 실행하면 새로운 비밀번호를 설정한다. 만약 다른 계정의 비밀번호를 설정하고 싶다면 root 자리에 계정이름을 넣으면 된다. sudo passwd ubuntu