[Pandas] 4. 결측치 처리
·
IT
결측치는 데이터 분석에서 중요한 정보를 제공하지 않기 때문에 제거하거나 다른 값으로 대체 해야 합니다. 결측치를 처리하는 방법으로는 결측치가 많은 열은 열을 제거합니다. 결측치가 아주 많지 않은 열의 경우, 결측치를 가진 행만 제거합니다. 결측치를 가진 데이터를 삭제하면 안되는 경우(결측치가 몇 개 안되거나, 전체 데이터가 적은 경우), 결측치를 다른 값으로 치환합니다. 1. 결측치 확인하기 : isnull() `df.isnull().sum()`을 통해 각 열 별 결측치 개수를 확인할 수 있습니다. `df.isnull()` : 결측치가 있는 위치에서 True를 반환합니다. df.isnull().sum() >>> MovieId 5430 ImdbId 5430 TmdbId 5443 Title 5430 Year..
[Pandas] 3. DataFrame 조회(필터링), 변경
·
IT
1. 특정 열 조회 `df.loc[:, [열 이름1, 열 이름2, ...]]` 형태로 조회할 열 이름을 리스트로 지정하여 특정 열을 조회할 수 있습니다. `df[[열 이름1, 열 이름2, ...]]` 형태로 인덱서를 생략함이 일반적입니다. `df[열 이름1]` : 조회할 열이 하나면 리스트 형태가 아니어도 됩니다. 하지만 이 경우에는 결과가 Series로 나오고, DataFrame 형태로 받고 싶다면 리스트로 넣어주면 됩니다. `df[[열 이름1]]` 2. 조건에 맞춰 필터링 DataFrame에서 조건을 충족하는 행을 가져올 수 있습니다. 조건식은 `==`, `>`, `
[Pandas] 2. DataFrame 결합과 정렬
·
IT
DataFrame 결합 : concat(), merge() DataFrame을 결합하는 방법으로는 `pd.concat()`과 `pd.merge()` 2가지가 있습니다. 1) pd.concat() concat 함수를 사용하면 단순히 데이터를 연결할 수 있습니다. 기본 사용 방법 `pd.concat([df1, df2])` : DataFrame df1과 df2를 이어 붙이기 옵션 axis : 축 (0 : 세로로[default], 1 : 가로로) join : 합치는 방법 : (outer : 합집합[default], inner : 교집합) # 기본 사용 df_concat = pd.concat([df1, df2]) # 세로로 합치기 (default) pd.concat([df1, df2], axis = 0) # 가로..
[Pandas] 1. 데이터 탐색
·
IT
Pandas에서 DataFrame을 탐색하는 방법에 대해서 알아보자 [참고] 주요 메서드 `head(n)` : 상위 데이터 확인 `tail(n)` : 하위 데이터 확인 `shape` : 데이터프레임 크기 `index` : 인덱스 정보 확인 `values` : 값 정보 확인 `columns` : 열 정보 확인 `dtypes` : 열 자료형 확인 `info()` : 열에 대한 상세한 정보 확인 `describe()` : 기초통계정보 확인 0) 데이터 불러오기 csv 파일로 불러오기 : `pd.read_csv({file_path})` import pandas as pd df = pd.read_csv("data.csv") 1) 데이터 확인하기 상위, 하위 일부 데이터 확인 `df.head(n)`, `df.tai..
[Ubuntu] 우분투 Root 계정 비밀번호 설정
·
IT
ubuntu를 새로 들어가면 비밀번호가 없는데, 아래와 같은 명령어를 사용하면 설정할 수 있다. sudo passwd root 를 실행하면 새로운 비밀번호를 설정한다. 만약 다른 계정의 비밀번호를 설정하고 싶다면 root 자리에 계정이름을 넣으면 된다. sudo passwd ubuntu
[Docker] 컨테이너 사용 방법. docker 명령어
·
IT
이성미 강사님의 "[따배도] 따라 배우는 도커" 영상과 개인적인 학습 내용을 정리한 내용입니다. ✅ 컨테이너 이미지 사용 방법 이미지 검색 `docker search [옵션] ` docker search nginx 이미지 다운로드 `docker pull [옵션] ` docker pull nginx:1.14 태그를 생략하면 latest 버전 ex) `docker pull nginx` = `docker pull nginx:latest` 다운 받은 이미지 목록 출력 `docker images` IMAGE ID 전체 출력 : `docker images --no-trunc` 다운 받은 이미지 상세 보기 `docker inspect [옵션] ` 이미지 삭제 `docker rmi [옵션] ✅ 컨테이너를 실행하고 종료..
[Docker] 도커 컨테이너 만들기
·
IT
이성미 강사님의 "[따배도] 따라 배우는 도커" 영상과 개인적인 학습 내용을 정리한 내용입니다. 1. 무엇을 컨테이너로 만드는가? 개발한 프로그램과 실행환경을 모두 컨테이너로 만든다. MSA(Micro Service Architecture) 환경이 Polyglot 애플리케이션 운영 각각의 Application Service에 맞춰서 컨테이너를 만듦 2. 컨테이너를 어떻게 만드는가? Dockerfile이 뭔가 Dockerfile을 이용해 컨테이너를 빌드한다. Dockerfile은 Container를 만들 수 있도록 도와주는 명령어 집합 쉽고, 간단, 명확한 구문을 가진 text file로 Top-Down 해석 컨테이너 이미지를 생성할 수 있는 고유의 지시어(Instruction)를 가짐 대소문자를 구분하지..
[Docker] 컨테이너와 도커의 이해
·
IT
이성미 강사님의 "[따배도] 따라 배우는 도커" 영상과 개인적인 학습 내용을 정리한 내용입니다. 1. 컨테이너를 왜 배워야 하는가? 소프트웨어의 운영 플랫폼이 아래와 같이 바뀌고 있다. Bare Metal -> Virtualization -> Any Infrastructure On-premise(전통적인 환경에서의 배포) -> Virtual Machine(가상 환경에서의 배포) -> Container(컨테이너로의 배포) 애플리케이션을 동작시키기 위해서 각 필요로 하는 환경설비, 라이브러리, 소프트웨어 플랫폼이 다른데 이러한 환경을 독립적으로 만들어서 애플리케이션을 동작시켜 주는 공간을 컨테이너라고 한다. 🌟 컨테이너의 장점 컨테이너 어플리케이션의 용량이 적다. 확장성이 좋다. 배포가 쉽다. ➡️ 시대가 ..