공대생 잡학사전/BigData

Ubuntu 20.04 에서 Jupyter Notebook 실행해보기

내이릉망고 2023. 3. 21. 10:21

제가 다니는 대학교의 빅데이터 관련 수업을 들으며 실제 실습한 내용입니다.

 

환경은 Ubuntu 20.04 입니다.

 

제일 먼저 가상환경을 만들어야 합니다. 물리적인 하나의 큰 시스템 공간을 사용한다면 무언가가 잘못 됬을때 시스템을 초기화 해야하거나 해야 하기 때문에 이를 방지하기 위해 큰 시스템 공간을 논리적으로 나눠 효율적으로 사용하는 것입니다.

 

1. Python3 설치를 진행합니다.

sudo apt install python3

 

2. Python3-venv 설치를 진행합니다 

suao apt install python3-venv

 

3. 가상 환경 세팅을 진행합니다

python3-m venv scrap(가상공간의 이름)

 

저는 빅데이터 관련 가상환경을 만들기 위해 이름을 Bigdata라고 지었습니다 (scrap Bigdata)

 

세팅이 잘 되었는지를 확인하기 위해 생성된 가상 공간 이름의 디렉토리로 접근했을 때 다음 사진과 같은 바이너리, 헤더, 라이브러리 등이 존재하면 세팅이 잘 진행된 것으로 확인할 수 있습니다. 

 

4. 가상 환경이 잘 세팅된 것을 확인하면 가상환경으로 들어가는 명령어를 입력합니다.

source 가상환경경로/bin/activate

저는 home 에 가상환경을 만들었기 때문에 

source /home/leesohwa/Bigdata/bin/activate

이렇게 입력해줍니다. 그럼 다음 사진과 같이 가상환경에 들어간 것을 확인할 수 있습니다.

 

 

하지만 가상환경에 들어갈 때 마다 source~ 명령어를 입력해야 하는 번거로움이 있기 때문에 단축어를 만들어 좀더 쉽게 진입할 수 있습니다. 

 

5. bashrc 파일을 열어줍니다

nano ~/.bashrc

 

파일이 열리면 아래로 쭉 내리다 보면 기본으로 설정된 alias가 존재하는 것을 확인할 수 있습니다.

 

그 다음 본인이 생성하고 싶은 명령어를 아래의 문법에 맞춰 설정해줍니다.

 

alias 생성할 명령어 = 실행할 명령어

 

저는 BD 라는 명령어를 통해 제가 앞서 만들었던 Bigdata 가상환경에 진입하는 작업을 실행해보도록 하겠습니다.

 

alias BD='source /home/leesohwa/Bigdata/bin/activate'

 

문제없이 실행되는 것을 확인할 수 있습니다.

 

다음으로 본격적으로 Jupyter Notebook 를 실행해보도록 하겠습니다.

 

먼저 VSCode (설치가 되지 않으신 분들은 설치하셔야 합니다) 를 실행합니다.

 

그런 뒤 다음 extension을 설치합니다 

 

1. Python

2. Python for VSCode

3. Python Extension Pack

 

다음 터미널을 열어 가상환경에 진입해주고 ( 저는 BD를 입력)

 

jupyter와 ipykernel 을 설치해줍니다 ( 본 시스템에서 jupyter를 설치하는 것 보단 가상환경에 진입해서 설치한는 것을 권장합니다. 환경이 꼬일 확률이 줄어들기 때문입니다...)

pip install jupyter
pip install ipykernel

 

다음 아래의 명령어를 통해 jupyter notebook의 커널 목록에 원하는 가상환경 목록을 추가합니다. 

 

python -m ipykernel install --user --name [가상환경이름] --display-name "[jupyter에 표시할 kernel의 이름]"

 

저는 가상환경 이름: Bigdata ,  jupyter에 표시할 Kernel 이름 : BDjupyter

 

VSCode에서 가상환경 폴더 (Bigdata 폴더) 를 열어 Test.ipynb 파일을 만들어 줍니다. 그 다음 간단하게 돌려볼 Pandas 패키지를 설치하는 코드를 입력해줍니다.

%pip install pandas

가장 왼쪽에 있는 세모 화살표를 클릭하면 다음 사진과 같이 아까 입력한 jupyter kernel 이름이 나옵니다.

 

 

아까 입력한 jupyter kernel 이름이 나와 클릭하면 셀ㅇ리 정상적으로 작동하는 것을 확인할 수 있습니다.