본문 바로가기
Data Science

M2 맥북 아나콘다 가상환경 Okt 사용자 사전 편집 방법

by Lora Baek 2023. 5. 11.
300x250

Konlpy를 이용한 자연어 처리를 진행하다보면, 사용자 사전을 편집해야 하는 상황이 오곤 한다.

신조어나 우리가 원하는 단어를 등록해주기 위함이다.

 

오늘은 그 중에서 Okt 사용자 사전을 편집 후, 적용하는 방법을 정리해보려고 한다.

나는 혐오발언 Classifier를 만들고 있기 때문에 hatespeech라는 아나콘다 가상환경을 설정했는데,

그 가상환경 내에 설치된 okt 사용자 사전에만 적용되도록 하고 싶다.

(내가 사용하고 싶은 사용자 사전이 jar 파일로 압축되어 있다고 가정하고 진행한다)

해당 방법이 나온 블로그가 없어 방법을 찾아보다 직접 글을 작성하게 되었다.

 

 

1. 먼저 맥북 파인더를 열고, root 폴더로 이동한다.(나는 Macintosh HD라고 되어있다)

2. cmd + shift + . 을 눌러 숨김 폴더를 확인한다.

3. opt로 이동 후, anaconda3를 열어준다. 만일 homebrew를 설치했다면 homebrew->anaconda3.

4. envs 폴더에 접속하면 가상환경 리스트를 볼 수 있다. 그 중에서 지금 적용을 원하는 가상환경 폴더로 접속한다.

5. lib > python3.9(가상환경 파이썬 버전) > site-packages > konlpy > java로 접속하면 아래와 같은 화면을 볼 수 있다.

 

한나눔, 꼬꼬마 등의 사전이 각각 jar파일로 압축되어 있다.

우리는 Okt 사전을 편집할 것이므로 open-korean-text-2.1.0.jar 파일을 변경해줄 예정이다.

 

혹시 모를 상황을 대비해 폴더 안에 있던 기존 파일에는 '원본'이라는 이름을 붙이고, 폴더를 옮겨 저장해둔다.

그리고 내가 사용하기를 원하는 파일명을 open-korean-text-2.1.0.jar 로 변경해서 넣어두면 끝!

 

만일 폴더 위치가 나와 다르다면, 

1. 가상환경을 켠 후 ipynb 파일 열기

2. ipynb 파일에서 아래 코드를 이용해서 konlpy 파일이 설치된 경로를 확인할 수 있다.

import konlpy
konlpy.data.path

댓글