태터데스크 관리자

도움말
닫기
적용하기   첫페이지 만들기

태터데스크 메시지

저장하였습니다.

R 프로그램을 돌리기도 귀찮으니, 원서 한 권을 한꺼번에 돌려서 영어 단어를 추출하면 귀찮은 일을 한 번만 하면 된다는 장점이 있지만...

추출된 수 천 개의 단어가 들어있는 엑셀 화면을 보면 멀미가...-.-;


굳이 이런 작업을 해야 하나 싶어서 '단어 추출'이라는 검색어를 구글에 돌려보니 눈에 띄는 블로그가 나온다.

t2bot (Text 2 Robot)

텍스트 관련 블로그인데, 여기서 단어구름(WORDCLOUD)를 작성해주는 페이지가 있고, 더불어 단어 추출도 해주는 페이지가 있다.

단어 추출 페이지로 가면 귀찮게 R 프로그램을 돌리지 않아도 단어를 빈도순으로 정리해서 보여준다.


저번에 사용했던 '두 도시 이야기' 원서를 테스트해보자.

두 도시 이야기의 Book I - chapter 1 부분을 복사한 후에 단어 추출 페이지에 붙여넣고 분석해보자.

[Gutenberg 사이트에 접속해서 chapter 1을 복사한다.]


377개의 단어가 빈도순으로 추출되어 나온다.

[너무(?) 쉬운 단어 같은 것은 제외하고 알아서 단어를 빈도 순으로 정리해준다.]


R 프로그램보다 좋은 점은 'the', 'and', 'a', 'an', 'but' 이런 쓸데 없는 단어도 알아서 제거해준다.(뭐... R 프로그램을 잘 쓰면 코드에 다 넣어둘 수 있었겠지만, 어떻게 하는지 모름...-.-;)

9600개의 단어를 정리하는 것보다는 훨씬 할만한 상태가 되었다.

원서 한 권을 하루만에 다 읽을 것도 아니고, 책 읽기 전후로 챕터별로 '단어 추출 페이지'를 적용해 모르는 단어를 골라서 공부하면 훨씬 수월하지 않을까 싶다.


그래도, 사전 찾기와 공부는 내 몫이라는...ㅠ.ㅠ


P.S.
모르는 단어 찾기라는 닭짓은 2년 전에 시작했으나... 저 좋은 페이지를 알게 된 것은 최근이라는 것이 함정...-.-;
(2년이라는 시간 동안 단어 찾기에 별 노력을 안 했다는 것이 큰 위안!)

+ Recent posts