2015년 7월 23일 목요일

영어 단어 도대체 몇 개를 외워야 할까?

2026-02-02 수정

여러 분야에서 경험적으로 알고 있는 아주 당연한 파레토 법칙인 2 vs 8의 법칙, 또는 1 vs 9의 법칙, 또는 일당백의 법칙이 있다. 단어의 일부(특공대)는 매우 자주 사용되고, 나머지(예비대)는 가끔 사용된다는 것이지.

인공 지능이 알려 준 어휘 수준 (외국어를 원어민처럼 하기 힘들까?)
수준 어휘량 비고
일상 대화
대졸 원어민
전문직/교수
보캐 33,000
2,000 ~ 3,000단어
약 20,000 ~ 30,000단어
30,000단어 이상
약 33,000단어 수준
옥스포드 3000 수준
일반적인 성인 원어민의 평균 어휘력
전공 서적, 논문 등에 쓰이는 난해한 단어 포함
최고 난이도 (원어민 지식인 수준)
※ 3만3천의 의미 : 어근을 바탕으로 한 파생어 암기이기 때문에 체감하는 숫자와 다름

1. 사용 빈도


※ 단어 사용 빈도 모음은 아래 링크 참고.

여기 내용 : 영어 단어의 경우 TV, 영화 대사에서 약 4만 단어를 분석하니 다음과 같은 빈도라 함.
  • 1천 개 단어가 85.5% 비중 : 거의 문법 단어나 기초 단어들이다.
  • 1만 개 단어가 97.2% 비중 : 9천 단어가 97.2 - 85.5 = 11.7% 빈도로 사용된다는 말.
  • 모국어 화자는 약 4만 단어까지 사용? 원형이 아닌 변형(굴절)까지 카운트한 것임.
예를 들어 be동사의 변형(굴절)인 am, are, is, was, were 등도 따로 카운트 했다는 의미다. 동사는 원형+ing, 원형+ed, 원형+s, 원형+er 형태로 변형이 가능한데 이것도 따로 카운트 한 것이다. 이 중에서 특정 변형이 자주 사용되고 모두 사용되는 것은 아니다. 명사(단수/복수), 형용사/부사(비교급/최상급)는 변형이 거의 없다. 또한 학교에서 권장하는 기초 단어 중에 대화에서 사용하지 않는 것도 있다. 책과 TV, 영화의 단어 사용 빈도가 다르다. 소설과 시의 단어 사용 빈도도 다르다.

그러나 이 빈도는 사전의 단어 사용 빈도와 거의 흡사하다고 보겠다. TV 심슨 가족에서 사용되는 5천 개 단어만으로 빈부 격차 곡선을 그렸다. 컴퓨터가 4만 개를 그리기엔 역부족이다.


초반의 500개 미만의 급경사(80% 사용 빈도)에는 기초 문법 단어들이 집중 되어 있다. 이건 어느 나라 말에서나 예측할 수 있는 현상이다. 한자의 부수도 거의 이 정도 숫자다. 어느 나라 말을 배우건 기초 과정을 마치면 500개 정도는 당연히 알고 있다고 봐야 한다. 이걸 초급 필수 어휘(옛날엔 중학 필수였는데)라 한다.

외국어 기초 단어를 알면 그 외국어의 문법 특징 때문에 언어 구분이 가능하다. You, And, I 나오면 영어인 줄 알듯이, ~입니다. ~습니다. 나오면 한국어인 줄 알고, ~데쓰, ~마쓰 나오면 일본어인 줄 아는 것이다. 외국어 전문가가 아니라도 이 정도는 누구나 알 수 있다. 이런 단어들이 문법 단어이다.



2. 단어 2~3천 개만 알면 일상 회화 가능?


한국 영어 교육에선 고졸 수준이 3000개 영어 단어 외워야 한다고 권장한다. 옥스포드 영어 단어에서도 고졸이 3000개 수준이다. 대졸이 5000개 (고졸 3000개 포함) 수준이다.

보통 2~3천개 수준의 어휘만 알면 회화가 가능하다고 하는데 왜 한국인들은 못 하지? 겨우 3000개의 단어만 알면 95% 상황에서 영어 잘 하는 척 할 수 있다는 말인데? 한국인이 영어 못 하는 이유는 어휘력 때문이 아니라 회화, 작문 연습 부족이 원인이고 학교 교육 방식의 문제라는 말이 있다. (관련 다큐 동영상을 찾아 볼 것)

일본어를 한국인이 배우면 바로 회화가 가능하다. 어순과 표현이 거의 같아서 단어만 나열하면 될 정도이기 때문이다. 즉 영어는 어휘가 아닌 어순이나 표현이 익숙하지 않아서 말을 하지 못 하는 것이다. 그래서 영어는 단어를 많이 알아도 작문이 어렵고 말이 안 나오는 것이다. 그러니 단어는 한국어를 쓰더라도 영어 어순과 표현으로 생각하고 말 해 보자.



3. 고교 졸업 수준에선 7천 단어 권장? (일본어/중국어도 약 8천 단어 권장)


인터넷에서 단어장을 검색하여 보았다.
  • 옥스포드 고졸 영어 3000, 대졸 영어 5000 (고졸 3000포함)
  • 교육부 제시 고졸 영어 단어 약 3000개
  • EBS 생활 영어 기초 단어 = NEAT(영어능력시험) = 교육 과정 기본 어휘 : 3000개
  • 뜯어 먹는 중학 영단어 : 1800개
  • 중등 필수 영단어 : 2800개
  • 우선순위 중학 기초 1120
  • 우선순위 기초 1200
  • 우선순위 중2 1200
  • 우선순위 중3 1200
  • 우선순위 중등 1000
  • 우선순위 고교 영단어 1800
  • 수능 영단어 : 2000개
  • 모든 영어시험에 통하는 단어암기 : 2000개

인터넷 검색한 여러 단어장은 각자 대략 최대 3천개를 제시하고 있다. 그런데 인터넷 검색한 여러 단어장의 합집합을 구하면 약 7천 수준이다. 어라? 각자 단어 선택 기준이 매우 다르니 모두 합하면 결국 7천 개를 외우라는 것이잖아? 내가 옛날에 샀던 소사전에서도 고교 졸업생에게 암기하길 권하는 양이었다. 권장량의 2배잖아? 뭐 이러냐?

소사전에서 확인해 보니 거의 50%(약 7천개)가 파생어(접두사/접미사 결합)와 복합어(두 단어 결합)이다. 그 말은 약 50%(약 7천개)의 기본 단어를 먼저 알면 나머지 50%는 파생어/복합어라 한 번에 2개를 외운 셈이 된다. (1석2조) 역시 단순어(기본 단어)부터 외우는 것이 효율적이다. 무조건 짧은 것부터 외운다. 3만3천 외우는 것과 비슷한 원리.

초급 수준의 단어는 고등학교에서도 90% 빈도로 사용되기 때문에 모를 수가 없다. 문제는 고교 수준의 단어들은 나머지 10% 빈도로 사용되기 때문에 아주 가끔 보게 되니 잘 안 외워진다. 그렇다면 아마도 고교 수준에선 거의 어휘력 차이가 영어 점수의 차이를 결정할 것이다. 실제로 내가 본 친구들의 경우 어휘력이 곧 영어 실력이었다.

중학 단어는 이미 알고 있으니 외울 필요가 없을 것이다. (놀랍게 요즘 중학생은 옛날 고등학생 수준의 영어를 배운다.) 한 면에 100개의 단어를 정리하면 30장이면 6000단어를 정리할 수 있다. 이걸 3년 동안 가지고 다니며 외우는 것인데 왜 못 외우지? (하하하 나도 못 외웠으니... 내 암기 실력 테스트를 좀 해야겠다.)

적당한 선에서 포기해야 한다. 그리고 고등학교는 역시 이름 그대로 고급 수준이다. 국민 대다수가 학습할 수 있는 수준은 넘는다. 중학교까지가 국민 대다수가 도달할 수 있는 국민 교육이다. 한국은 중학교까지 의무 교육(국민 교육)이라 국가에서 공짜로 교육 시켜 준다. 대신 안 다니면 부모가 처벌 받는다. 고등학교는 의무 교육은 아니지만 사실상 무상 교육이다. 안 다니는 게 손해지. 거기까지만 해도 미국, 영국 놀러 가서 길 잃거나 밥 굶지 않는다. 역시 스카이에 들어간 친구들은 고교 국영수 전문가들이다. 정말로 고교 국영수는 아무나 가르칠 수 없다. 스카이 전문가들에게 배워야 한다. ㅋㅋㅋ

그러나 요즘 AI의 발달로 번역/통역을 기계가 해 주고 있다. 
어려운 미적분 수식 전개도 기계가 해 주고 있다.
우리 학교에서 99단 외우고 4칙 연산 기초 배운 후엔 계산기 사용하지?
영어도 기초 문법/단어만 배우고 번역기/통역기 사용할 날이 멀지 않은 거 같네
수학도 기초 논리/증명만 배우고 수식 계산기를 사용할 거 같네
그 동안 힘들게 공부하느라 수고 많았다 ㅋㅋㅋ
이젠 놀아야 할 때가 된 거 같은데?


4. 간단한 번역/작문 도움이 제작


여기에 번역 도움이, 작문 도움이 제작 힌트가 있다. 거창하게 AI까지 만들 필요 없어.

  • 기초 문법 단어는 문장의 틀을 제공하며 한국어 조사처럼 단어를 구분해 준다.
  • 기초 문법 단어는 쉽기 때문에 따로 외울 필요도 없고 번역할 필요도 없다.
  • 기초 문법 단어는 용법과 뜻이 다양해 기계적으로 번역하기도 힘들다.
  • 문장의 의미는 4품사(동명형부)가 결정한다. 이것만 잘 번역하면 된다.
  • 4품사 중에 가장 다루기 까다로운 것이 동사이다. 단어 변형이 가장 심하다.
  • 동사가 문형을 결정한다. 동사의 문형(용법)에 따라 동사의 번역어도 다르다.
  • 동사의 문형을 결정하려면 동사 바로 뒤의 단어를 미리 봐야 한다.
  • 명사, 형용사, 부사는 단어 변형이 거의 없고 번역어도 거의 하나다.
  • 규칙적인 변형을 하는 단어들은 원형을 기계적으로 찾을 수 있으나 검색하자.
  • 단어 변형을 검색하여 원형을 찾고, 원형을 검색하여 품사나 의미를 결정한다.
  • 인접한 단어끼리는 의미상, 문법상 궁합이란 것이 있어 품사/의미를 결정한다.
  • 어떤 단어의 의미를 결정하려면 그 단어 앞과 뒤의 단어를 함께 봐야 한다.
  • 동사 숙어 중에 뒤의 전치사가 앞으로 이동하는 경우 처리가 좀 어렵다.
  • 여러 단어가 이어진 숙어의 경우 앞 단어를 보고 힌트를 얻어야 한다.
  • 번역문의 어순을 한국어 어순으로 고칠 필요는 전혀 없다. 안 하는 게 더 낫다.

일단은 연습으로 먼저 명사, 형용사, 부사부터 자동 번역하는 것을 해 보라.
자주 사용하는 한국어, 영어, 일본어, 중국어 단어 순서는 다음 목록에서 찾는다.
사전에 있는 모든 단어를 등록할 수는 없잖아? 3만3천개를 어떻게 정리 하냐?

그리고 단어장에 저작권이 있을까? 결국 사전 베껴 편집한 거잖아?




물타기란?

90% 거짓 + 10% 진실 = 100% 거짓
10% 거짓 + 90% 진실 = 100% 진실

독재 잔당, 걱정원, 똥개검판, 조중동이 숨기고 싶은 진실 1개가 있을 때 거짓 9개를 퍼뜨린다. 보석이 떨어지면 구술을 풀어 버리는 것이다. 독잔당, 국세충, 좃충똥이 퍼뜨리고 싶은 거짓 믿음이 1개 있을 때 9개의 진실 속에 담아 퍼뜨린다. 9회는 높은 이자로 작은 돈을 잘 갚다가 마지막 1회에 큰 돈을 빌려 튄다. 전통적인 사기 기법이다.

이렇게 가다간 독잔당, 걱정원, 똥검개판, 좃충똥은 정말 연예인들과 원수지간이 될 것 같다. 정치적 문제가 생기면 연예인 도박, 과거사, 가족사, 결혼, 이혼, 불륜, 열애, 매춘, 강간 등을 퍼뜨려서 금전적, 정신적 피해를 준다. 겨우 연예인(논다니/갈보/창녀/매춘부)들 잠지 보지 때문에 나라가 시끄럽냐? 원래 그렇게 살던 애들인데 뭘 기대하냐? 연예계/화류계/무속계는 4주8자가 한 끝 차이라 하더라.

미인계를 조심하자. 미인이 당신에게 접근할 리가 없다.
여러분 추운 독재 시절엔 잠지 조심하세요. 안 그럼 F!

정치인 개인 도덕 → 정치 문제 → 사회 문제 (문제아에게 투표하지 말자)
정치인 개인 재산 → 정치 문제 → 경제 문제 (부자에게 투표하지 말자)
정치인 개인 신앙 → 정치 문제 → 종교 문제 (사이비에게 투표하지 말자)

댓글 없음:

댓글 쓰기