こんにちは!

英語脳プロデューサーのZakです。

15年間の海外勤務の経験から、ビジネス英語、海外生活、異文化コミュなどについて書いています。
ーーーーーーーーーーーーーーーーーー
TOEICスコアが低くたって大丈夫!
初めての海外赴任でも成果が上がる 
キャリアアップ英語
ーーーーーーーーーーーーーーーーーー

 

本を入手しまして、読み始めたところこんなことが書いてあったんです。

 

 

英語の語彙は、約50万語ある。

原書は「word」ではなく「vocablary」を使っているので上では語彙と書きました。

  • 50万語のうちの100語が日常会話の50%で使われる。
  • 50万語のうちの300語が日常会話の65%で使われる。
  • 50万語のうちの500語が日常会話の80%で使われる。

と書いてある。

つまり、500語を覚えればネイティブスピーカーとの日常会話の4/5はカバーできるんだということですね。

 

ホンマに?ということで、

 

次の質問をChatGPTに投げてみました。

 

「英単語は50万語ほどあるとのこと。そのうちの500語で日常会話の80%になるという論文がある。これは正しい情報か?」

 

そしたら、GPT君は、まず次のことを教えてくれました。

 

「英語の語彙に関するこの主張は、実際にはいくつかの研究や言語学的な分析に基づいています。具体的な数値や割合は研究によって異なりますが、以下の点を考慮することで、ある程度の理解が得られます。」

 

ある程度の理解ってどういうこっちゃ? 

含みのある回答・・・

 

それに続くGPT君の答えを書いていきます。(少し文章を短くしています)

 

 

英語の語彙

 

総語彙数

正確な数値は難しいですが、Oxford English Dictionary(OED)には約60万語が収録されていると言われています。技術用語や専門用語、新しい言葉などを含めると、英語の総語彙数は100万語を超えるとも言われています。

 

日常会話で使われる語彙数

言語学者たちは、日常会話で使用される語彙の範囲を調査しており、多くの研究は少数の語彙が会話の大部分を占めることを示しています。

 

500語で日常会話の80%

この具体的な主張は、ジップの法則(Zipf's Law)や、語彙の頻度分布に基づくものです。

ジップの法則は、少数の単語が非常に高頻度で使用され、多数の単語が低頻度で使用されるという法則です。

  1. ジップの法則: ジップの法則によれば、最も頻繁に使用される単語は、非常に高い頻度で出現します。例えば、「the」や「be」などの単語は、テキストの多くの部分に現れます。

  2. 基本語彙の割合: いくつかの研究によれば、日常会話や基本的なコミュニケーションにおいて、頻出する500語が全会話の70%から80%を占めることが示されています。これは、単語の頻度分布が非常に偏っているためです。

そんで? なに? と言いたくなるコメント。
 

実際の研究例

  1. British National Corpus (BNC): BNCのデータによると、最も頻繁に使用される1000語が、書かれたテキストや話し言葉の約80%を占めることがわかっています。

  2. 他の研究: 他の研究でも、頻繁に使用される少数の語彙がコミュニケーションの大部分を占めることが示されています。たとえば、Charles K. Ogdenの「Basic English」は、850語で多くの日常的なコミュニケーションをカバーすることを提案しています。

 

結論

日常会話の80%を500語でカバーできるという主張は、厳密には研究やデータに基づく推定です。この割合は、言語の使用頻度の分布に依存しており、ジップの法則などの理論に基づいています。実際の使用状況やコンテキストによって若干の違いはありますが、基本的な日常会話において少数の高頻度語彙が大部分を占めるというのは、正しいと言えるでしょう。

 

結論の吟味 by Zak

 

以上のように、ちょっと微妙な結論を出してくれました。

 

この後も少しやり取りをしたんですが、私の理解は500語~1000語の幅がある、と理解しました。

 

正しいというのは、「数学的な統計計算に基づいた推定計算の結果だから、正しい計算結果だ」ということなんです。そりゃそうですね、統計の手法を使わなければこんな数字出せませんからね。

 

だから、500語より1000語を目標にした方がよさそう

 

研究者たちは大規模なテキストコーパス(例:British National Corpus, Corpus of Contemporary American Englishなど)を使用して、単語の出現頻度を分析しています。

コーパスとは、これ→ English-Corpora: COCA

 

登録が必要ですが、こういうデータベースで分析してるんですよね~

AIが得意そう・・・・

 

1000語覚えればよいとは言うけれど、学習者からすれば、「それって句動詞や慣用句も含んで1000語なのか?」って知りたいですよね?

 

ハイ、聞きました。

 

句動詞や慣用句も、この1000語の中に含まれることが一般的」、というのがGPT君の答え。

 

ありがたいお答えですね?

 

 

ですから、大事なことは「頻出1000語」とか何千語とか書いてある本、その根拠はオーパスから来ているのかどうかを確認したほうがいいかもしれませんね。

どんな本でも、大元のデータはオーパスかもしれないけど。であれば、何を選んでも同じってことで。

 

その裏取りが出来れば、頻出1000語を覚えるのは、「やるしかないでしょ!」

 

とはいえ

それぞれのビジネス領域で特有の単語は、頻出ではない確率が高いですよね。

 

海外赴任で成果を上げるためには、頻出1000語だけでは足りないですよ!

 

 

では、また

 

Good Luck!

 

Zak