2018年3月号の『ENGLISH JOURNAL』では「TOEICスコアが劇的にアップする『コスパ最高の英単語』」の特集をお届けしています。今回GOTCHA!では、執筆者の西嶋愉一先生に、その分析方法や本誌に掲載しきれなかったポイントなどをうかがってみました。
西嶋 愉一(にしじま ゆいち)先生
1962年東京都生まれ。1987 年日本アイ・ビー・エム入社、主にソフトウェア開発に従事。現在は金沢大学国際基幹教育院准教授。コンピュータ支援外国語教育(CALL)と並行して、TOEIC 研究にも積極的に取り組む。「TOEIC®テストスコアアップ指導者養成講座」の第4回修了生(2008 年)。調査目的で公開テストを受験し続け、受験回数は80回以上に上る。TOEIC(L&R)990点取得。共著に『改訂版 TOEIC L&R®テスト 究極のゼミ Part2&1』(アルク)、『TOEIC®TEST 鉄板シーン攻略 ボキャブラリー』(ジャパンタイムズ)など。
「コスパ最高の英単語」とは何か?
コスパ最高の英単語=TOEIC特徴語
――「コスパがいい」というのはつまり、「少ないコスト(労力)」で「大きな効果」が得られることを指すと思います。単語において、そんなものってあるのでしょうか?
今回の特集では、端的に言えばコーパス*1分析で導き出したTOEICに頻出かつ特徴的な語彙を指して、「コスパ最高の英単語」と呼んでいます。
細かな分析方法はENGLISH JOURNAL本誌で説明していますが、簡単に言うと、「TOEIC問題集のコーパス」と、COCA*2という一般的なアメリカ英語のコーパスを照らし合わせて分析することで、「TOEICで特徴的によく使われている語(TOEIC特徴語)」を見つけ出すことができます。
5200問、約28万語を分析!
――「TOEIC問題集のコーパス」って一体、どんなものなんですか?
今回、分析に用いた問題は200問のテスト、26回分あります。計5200問、単語数は約28万語にのぼりました。設問と選択肢、Part 3の会話、Part 7なら長文など、テストに出現する英語の素材を残らず書き出してテキストデータにしています。
この「TOEIC問題集のコーパス」をまず、「見出し語化」しました。「見出し語化」とは、変化形はひとまとめ、be動詞はすべてbeで代表させる、といった整理をすることです。この後で見出し語の総数をみると1万350語となりました。
これらの処理の過程で英単語以外のものが混ざることがあり、それを取り除くと実際の語数はこれより少なくなります。単語数は概ね1万語と考えてよいでしょう。さらに、この中には一度しか使われない人名や地名などの固有名詞が大量に含まれるので、学習する意味のある語彙は8,000語程度と思われます。単語というのは、同じ語でも異なる意味、異なる使い方をするので、量を増やすだけでなく、ひとつひとつの語についての知識を深める学習が必要なんです。『ENGLISH JOURNAL』3月号では、その最初の一歩となる語彙を150語に絞り、解説しました。
TOEICでたくさん使われる単語はどんな語なのか?
上位5単語が出現単語の18%を占める
――ずばり、分析した結果として、どんな語がTOEICに頻出だったのでしょうか?
TOEICに限らずよく言われるのは「the」だけで、使われる単語の6%を占めるということです。
TOEICコーパスでも1位はthe(1万3620回)でした。それ以下はbe(1万1476回)、a(9496回)、to(8874回)、have(6674回)と続きました。ここまでを合計しただけで、出現回数は5万140回。単語の総数27万7831に対して18%を占めていました。
基本単語で「TOEICの世界の日常」が見える
――なるほど。でも、そのレベルの簡単な単語だと覚えるという話でもないですね…。
上位にくる語はそれ以外にもof、in、for、you、willなど英語なら必ず使う語が多いので、それらは除いて考える必要がありますね。
すると、new(29位)、work(41位)、business(52位)、mail(53位)、office(65位)などが続き、order、product、call、service、customer、meeting、employee、storeといった語が100位までにランクインしました。
100位までの単語を見ていると、new productをcustomerに売るbusinessのために、employeeたちがofficeでmeetingをしたり電話でcallしたり、orderを受けたりmailをやりとりしたり……という、TOEICの世界の日常が見えてくるようですね。
単語は、どのくらい覚えれば十分なのか?
理想は「英文中の95~98%の単語を知っている」状態
――特集では、必須の150語に絞ってくださったとのことですが、最終的には、英文をすらすら読んで解くには、どのぐらいの語彙数を覚えたらいいのでしょうか?
英語のテストに使われている英文を読むには、その中に、知っている単語が95~98%必要ということが多くの研究で言われています。それ以外の、未知語の意味を正しく推測するにはそれくらいが必要、ということです。
そこで、今回計算したTOEICでの出現頻度から95%、98%とは何語になるのかを計算してみると、3000語程度あれば95%、6000語程度で98%をカバーできることがわかりました。これは数え方にもよるので、ひとつの指標と捉えていただくのがいいでしょう。
学習の目安は「基本語彙+1000語」
――その3000語というのは、一般的な英語の基本語彙と同じなのでしょうか?
「基本語彙」をどうとらえるかにもよりますが、よく知られた一般的な基本語彙のリストとして、NGSL*3というものがあります。
このリストとTOEICにおける出現頻度95%となる約3000語(正確には2974語)を比較してみました。細かな定義づけが同じでないと正確には比較できないため、あくまでも「参考」です。
結果として、2974語のうち1781語はNGSLと一致しました。ここから一致しないもののうち、学習不要なものなどを整理していくと、1000語程度が残りました。つまり、学習の指針として、「基本語彙プラス1000語」が目安にできそうです。
分析結果から見える意外な事実
主語はPart 3の3人会話問題を見抜く鍵になるか
――分析してみて、何かTOEICを解く際のヒントになったりすることはありましたか?
TOEICの新形式問題では、Part 3に3人による会話が加わりました。これらは、設問にmenまたはwomenが使われていれば、それを見ただけで音声が流れる前に3人の会話だと判断できると言われています。
では、実際、menやwomenは設問においてどれくらい使われているかを調べると、新形式テスト11回分の公式問題にmen、womenとも5回出現しています。
22セット中10セットにmenとwomenが出てきたので、約5割の確率で「3人の問題だ」と解く前に見分けられます。
――2回に1回なら希望が持てそうですね。他には何かありましたか?
テクノロジーが大きく変化する時代にあって、TOEICも時代によって少しずつ変化してきていることが見えてきました。
例えば、旧世代のテクノロジーとしてなにかとやり玉に上げられるfaxは、新形式の公式問題(2016年以降)には出現していません。
逆に、smartphoneは2017年、tablet computerが2016年に登場していますから、通信やコンピュータのテクノロジーは、TOEICの世界でもちゃんと進歩しています。social mediaも頻繁に出てくるようになりました。
自動車では、electric carは2017年に登場していました。一方、同じ2017年にfuel efficientが出現しているところをみると、現実の世界と同様に、自動車は過渡期にあるようです。
ちなみに、LED照明器具は2014年に登場しましたが、以後は出てきていません。もはや、LEDが当たり前になったのかもしれませんね。
ところで、放送といえば相変わらずラジオです。他の分野ではテクノロジーの変化にちゃんと反応しているようですから、そのうち、「スマートスピーカー」から聞こえる音声について答える時代がくるのかもしれませんね。
まずは必須の150語をマスターすべし!
いかがでしたでしょうか。西嶋先生の丁寧な分析により厳選された150語はぜひ『ENGLISH JOURNAL』でチェックしてください。
パートごとに必須の特徴語に加え、スコア800以上を狙うのに必要な上級語などをまとめて掲載しています。どんな場面で、どんな単語と一緒に使われるのかなど、情報満載でお届けします。
また、そんなTOEIC特徴語をこれでもかと詰め込み、『ENGLISH JOURNAL』オリジナルの例文50本もご紹介。徹底的に使い倒して、効率よく語彙をマスターしてください。
西嶋先生の本

【新形式問題対応/CD-ROM付】 TOEIC(R) L & R テスト 究極のゼミ Part 2 & 1
- 作者: 西嶋愉一,ヒロ前田
- 出版社/メーカー: アルク
- 発売日: 2017/01/25
- メディア: 単行本
- この商品を含むブログを見る
インタビュー・文:ENGLISH JOURNAL編集部 江頭茉里