【インドネシア語検定】単語の分析(特A級・A級・B級)

CIMG1031

前回の記事では、以前作成したインドネシア語単語 出現頻度ランキングを分析し、単語のカバー率を見てきました。

カバー率とは「○○語の単語を知っていれば、文章中の××%の語を知っていることになる」という意味です。

今回は、インドネシア語検定(特A級・A級・B級)の過去問を分析し、「試験に出る単語」について考えていきます。

ただ、「能書きはいいから試験に出る単語を早く教えろ」という方がほとんどですよね。
そのような方は本ページの最下部あたりにあるダウンロードリンクへ直行してください。
単語リスト(テキストファイル)をダウンロード頂けます。

はじめに

インドネシア語検定の対策として、「試験に出る単語」を覚えたいと思う方は多くいらっしゃると思います。

覚えるべき単語が決まっていれば、学習の計画も立てやすいでしょう。
また、どれだけ覚えればいいかというゴールが見えることにより、モチベーションも維持できます。

しかし、インドネシア語検定に特化した単語帳は、今のところありません。
具体的に何をしたらインドネシア語検定に合格できるのかも曖昧です。

そこで、今回はインドネシア語検定の過去問を分析して、「試験に出る単語」を明らかにしたいと思います。

更に、インドネシア語検定の問題はきちんとしたものなのか、「過去問の単語の妥当性」も調べてみます。(注意:単なる1つの意見としてです。)

なお、以下の説明でも触れますが、今回は利用するコーパスの関係上、特A級・A級・B級に絞って見ていきます。

インドネシア語検定の単語レベルの基準

「試験に出る単語」を知るためには、相手を知ることが大事です。
まずは、インドネシア語検定が、どのような基準で試験問題の単語を選んでいるかを見てみましょう。

検定公式サイトによる評価基準と審査内容

インドネシア語検定は、公式サイトに「評価基準と審査内容」というページがあります。
そのページを参考に「試験に出る単語」を考えます。

まずは級別の説明を見てみましょう。

例えば、B級では次のような説明があります。

B級

平易な新聞記事、文献を読んで翻訳でき、平易な業務文書を書いたり、簡単な通訳ができる。

職場や社会生活に必要なインドネシア語を理解し、使用できる。

読む:平易な新聞記事、文献、業務文書を読み、理解することができる。
書く:平易な新聞記事、文献、業務文書の翻訳ができ、文書を書くことができる。
聞く:平易なテレビニュースや会議などの内容を正確に理解することができる。
話す:平易な社会問題について通訳したり、論理的に意見を述べることができる。

引用:インドネシア語技能検定 評価基準と審査内容

なるほど、職場や社会生活で使うインドネシア語か。
「平易な」新聞記事、文献、業務文書……

うーん……

「平易な」とは具体的にどのレベルの単語を想定しているのでしょうか。
詳細を探して見ましたが、どこにもありません。

これでは何をすべきか分かりません。

特A級・A級もB級と似たようなもので、説明が曖昧です。
結局、インドネシア語検定が、どのような基準で試験問題の単語を選んでいるかは分かりません。

参考:特A級・A級の基準(引用)

特A級
インドネシア語の通訳、翻訳者のプロとして通用するレベル。

職場や社会生活に必要な高度なインドネシア語を理解し、使用できる。

読む:新聞の社説、講演・会議資料などを読み、理解することができる。
書く:新聞の社説、講演・会議資料などの翻訳ができる。
聞く:講演、会議などの内容を正確に理解することができる。
話す:講演、会議などの話題について通訳をしたり、議論することができる。

A級

一般の新聞記事、文献を読んで翻訳でき、業務文書を書いたり、一応の会議通訳ができる。

職場や社会生活に必要なやや高度なインドネシア語を理解し、使用できる。

読む:一般の新聞、文献、業務文書を読み、理解することができる。
書く:一般の新聞、文献、業務文書の翻訳ができ、実用文書を書くことができる。
聞く:テレビニュースや一般的な会議の内容を正確に理解することができる。
話す:社会問題について通訳をしたり、論理的に意見を述べることができる。

インドネシア語検定の試験問題の範囲・内容とその特徴

どうやら公式サイトの説明だけでは、インドネシア語検定がどのような基準で試験問題の単語を選んでいるかは分かりません。
そこで、少しでも情報を増やすために、インドネシア語検定の特徴を自分で考えてみます。

公式サイトの情報をまとめ直し、以下のように分類しました。

特A級

状況:職場や社会生活

文章:新聞の社説、講演・会議資料

A級B級

状況:職場や社会生活

文章:新聞、文献、業務文書

C級D級E級

状況:日常生活

文章:取扱説明書、広告、案内板、チケット、手紙、挨拶、自己紹介、意思表示

こうして分けてみると、大きく2つに分けることができます。

  • 特A級・A級・B級: 職場や社会生活
  • C級・D級・E級: 日常生活

更に、「職場や社会生活」と「日常生活」で扱う「文章」に着目すると、私は次のような特徴があると考えます。

  • 職場や社会生活: 書き言葉またはそれに近いもの
  • 日常生活: 話し言葉またはそれに近いもの

ところで、試験に出る単語リストを作成するにあたり、私は以前作成したコーパスを利用しています。
そのコーパスはウェブのニュース記事を利用しており、話し言葉よりも書き言葉に近いです。

そのため、試験に出る単語リストは、特A級・A級・B級に絞って作成することにします。

特A級・A級・B級の違い

試験に出る単語リストは特A級・A級・B級に絞って作成することにしたので、ここでは特A級・A級・B級について更に見ていきましょう。

上で見てきたように、特A級・A級・B級の1次試験は、文章の内容に大きな差はありませんでした。
では、それぞれの違いはどのようなものでしょうか。

難易度

上で引用したインドネシア語技能検定 評価基準と審査内容をもう1度見てみましょう。
それによると「高度な(特A級)」「一般の(A級)」「平易な(B級)」という難易度の違いが見られます。

  • 特A級: 高度な
  • A級: 一般の
  • B級: 平易な

つまり、特A級・A級・B級は何かしらの難易度で区別されているということになります。
難易度で思いつくものといえば、語彙レベル・文法レベル・文章量・問題形式・正答率などでしょうか。

問題形式

実際に問題を見てみると、「A級とB級」と「特A級」で問題形式が異なっています。

具体的には次のような違いがあります。
(内容が変わり情報が古くなっている場合があります。ご注意ください。)

特A級

プロの通訳・翻訳者レベルを試験するための問題形式

  • 翻訳問題
  • 作文
  • リスニング
  • 面接試験
A級B級

一般的なインドネシア語の能力を測定する問題形式

  • 読解問題
  • 語彙問題
  • 文法問題
  • 翻訳問題
  • 作文
  • リスニング
  • 面接試験

試験に出る単語リストの作成方針

このように、特A級・A級・B級には難易度と問題形式に差があります。
そのため試験に出る単語リストについても、難易度と問題形式を考慮して作成すればいいはずです。

しかし、今回は問題形式については扱わないこととします。
本来であれば問題形式によってよく出る単語を分析すればいいのですが、十分なサンプルが手元になく、分析することができません。
今後の課題とします。

よって、今回は難易度のみを考慮して、試験に出る単語リストを作成することとします。

  • 難易度

単語の難易度とは

単語の難易度とは一体何なのでしょうか。

主に2つの意味があると思います。

  • 使用頻度(出現頻度)
  • 正答率

文法レベルや文章量は単語の難易度とは関係があまり無いと考えられるため、ここには含めません。
ただし、それを示すことは今後の課題とします。

出現頻度(使用頻度)

単語が出現する頻度が高い場合は、その単語に触れる機会も多く、覚えられる可能性も高いため、難易度は低いと考えられます。
逆に、単語が出現する頻度が低いと難易度は高いと考えられます。

正答率

単語の使用頻度に関わらず、正しく使えている人が多い場合は難易度は低いと考えられます。
逆に、単語を誤って使っている人が多い場合は難易度は高いと考えられます。

試験に出る単語リストの作成方針

正答率による難易度の測定は、その手段が無いため、今回は扱いません。
今後の課題とします。

一方、単語の出現頻度(使用頻度)は測定できるため、今回は単語の出現頻度(使用頻度)で難易度を測定することとします。

過去問の分析

これから、インドネシア語検定の過去問に使われている単語のレベルが、本当にそれぞれの級に適したレベルであるのかを分析します。

また、過去問の分析を通じて試験に出る単語を提示できるよう、先に単語を選ぶ基準を示します。

目的

  • インドネシア語検定の妥当性調査
  • 試験に出る単語の提示

インドネシア語検定協会による単語レベルの基準

インドネシア語検定協会は、試験に出題する単語を選ぶ際、何かしらの基準があるはずです。
まさか感覚的に試験問題を作っているということはないでしょう。

では、その何かしらの基準とはどのようなものでしょうか。

推測ですが、インドネシア語検定協会も単語の出現頻度を分析して、単語のレベルを「高度な(特A級)」「一般の(A級)」「平易な(B級)」と分けているのだと思います。

推測だけでは意味がないので、これからインドネシア語検定の過去問を分析していきます。

前提

1. 単語は基語(語幹)と変化形を別のものとして扱います。

単語は基語(語幹、基本となる単語)とその変化形を1つのグループとして考えることが多いですが、今回は基語と変化形を別の単語として、個別に扱うことにします。
確かに、基語を覚えれば変化形への応用が効きます。しかし、①変化形は基語と比べて、意味も機能も変化している、②基語が同じでも、変化形の種類によって、文章中の出現頻度が異なる、③できるだけ実際の文章で使われる形を覚えた方が、正しい言語感覚が身に付くのではないかと考えていることから、基語と変化形を別のものとして扱います。

2. 出現頻度順ランキングが正しく作られているものとして扱います。

出現頻度順ランキングは有名なサイトの記事を分野問わずまんべんなく利用しているため、比較的正しいものであると考えています。

3. 過去問は1次試験のみを対象とします。

2次試験は面接試験であり、1次試験の筆記試験とは種類が異なるため、1次試験のみを対象とします。

方法と手順

特A級・A級・B級の過去問の単語が、以前作成したインドネシア語単語 出現頻度ランキングの中で、どのように分布するかを見ていきます。

出現頻度ランキングは、インドネシア語の新聞・ニュース記事(総語数約1億438万語)を基に作成した、約84万語の出現頻度順の単語リストです。

分析の手順は以下の通りです。

  1. 特A級・A級・B級の過去問(※)について、それぞれの級ごとに出現した単語をリスト化する。この単語リストでは、単語の重複を削除する。
  2. 1.の単語リストをインドネシア語単語 出現頻度ランキングと比較し、過去問で使われている単語が妥当かどうかを分析する。
  3. インドネシア語検定の「試験に出る単語」を調べる。

※ 過去問はそれぞれ1回分のみ用意。

結果(過去問の単語が出現頻度順ランキングに含まれる割合)

まずは、過去問の単語が、出現頻度順ランキングに含まれる割合を見てみます。

過去問の単語が、出現頻度順ランキングに含まれないものが多ければ、過去問の単語は試験問題には適していないことになります。

なぜなら、出現頻度順ランキングの単語が実際のニュース記事に使われており、過去問の単語はそのデータを無視したものとなるためです。

[過去問の単語が出現頻度順ランキングに含まれる割合]
難易度 総語数 含まれる 含まれない
特A級 288語 287語
(99.7%)
1語
(0.3%)
A級 983語 965語
(98.2%)
18語
(1.8%)
B級  812語 803語
(98.9%)
9語
(1.1%)

過去問の単語のうち、出現頻度順ランキングに含まれないものは、以下の通りです。

[過去問の単語のうち、出現頻度順ランキングに含まれない単語]
特A級 nawasila
A級 pemercepatan
rohipnol
sedapatmu
benzodiasephine
dijangkit
kontrarevolusioner
ke-inggris-inggrisan
pe-an
ghb
ke-an
gemunung
pengalakkan
301kg
geletar
me-kan
pemakasaan
membototkan
kelapukan
B級 repelen
osaka-bali
birnya
me-kan
ditatang
idiomatik
sedapatmu
di-i
pneunomatik

この表に載っている単語の傾向としては、「接辞」「タイプミス」「日常生活の単語」「専門用語」「人名」「接中辞を含む語」「あまり使われない変化形」として、ほとんどを分類できます。

このように分類できることや、そもそもこの表に含まれる単語数が少ないことから、過去問が使用している単語は、この段階では問題なさそうです。

結果(出現頻度順ランキングにおける過去問の単語の分布)

次は、出現頻度順ランキングにおいて、過去問の単語がどのように分布しているかを調べます。

もしB級の単語が、A級の単語よりも難しいものが多い場合(出現頻度順ランキングの下位の単語が多い場合)、「過去問の単語選定はおかしい」ということになります。

単語の分布を以下の表にまとめます。

[出現頻度順ランキングにおける、過去問の単語の分布]
単語レベル 特A級 A級 B級
1~5,000語 237語
(82.6%)
692語
(71.7%)
550語
(68.5%)
5,001~10,000語 23語
(8.0%)
104語
(10.8%)
101語
(12.6%)
10,001~15,000語 9語
(3.1%)
43語
(4.5%)
42語
(5.2%)
15,000~20,000語 5語
(1.7%)
22語
(2.3%)
27語
(3.4%)
20,001語~ 13語
(4.5%)
104語
(10.8%)
83語
(10.3%)
合計 287語
(100%)
965語
(100%)
803語
(100%)

この結果を、「特A級」と「A級・B級」、「A級」と「B級」、「特A級」と「A級」と「B級」の3つに分けて分析します。

1. 「特A級」と「A級・B級」

先に述べたように、インドネシア語検定の公式サイトによると、それぞれの級を「高度な(特A級)」「一般の(A級)」「平易な(B級)」と表すことができます。

しかし、特A級とA級・B級を比べると、表の結果を見る限りでは、特A級の方が語彙の面では簡単であるといえます。

なぜなら、特A級は1~5,000語レベルの簡単な単語がA級・B級よりも多く、また5,001語以上のレベルである難しい語がA級・B級よりも少ないためです。

ただし、これはあくまでも単語レベルの話です。

特A級は試験が「プロの通訳・翻訳者レベルを試験する」ためのものなので、単語レベルが簡単になっても不思議ではありません。

なぜなら、特A級では全文翻訳(インドネシア語→日本語、日本語→インドネシア語)やインドネシア語作文といった、単語を全て自分で思い出さなければならないためです。

そのような試験では、自然な訳語であれば、必ずしも単語レベルの高い語を選ぶ必要はないと思われます。

2. 「A級」と「B級」

1~5,000語レベルの簡単な単語はB級よりもA級が多く、5,001語以上のレベルである難しい単語はB級よりもA級が少ない傾向にあります。

つまり、B級の方がA級よりも難しいという結果になりました。

3. 「特A級」と「A級」と「B級」

20,000語までのカバー率は、次の通りです。
特A級 95.5%

A級 89.2%

B級 89.7%

このことから、A級とB級は、20,000語程の単語を覚えて、文章中の単語をやっと約90%知っているという状態になります。

これは、当サイトの作成したコーパスのデータと大きく離れています。

当サイトのコーパスでは、10,093語知っていれば、90%をカバーするのですが。

試験に出る単語

これまでの結果から、「試験に出る単語」次のように提示したいと思います。

これだけ覚えれば、A級とB級では、試験問題の約90%の単語が分かるようになります。

ただし、20,000語とはいっても、実質的には10,000~15,000語くらいではないかと思います。

出現頻度ランキングは変化形単位でカウントしていますし、簡単な英単語や意味を成さない言葉がノイズとして入っているためです。

例えば、19,984位は英語で”choice”だったり、19,994位は簡単な単語”mencobanya”だったりします。

そのようなクオリティですが、出現頻度ランキングのファイルは無料で配布しているので、よろしければ下記よりダウンロードしてご覧ください。

データの形式と内容

データの形式と内容について、いくつか注意事項があります。

データの形式と内容
  • データの表示形式は、「順位」「単語」「出現回数」の順に並んでいる
  • 全て小文字に変換してカウント・表示
  • 基語と変化形を、それぞれ別の単語としてカウント
  • 半角英数または半角ハイフンで構成される、他の言語が含まれていることがある(例:英語)

利用条件

以下の利用条件に同意した場合のみ、データ(インドネシア語検定 級別単語リスト)をご利用頂けます。

利用条件
  • 当サイトのデータ利用による損害・損失等について、当サイトは如何なる責任も負いません。また、データの正確性も保証しません。自己責任でご利用ください。
  • データは商用・非商用を問わずご自由に利用・改変・頒布頂けますが、必ず当サイトへのリンク等をもって出典を示してください。
  • 著作権は当サイトが保持しています。

ダウンロード

「試験に出る単語」リストを用意しました。特A級・A級・B級のどの場合にも、20,000語まで覚えることをおすすめします。

しかし、上にも書きましたが、実質10,000~15,000語くらいだと思いますので、安心してください。

ファイル形式は.txtです。

ダウンロード

単語ランキングのフルリストが欲しい方は、インドネシア語単語 出現頻度ランキングのページよりダウンロードすることができます。

今後の課題

  • 基語と変化形のグループによる出現頻度の分析
  • 出現頻度ランキングのノイズ除去(英語、意味を成さない語など)
  • 過去問のデータ増加(今回は1回分のみ)

まとめ

  • インドネシア語検定の単語レベルは、考え方によっては適切ではない可能性があります。
  • インドネシア語検定のA級とB級は、単語レベルにおいては、B級の方が高くなることもありえます。
  • インドネシア語単語 出現頻度ランキングの20,000語を覚えれば、インドネシア語検定の特A級では約96%、A級では約90%、B級では約89%の単語を知っていることになります。
  • 20,000語を覚えれば、一般のニュース記事に出てくる単語のうち、約94%を知っていることになります。

終わりに

インドネシア語検定は、検定のための情報や参考書がとても少ないように思えます。

当サイトの情報が正しいとも限りませんが、それでも一つの参考になれば幸いです。

当サイトについて、ご意見・ご質問など受け付けていますので、何かありましたらご連絡ください。

広告