情報伝達量からみた日本語 〜世界でもっとも早くしゃべる日本語話者のツイートは濃厚?

情報伝達量からみた日本語 〜世界でもっとも早くしゃべる日本語話者のツイートは濃厚?

2019-10-13

日本語が、ほかの主要言語と比べて最も速くしゃべられている、と指摘する言語学の論文が今年9月に発表されました(Coupé, 2019)。そこで導き出された結論が(言語学の専門家だけでなく)一般の人にとってもおどろくべき内容であったため、世界各地のメディアでとりあげられていました。

今回はこの論文の内容を紹介しながら、情報伝達の媒体としての日本語の特徴について、さらに少し掘り下げて考えてみたいと思います(とはいえ、論文そのものは、専門的知識や理解が足りず歯が立たなかったため、以下の記事は、論文の著者自身や主要メディアの解説を参考にしながら、論文の結論の部分についてまとめました。原文については下の参考文献から全文ご覧になれます)。

言語の情報伝達容量の測定と比較の結果

言語は構造や発音などいろいろな要素があり、それらは言語によって非常に大きく異なりますが、情報を伝達する、という機能と、その情報の伝達に、音声を使うということは共通しています(書き言葉もあるのでは、とつっこみたい方もいるかもしれませんが、もともと言語は音声で伝える口語であったという言語発祥の歴史にさかのぼり、とりあえず、ここでは、言語を音声に依拠するもの、と一応とらえておくことにします。ただし、話し言葉でない言語についても、あとのほうで若干触れます)。

論文著者たちは、以前、ひとつの音節(シラブル)内に伝達できる情報量の容量について、世界の主要言語を調べたことがありますが、その結果、日本語が、ほかの言葉に比べると非常に低いということを明らかにしました。

音節とは、ひとまとまりとして感じられる音の最小単位のことで、言葉をゆっくり話した時に、区切られて聞こえる音のことです。母音と子音が組み合わさってできています。つまり、ひとつひとの単語は、ひとつ、あるいは複数の音節によって成り立っているということになります。

これだけ聞いてもぴんときませんので、『世界大百科事典』(出典:平凡社世界大百科事典 第2版)にあげられている例をあげてみます。「例えば英語のstrike[stráik]は1音節であるが,日本語は[str]のような子音連続や[k]のような子音で終わることを許さないので,strikeという英語を日本語の語彙の中に取り入れるためには,これらの子音の間や終りに母音ウ[ɯ]やオ[o]を添加してス・ト・ラ・イ・ク[sɯtoraikɯ]と5拍に読み替えてしまう。」

つまり、「音節(拍)の構造が〈子音+母音〉を基調とし」、「母音で終わる〈開音節〉の語が多い」日本語は、ほかの言語よりも、言葉のなかに音節がやたらに多く、それゆえ音節ごとに切ってその情報の容量をはかると、やたらに少ないということなります。著者たちの計算によると、1音節で伝えられる情報量を英語と日本語で比べると、実に11対1になるそうです。

言語によってしゃべられる速さが違う

しかし、ここまでは、単に音節が多い言語形態なのだから、ひとつひとつの音節のなかの情報量が少ないのも、当然といえば当然という気もします。この論文での興味深い発見は、むしろここから先です。

論文の著者たちは、世界の言語をいくつかのグループに分け、それらをおおむね代表していると考えられる17言語を選び、それぞれの言語につき、10人のネイティブスピーカーに15の短い日常の光景を叙述した文章を読んでもらいました。そして、その音源をもとに1秒間に何音節発話しているか測定しました。1秒間に話す音節の数を、スピードを図るバロメーターとし、しゃべる速度を測定したというわけです。

すると、1秒間に話す音節の数は、言語によって大きく異なり、もっとも速くしゃべられていたのが、日本語、という結果になりました。日本語話者は、1秒間に平均して8音節をしゃべります。ドイツ語や、アジアの声調言語(音の高低(トーン)のパターンで意味を区別させる体系をもった言語。中国語やベトナム語など)では、これよりずっと1秒間に発話される音節数が少なく、つまり、ゆっくりしゃべられていました。ちなみに、スペイン人やバスク人、イタリア人も、日本人とほぼ同じほど速く(つまり多くの音節)を発話していました。

しゃべる速度と情報量の関係

さらに、著者たちは驚くべき事実を発見します。17言語のしゃべる速度と、それぞれの言語の音節の平均情報量を掛け合わせて、一定の時間に伝えられる情報量を計算してみると、17言語が伝達する情報量は、ほぼ同じ値となったのです。その情報量をビットという情報の単位で計算すると、毎秒39ビット(1秒あたり1ビットの伝送率、b/s, bps, bits/sなどとしても示されます)となりました。

つまり、しゃべる速度は言語により異なりますし、音節内にある情報量も違いますが、(音節の)情報量が多い言語Aは、ゆっくり話され、情報量が少ない言語Bは、(言語Aと同じ分量の情報量を一定時間内に伝達するために)速く話されることで、最終的に「伝えられている情報の量」は、どの言語も、同じだったということになります。

「やっぱり」と「意外」

この論文の結果が、ドイツ語圏で報道されると、ドイツ語圏の人たちからは、ああ、やはり、という声が多かったようです。常日頃、ドイツ語話者の間では、イタリア語やスペイン語の話者の言語をはたで聞いていて、どうも自分たちよりよくしゃべっているような、早口だなあ、という印象をもっていた人が多かったからでした。

一方、たとえ早口でしゃべっていても、結局、しゃべっている内容量が、実は、自分たちとほとんど同じだったという事実には、想定していなかったようで、驚いていました。

日本語話者としてどう感じる?

さて、ここからは、話題をヨーロッパからアジアにうつし、日本語に焦点を合わせてすすめていきます。日本語話者は、今回、著者たちから、「世界最速のおしゃべり語族」のお墨付きをもらったわけですが、そのような自覚が、これを読まれている日本語話者のみなさんに、これまであったでしょうか。

わたしは、この話を聞いて、ひとつ思い出したことがありました。ドイツ語と日本語の間で通訳する際たびたび経験してきたことなのですが、短いドイツ語を通訳するわたしに対し、(わからないながら)横で聞いていたドイツ語圏の話者が、なぜ、簡単なドイツ語の文章がそんなに長い通訳になるのか、と面喰らっていた場面です。

このため、この論文の結論を聞いて、なるほど、とすこし腑に落ちた気がしました。その一方、日本語がほかの言葉より多くしゃべっている(とすればその)理由は、単に音節内の伝達できる情報の密度だけでは、十分な説明ではない、という感じも、同時に強くもちました。日本語がほかの言葉より、一定の時間内に同じ情報を伝達するのに、多くしゃべられるのだとすれば、それは、ほかにも少なくとも二つの大きな理由があると思います。ひとつは、日本語の音節の種類の少なさ、もう一つは日本人の礼節文化の独自さからです。ひとつずつ説明してみます。

音節の少なさに起因する饒舌さ

日本語は世界的にみても、音節の種類が非常に少ない言語です。たとえば、英語には音節の種類が7000ありますが、日本語が650しかありません。

音節が少ないため、同音異義語が多くなります。漢語の熟語は、特に多く、同音異義語のオンパレードです。このため、通常の話をしているとその前後の文脈(コンテクスト)で、同音異義語のどの意味を指しているのかがわかる場合が多いですが、それでも、時々、どの同音異義語を指しているのかそれほど自明でないこともあります。そのため、(同音異義語が比較的少ない)やまと言葉に置換して言ってみたり、どの言葉を指しているのかはっきりさせるために前や後の文脈を補ってみたり、あるいはちょっと気取った言い方で、英語で相当する言葉で言い換える、などの必要がでてくることがしばしばあります。

例えば、「ビジネスで肝心なのはソーゾーする力だ」と音声で聞くと、これだけでは「ソーゾー」が、「想像」か「創造」かはっきりしません。なので「新しいことやものを考える力である」とか、「クリエイティビティ」など、ほかの言葉で言い換えして内容を補充、補完するようなことが、結構あるように思います。

置き換えたり、前後に文脈を補強して、指している言葉を察知してもらわらなくてはいけない場面が多くなればなるほど、結果として、音節が豊富な言葉よりも、しゃべる言葉数が多くなってしまう、ということがままあるように思います。

礼節文化に起因する独自さ

もう一つ考えられるのは、日本語という言語というより、日本人の礼節への考え方や相手への期待など、独自の文化的背景に起因する、独特の「饒舌さ(発話量の多さ)」です。

これは、人や文脈によって、もちろん一概にはいえませんが、通訳の場面ではたびたび感じます。相手の誠意や礼節ある態度を、表現しようとする時、日本語では、しゃべっている言葉だけでなく、日本人は発話する態度や、言い回し方、話の順序(なにから話をはじめるかなど)などをとても重視し、オブラートに包むよに丁寧に伝える傾向が強いと思います。もちろんドイツ語圏の人でも、礼儀はあり丁寧な言い方もありますが、日本人の比ではありません。

例えば、ダイレクトに言わずに語尾をぼかして、察知してもらうように期待するとか(「今日はちょっと、いろいろあって」 〜言葉の通訳と異文化間のコーディネイト)、はっきりいうにせよ、相手に対する理解を前後で示したり、相手にできるだけ抵抗なく受け止めてもらうようにいくつかの言い回しを追加する、といったことがあります。礼節の一環として、日本語で頻繁にもちいられる謙遜後や尊敬語も、文章を長くします。例えば、「わたしも行きたいです」という情報を、「わたしも行かせていただきたいのですが、ご一緒してもよろしいですか」といった具合に表現することがあります。そのように丁寧な言い回しを重視すればするほど、基本の情報量は同じでも、言葉数としては、かなり多くなります。

また、お礼の気持ちを表す時に、ドイツ語では一度「ありがとう」で済むせることでも、日本語は一回でなく、感謝の言葉を、何度か時間の間隔をあけて繰り返す(そのような形で感謝の気持ちを真摯に表そうとする)ことがままありますが、このように、情報としては同じでも繰り返すことが多いのも、発話量は増やす結果につながっているように思います。

脳の処理能力

ところで、この論文では、一定時間に伝達される情報量が、どの言語にも共通している、という重要な事実も指摘していましたが、一体どうしてそのようなことになったのででしょう。17カ国の言語の精密な観測の結果、ほとんど違いがないというのですから、単なる偶然ではないでしょう。これについては、著者たちは仮定にすぎないと断りながらも、脳の処理能力に関係するのではないか、と自説を披露しています。

わたしたちホモ・サピエンスの脳は共通して、伝達されてくる情報を処理する能力をもちますが、それには(どの情報処理ツールにもあるような一定時間に処理できる容量の)上限があり、それ以上の情報が入ってきても処理できないため、だいたいどこの言語においても、その上限に見合うほどの情報量しか、一定の時間内に、伝達されていない、ということなのではないかと。言い換えれば、言語は非常に差異があるにも関わらず、毎秒39ビットという最大容量の情報を伝達することには、いずれも成功しているということになります。

ちなみに論文著者は、この上限は、耳が聞き取れていないということではない。耳は聞くことができたとしても、聞いたことを処理し考えにかえていく能力(速度)に限界があり、毎秒39ビットという値になったと考えます。

逆の現象が観察されているツイート

最後に、今回のリサーチをしている間に、日本語の情報伝達についての、全く違う観点からの興味深い指摘もみつけたので、このことについても言及してみます。

それは、書き言葉としての日本語は、英語などほかの言語に比べ、非常に濃厚な情報伝達言語であるというものです。この指摘は、日本語とほかの言語でTwitterを使っている利用者たちからでていました。Twitterは、ご存知のように文字数に制限があるソーシャルメディアですが、英語やドイツ語に比べ、たくさんのことが短文でも表現できる。このため、日本語で「ツイート(つぶやく)」と、英語のつぶやいているものより、ずっと濃厚な内容になるのだ、と言われていました。その理由は、漢字という、意味を文字のなかに圧縮したような情報過密な表意文字であることが大きいようです。

わたしはTwitterをしていていないので、このことを実感しているわけではなく、また、この説が実証的な研究で証明されているのかもわかりませんが、もしこの指摘が正しいのだとすれば、音韻数で切るのでなく、書き言葉メディアとして文字数を制限して比べると、逆に、事情が反転し、情報伝達量が多くなる、というのは、妙で面白い話です。

おわりに

ところで、この一連の話、わたしにとっては大変おもしろかったので、ドイツ語圏で日本語を解さない知人何人かに、説明しようとしたのですが、ただちにそれは、かなりの難題であることがわかりました。

背景としてまず日本語の特徴を説明しようとすると、いちいち、わたしの説明に疑問がわいたり、つまずいてしまいます。尊敬語、謙譲語とはなにか。表意文字とは一体どんなものなのか。そもそも、そんなに同音異義語が多いなんて、あまりに非効率な言葉で使いにくいのではないのか、等々。

結局複数の人でためしてみましたが、うまく理解してもらえず、話はいつのまにか別のテーマに移っていってしまい、最後までこの話を説明しきることはできませんでした。

わたしたちホモ・サピエンスには、一定の時間に同量の情報伝達を処理する言語能力が備わっているらしいことが今回の論文でわかりました。一方、互いの言いたいことを伝えきって理解してもらうためには、そのような潜在的な情報処理能力だけでなく、説明力や、忍耐力、あるいは想像力といった別の要素が話者と聴者両側で不可欠で、それがないと、たとえ共通する潜在的な言語能力があっても、やはり伝わるものではないのだ、という事実を改めて思い知らされた気がします。

参考文献

Charisius, Hanno, Haben Sprachen ein universelles Tempolimit? In: Süddeutsche Zeitung, 6. September 2019, 13:52 Uhr

Coupé, Christophe/ Oh, Yoon/ Dediu, Dan/ Pellegrino François, Different languages, similar encoding efficiency: Comparable information rates across the human communicative niche. In: Science Advances 04 Sep 2019:Vol. 5, no. 9, eaaw2594 DOI: 10.1126/sciadv.aaw2594

Faster and slower languages convey information at similar rates, by CNRS, phys org, September 5, 2019

Haas, Lucian, Alle Sprachen kommunizieren gleich schnell, Deutschlandfunk, 5.9.2019.

Pellegrino, F., Coupé, C/ Marsico, E.(2011). A Cross-Language Perspective on SpeechInformation Rate.Language, 87, 539-558. Warum Italiener so schnell reden, Science, ORF.at, 6.9.2019.

///
世界大百科事典内の音節の言及(出典『平凡社世界大百科事典 第2版』)

穂鷹知美
ドイツ学術交流会(DAAD)留学生としてドイツ、ライプツィヒ大学留学。学習院大学人文科学研究科博士後期課程修了、博士(史学)。日本学術振興会特別研究員(環境文化史)を経て、2006年から、スイス、ヴィンタートゥア市 Winterthur 在住。
詳しいプロフィールはこちらをご覧ください。


PAGE TOP




MENU

CONTACT
HOME