2020/12/20

[052]「回文21面相」と回文の文字頻度

「ペッ」すんな、人に唾!
 罰にと非難すっぺ!
[ぺっすんなひとにつば 
   ばつにとひなんすっぺ]

回文は、「逆から読んでも同じ」という制約のために、ふつうの日本語とは違う特徴をいろいろもちますが、「かなの頻度」についてはどのような違いが表れるでしょうか。今回も、回文投稿サイト「回文21面相」の回文(2021年11月21日までに投稿された回文45462個)を分析し、回文のかな頻度がどのようになっているかを見てみます。

回文のかなの頻度

さっそくですが、調査した回文のかなの割合は以下のとおりです。話がややこしくならないように、緩和規則を使わない回文(いわゆる完全回文)36714個に限定してカウントしました。100000字中に何字出てくるかをグラフ化しています。

多いほうから順に、

い、か、ん、た、な、し、さ、く、だ、ま、……、ぇ、ぃ、ぁ、ぅ、ぢ、ゔ、ぉ、ゎ、ゐ、ゑ
となっています(「ゔ」以降はは頻度0)。

回文ならではの特徴がどのように表れているか知るために、普通の文章でのかな頻度と比較します。このサイト にあるデータ「N-gram_1gram.txt」を使わせていただき、グラフ化したのが以下のものです。

こちらは多い順に

い、う、ん、し、か、の、と、た、て、く、……、ぁ、ぬ、ぺ、ぉ、ゔ、ぢ、ぅ、ゎ、ゐ、ゑ
となっています(「ゎ」以降は頻度0)。

これらを対照したグラフが次のとおりです(頻度0のものは(両軸で対数をとっているという数学的都合により)除いてあります)。

斜めの線より上にあるものが、回文の制約のために登場しやすくなった文字、逆に下にあるのが、登場しにくくなった文字であると言えます。こう見ると、おおむね斜めの線の周辺に固まっているので、だいたい、通常文書で出てきやすい文字は回文でも出てきやすく、その逆も言える、ということになりそうです。

ただ、文字によっては一見して回文で出てきにくくなっているものがあり、典型的なのは小書きの文字(「ゃ」「っ」など)です。また、「を」「う」「て」なども斜めの線をやや下方に外れています。

逆に「よ」「ね」「ぬ」などは斜めの線を上方に外れており、普通の文章に比して回文に比較的出てきやすい文字、ということになります。「ぬ」は目立ちますね。普通の文章では「ぬ」はとても使われにくい文字ですが、回文ではその傾向が薄まるといえます。濁音・半濁音・小書き文字など特殊な文字を除けば、いちばん頻度が低い文字はむしろ「ゆ」です(緩和規則可という条件で調べても、やはり「ゆ」のほうが「ぬ」より出てきにくい)。三田たたみさん制作の、回文を使ったカードゲーム「ワタシ負ケマシタワ」では、「ぬ」を使った回文を作ると得点が高くなりますが、じつは高得点にすべきなのは「ゆ」なのかもしれません(笑)。


回文の文字頻度について、こういった傾向がなぜ出てくるのかについては、隣り合った2文字の頻度(バイグラム)を考察することである程度説明がつくのですが、それは次回に考察することにします。

回文の一文字めの頻度

回文の特徴がよりはっきりと表れるのが、一文字め(=最後の文字)の頻度です。通常文書での一文字めの頻度のデータは見つけられなかったのですが、以下の結果を見ると、比較するまでもなく明らかに「ふつうでない」ことがわかります(これも、緩和規則なしの回文だけに限定して調べた結果ですが、緩和規則可でもほぼ似たような結果になります)。

多い順に

か、よ、さ、い、だ、な、わ、し、た、き、……
となっています。テクニックを要する回文の両端の処理に関して、終助詞を回文の終端に置くとうまくいきやすい、ということは何度か述べてきましたが、このリストを見るとじっさいに終助詞になりうる文字がたくさん出てくることがわかります。なかでも「か」は、そもそも回文で使われやすいかなであるので(上記のとおり、頻度にして「い」に次いで2位でした)、ここでは1位となっているのでしょう。

逆に、一文字めに使われにくいかなはというと、小書きの文字や「ぢ」「づ」「ん」などが使われにくいのは当然として、それ以外には「ほ」「ぎ」「ざ」「べ」「ぽ」「ぷ」「ぴ」「ぺ」などがリストの後ろのほうに来ています。納得の結果ではあるでしょうか。

なんと「回文21面相」には「ぺ」で始まる回文が一つもなく(正確には一つあるのですが偽回文になっています)、せっかくなので「ぺ」で始まるものを作ってみた(しかも終助詞としてそれを使ってみた)のが標記の回文でありました。


次回は、回文の文字頻度を考えるうえで重要な「バイグラム」について見ることにします。どうぞお楽しみに。

2 件のコメント:

  1. ペン持つモンペ

    「ぺ」で終わる言葉が少なすぎてつらい

    返信削除
    返信
    1. そうなんですよね。どうしてもモンペとかカンペとかになってしまいます。それを回避して作ってみたつもり。

      削除