「余談:カラマゾフの兄弟(上)日本語テキストにおける文字の出現頻度調査」


 <参考にした知人のページ>
 
   ・rubyを使って、日本語テキスト内の文字の出現頻度の調査
   ・調査結果の例「カラマゾフの兄弟(上)、ドストエーフスキイ, 中山省三郎訳」
 
 <上記ページに基づく私のコメント2件、2024.2>
 
 ●多いのではないかと推測した漢字が、20〜40番にありました。
 
 【順位】【漢字】【頻度】
  23.   長  491 //長老が出てくる有名な場面あり
  28.   老  414 // 同上(「長老」の出現頻度は294)
  31.   神  390 //主人公は信仰心が強い
  37.   兄  327 //主人公には二人の兄がいる
  42.   父  311 //父殺しがサブテーマ?
 
 ●主人公の「アリョーシャ」の出現頻度は「630」
 
  個別の頻度もトップ10以内:
 【順位】【カナ】【頻度】
   6.  ア    997
   1.  リ   1584
   3.  ョ   1130
   4.  シ   1072
   7.  ャ    931
 
 以上