ideagram

(心に浮かんだ)「考え」を書いたもの。

「サラリーマン川柳」をテキストマイニングしてみた。(試論)

毎年、哀愁ただようおじさんの姿を思い起こさせる悲哀の文芸コンクール「サラリーマン川柳」。今年もそろそろ募集が開始する時期です。

優秀作品には、その年のホットなキーワードが詠み込まれることが多い印象がありますので、入選する歌の17文字を予想してみます。

 

サラリーマン川柳を分析(テキストマイニング)してみた

まずは、先人たちの詠んだ歌について、過去の傾向を調べてみようと思い、

サラリーマン川柳の過去作品をテキストマイニングしてみました。

テキストマイニングとは、文章の中に含まれる言葉を品詞に分解することで、特徴的なキーワードを抽出して、そのキーワード間の関係性を見ることができる分析です。

たとえば、「我輩は可愛い猫である。名前はまだ無い。」という一文を品詞に分解すると、「我輩(名詞)/は(助詞)/可愛い(形容詞)/猫(名詞)/で(助動詞)/ある。(助動詞)/名前(名詞)/は(助詞)/まだ(副詞)/無い(形容詞)。」といった感じになります。

最近では、SNS分析などマーケティングでも使われる手法ですので、わかりやすく解説しているサイトも数多くあるかと思います。詳しくはそちらをご確認ください。

 

さて、サラリーマン川柳の分析に話を戻しましょう。

今回は、インターネット上を漁って見つけた、第4回〜第25回の上位10作品を分析対象とします。

サラリーマン川柳の公式Webサイト(サラリーマン川柳|第一生命保険株式会社

上では、歴代1位作品と昨年の1位〜100位の川柳を確認できます。)

 

分析に使うツールとしては、ユーザーローカルさんがWebで提供している分析ツールを使用しました。フリーのテキストマイニングツールにはKH Coderなど、より細かい分析ができるソフトもありますので、もうちょっと調べてみたくなったら使ってみようかと思います。(今回は、あくまでも試論なので。。お手軽さを取りました。)

 

ちなみに、分析結果は以下のURLで確認できます。

http://textmining.userlocal.jp/home/result/f9dda67eb20901822c4fd412878d62a8

 

よく出てくる「名詞」:家庭と会社の間、課長と部下の間。

サラリーマン川柳の中に読まれている名詞の頻出単語を以下の表1に示します。

  

 表1:頻出単語の一覧

f:id:ideagram:20161106192104p:plain

 

表中のスコアは、文章の中に出てくる特徴的な単語の度合いを示しています。ユーザーローカルのHPに以下のような説明が出ています。

【スコアとは?】

単語ごとに表示されている「スコア」の大きさは、与えられた文書の中でその単語がどれだけ特徴的であるかを表しています。通常はその単語の出現回数が多いほどスコアが高くなりますが、「言う」や「思う」など、どのような種類の文書にも現れやすいような単語についてはスコアが低めになります。

 なお、出現頻度は出現回数です。

 

スコアを見ると、「リストラ」「課長」が4.89という数値を示しており、他の単語と比べて圧倒的に特徴的なキーワードとなっています。また、「女房」が2.8 というスコアで続いています。

 なお、出現頻度は「仕事」「上司」が6回、「ダイエット」「オレ」「ボーナス」が5回となっています。(個人的には「便座」が気になります。)

 こうして頻出の名詞を眺めてみると、「仕事」での「上司」とのやり取りに悩む「オレ」や、「ダイエット」や「ボーナス」を要求してくる「女房」の姿を詠んだ川柳が多いのでしょうか。
 家庭と会社のはざまで苦しむ、中間管理職のお父さんの後ろ姿が目に浮かびます、、。

f:id:ideagram:20161106203042p:plain

(画像提供:かわいいフリー素材集 いらすとや

 

よく出てくる「動詞」:コミュニケーションは難しいよ

続いて、頻出の動詞を、以下の表2に示します。

 

表2:頻出動詞の一覧

f:id:ideagram:20161106192110p:plain

 

特徴の度合いを示すスコアを見てみると「やせる」「はずす」「ことわる」の数値が高くなっていることがわかります。

頻出単語としては「言う」「聞く」が圧倒的に多くなっています。言ったり、聞いたり、世のサラリーマンはコミュニケーションに関連する歌を詠んでいるのでしょうか。

似ている単語のつながりを見てみましょう。共起ネットワーク図で示したものが以下の図1になります。単語の出現パターンが似たものを結んでいます。線が太いほどパターンの共起の度合いが強くなります。

スコアと出現頻度が上位に来ている「減る」の共起ネットワーク図を以下の図1に示します。

「減る」と出現パターンが近い単語は・・・

 

図1:「減る」の共起ネットワーク図

f:id:ideagram:20161106192122p:plain

「仕事」「ボーナス」「給料」。

あぁぁ。。

f:id:ideagram:20161106210951p:plain

 

よく出てくる「形容詞」:意外と明るい?

さて、気を取り直して、形容詞を見てみましょう。

頻出形容詞の一覧を以下の表3に示します。

 

f:id:ideagram:20161106192154p:plain

一部、「憎たらしい」「腹黒い」といったブラックな一面も特徴を示しておりますが、「あたたかい」「いい」といった単語がみられます。少しほっとしました。日本のサラリーマンにも明るいきざしです。

「あたたかい」。何があたたかいのでしょうか。 心か。家庭か。

毎日毎日、辛い憂き目にあっているのかもしれない

日本のサラリーマンの皆様のハッピーなひと時が垣間見えた気がします! 

 

f:id:ideagram:20161106192118p:plain

 「便座」かよ!

 

 

おわり。

 

---- 以下、今年度の予想 ----

ポケモンGO

・会社でも  家でも俺は  ノケモンGO

スマホ

・妻スマホ  家でもひとり  俺スマホ

 

 以下、思いついたら追加していきます。。