Tweet内容の変遷をワードクラウドで追ってみる

TwitterのTLなんてもう数年前にほぼ完成していて、自分から大きく変えにいったりはしていないつもりなんだけどTLの内容は結構変わっているように感じる。政治的な内容が増えたりとか。これはフォローしている人の加齢に伴い呟く話題も変遷しているのではないかと思ったけど、それを言ったら自分のTweetも変わっているのではなかろうか、と思って表題。

上記サイトを参考にPythonTweetに含まれる単語を抽出してワードクラウドを書いてみました。過去のTweetTwitterからCSV形式でダウンロードして、指定した年のTweetのみをWordCloudに突っ込んで図にしてみた。

結果

2007年の結果

f:id:wata_d:20190211230108p:plain

2018年の結果

f:id:wata_d:20190211230126p:plain

Twitter登録直後は特に呟くこともなく、ライフログ的な使い方もしていたので「出社」がやたら多い。9年の間にそういう呟きはあまりしなくなっていって、直近ではほとんどなくなっている。最近は病気になったのが大きいな、と感じる。あと将棋。NHKとか朝日新聞はニュースサイトの記事をブックマークすることも多いのでその絡み。

さすがにワードクラウドだけでは属性の変化とかはあまりわからないなぁ。

再頻出ワードは出社→DQ(2010年頃、DQ10結構やってた)→将棋(電王戦あたりではまる)→透析→将棋みたいな遷移。bioにプログラマって書いてるけど、ただの病人将棋オタクみたいだ(笑)。

f:id:wata_d:20190211230528g:plain

ソース

https://gist.github.com/hwada/e968c7bf23898cfdee0ae08ca3a7d5a0

janome, wordcloud, matplotlibをpip installで入れています。