↓の記事に触発されて、アイカツのpxiv小説のタグでのネットワークを作ってみました。
pixivのタブ頻度から考えるラブライブのカップリング - 驚異のアニヲタ社会復帰への道
ずっと何かネット上にあるデータやAPIで面白い解析ができたらいいなーって思っていてたのですが、どれもテキストマイニングとか難しいこと(特に文字コードの扱いがよく分からなかった)をやっていたので諦めていました。
しかし、↑の『pixivのタブ頻度から考えるラブライブのカップリング』では、pixivのタグを使って分析しているため、そんな前処理は必要ありません。「あ、これなら自分にもできるかも!」と思ってやってみました。
なんといってもプログラムのコードややり方を公開してらっしゃいますし。
それで出来上がったのがコレ。
※元の記事ではRのigraphというパッケージでネットワークを描いていますが、これはGephiというフリーソフトを使っています。日本語のラベルを付ける方法が分からず英語だったり、葵ちゃんの文字が思いっきり重なったりしてたりしますが面倒なのでご容赦ください。
元の記事では百合カップリングの「にこまき」でネットワークの枝を定義していますが、私は同じ小説に「星宮いちご」「紫吹蘭」のタグが付いていればその間の枝の重さを+1する、というふうに定義しました。というか主に女の子向けのアニメのためか、そういう書き方は「いちあお」以外あまりありませんでした。ふつうに男キャラの涼川さん(NAOTO)も登場しますし。
それで、やってみた結果なんですが、やはりラブライブに比べてデータ数(投稿数)が少なく、それほど良い結果は出てきませんでした。いちごちゃんと葵ちゃんが他のキャラに比べて強く結ばっている(穏やかじゃない話を書きやすいのでしょうか)、いちごと涼川さんのふつうの恋愛ストーリーも多いようだ、くらいしか言えそうにないですね。
↓が各キャラのタグの数なのですが、ジョニー別府先生や、最近登場した一ノ瀬かえでちゃんとか全然出てきませんでした。(両方とも良いキャラなので残念です…)タグ数の少ないキャラは他のキャラと繋がってませんし。
今気づいたのですが、織姫学園長を集計に入れるのを忘れてました。スターライト学園の方はスミマセン。あとなぜか間違えてプリキュアのキャラクターの九条ひかりちゃんを入れてしまってました。
ついでにネットワークを作るのに使った行列も載せておきましょう。なんかはみ出してますが。
本当は投稿日のデータも使って、「アニメのストーリー上でトライスターやSTAR☆ANIS結成前後にネットワークが変化したのか」を調べてみたかったのですが、ちょっと無理でした。例えば「美月ちゃんとユリカちゃんが同じチームで仲良くなった」という設定で強く結ばったとかありそうだなーとか考えてたんですが。
というかタグを使うのなら、小説じゃなくてイラストのデータでやったほうが良かったのかもしれませんね。時間があればそっちでも試してみます。
なんでこんな分析をしたのかーというと、音楽や音楽リスナーについてもデータを使って客観的に分析できるんじゃないかと思ったからです。
「電波ソングファンは古いリスナーと新しいリスナーで聞いてる曲が違うんじゃないか」と思っているのですが、例えばそれをちゃんと分析できたら面白いんじゃないかと。そのやり方も一応考えていて、last.fmのAPIを叩いてdenpaタグのデータを取ってきて、↑と同じようにネットワークを描き、コミュニティ分割してみよう(いずれ)と思っています。
そのためのRのプログラム練習も兼ねていたのですが、よくわからないコードが多かったのでExcelとかめっちゃつかって完成までこぎつけた、という感じなのでまだまだ…。last.fmのAPIのほうも英語なので使い方がよく分からず、似たようなことやってる記事を探してもフランス語しかない状況なので時間があればって感じですね。
こちらの記事にあるネットワークを見ると非常に面白く、例えばヘヴィーメタルのサブジャンルの中でもthrash metalやdeath metalなどの激しいジャンルと、power metalやprogressive metalなど比較的聞きやすいジャンルにハッキリ分かれています。こういう分析を自分でもやってみたいです。
追記 - pixivイラストタグでもネットワークを描いてみました
こちらにpixivのイラストのAPIが載っていたのでやってみました。
進撃の巨人を読んだことない人がデータだけでキャラを推測してみる - あんちべ!
イラストのほうが投稿者が多いのでデータがたくさん…と思ったら直近200個しか(なぜか)取れませんでした。もし古いデータもごっそり取れたら、アニメのストーリーに応じてネットワークがどう変化していくか見れたんですけどね…。ついでにGephiの使い方がわかってきたので、タグの数が大きい頂点を大きくしたり色を濃くしたりしてみました。
アイカツキャラのタグ数ランキング。コレに応じて↑のネットワークの大きさとか色とかを変えてます。Rの勉強してたはずなのに、ほとんどExcelで集計してしまいました…。