第3回マリカにじさんじ杯のコメント傾向の変化を探る

はじめに

f:id:viola_voila:20201231202429j:plain
viola-voila.hatenablog.com

去年に引き続きマリカにじさんじ杯の予選参加者の配信コメントをスクレイピングしてKHコーダーを利用した分析をしました。

データセット

参加者のうち、配信のアーカイブでコメントが取得できるメンバー79名のコメントをスクレイピングし、サンプリング(5万件)したもの。
(前回は全コメントを分析していましたが、今回全コメントにすると50万件くらいになって負荷が高すぎるのでサンプリングしました)

えま★おうがすと(2回のみ)
える
でびでび・でびる(3回のみ)
アルス・アルマル
アンジュ・カトリーナ
イブラヒム(3回のみ)
エクス・アルビオ
エリー・コニファー
グウェル・オス・ガール
シェリン・バーガンディ
シスター・クレア
ジョー・力一(3回のみ)
ニュイ・ソシエール(3回のみ)
フミ
フレン・E・ルスタリオ(3回のみ)
ベルモンド・バンデラス
ラトナ・プティ
リゼ・ヘルエス
ルイス・キャミー(3回のみ)
レヴィ・エリファ
愛園愛美
安土桃(3回のみ)
卯月コウ
家長むぎ(3回のみ)
葛葉
空星きらめ(3回のみ)
郡道美玲
月ノ美兎
健屋花那(3回のみ)
剣持刀也
弦月藤士郎(3回のみ)
甲斐田晴(3回のみ)
黒井しば
桜凛月
笹木咲(3回のみ)
三枝明那
山神カルタ
社築
渋谷ハジメ(3回のみ)
出雲霞(2回のみ)
春崎エアル
小野町春香(3回のみ)
神田笑一
瀬戸美夜子(2回のみ)
成瀬鳴
星川サラ
雪城眞尋
早瀬走(3回のみ)
相羽ういは
鷹宮リオン(3回のみ)
朝日南アカネ(3回のみ)
町田ちま(3回のみ)
長尾景(3回のみ)
椎名唯華
天宮こころ
東堂コハク(3回のみ)
童田明治(2回のみ)
奈羅花(3回のみ)
白雪巴
飛鳥ひな
樋口楓
不破湊
舞元啓介
伏見ガク(3回のみ)
物述有栖(2回のみ)
文野環(3回のみ)
北小路ヒスイ(3回のみ)
本間ひまわり
魔界ノりりむ
魔使マオ
夢追翔(3回のみ)
夜見れな
夕陽リリ
葉加瀬冬雪
葉山舞鈴(2回のみ)
来栖夏芽(3回のみ)
鈴鹿詩子
鈴谷アキ
鈴木勝

共起ネットワーク

共起ネットワークとは文章の中で「どんな単語がどんな単語と一緒によく使われていたのか」を表すものです。

まず、全コメントの共起ネットワークを見てみると図1のようになります。

f:id:viola_voila:20201231203633p:plain
図1.第3回にじさんじマリカ杯、全コメントにおける共起ネットワーク
f:id:viola_voila:20191227172703p:plain
図2.第2回にじさんじマリカ杯、全コメントにおける共起ネットワーク

円の大きさが単語の出現率で線で繋がっている単語がよく一緒に使われる単語です。
昨年と比較しても大きく傾向は変わっていません。


ここから各ライバーの特徴を見てみたいのでコメントにライバーを紐づけた共起ネットワークを確認してみます。

f:id:viola_voila:20201231204445p:plain
図3.各ライバーを外部変数とした共起ネットワーク(第3回)

上記のコメントがどのライバーに紐づいているのかが分かるようになりましたが、あまりこちらもよく分からない&変化が見にくいですね。

コーディング

共起ネットワークから気になった単語をピックアップしてコードとして分析していきます。

コードとは複数の単語をまとめて一つの分析対象としたものです。

例えば上の共起ネットワークで目立っている「w」のような笑いをコードとして分析することでどのライバーの配信で笑いが多かったかが分かります。

f:id:viola_voila:20201231204715p:plain
図4.各ライバー毎の「草」コメント率

今回は「草」というコードとして「草」、「w」、「笹」という単語の含まれたコメントの割合を分析しました。

***草
剣持刀也(第2回) 27.27%
瀬戸美夜子(第2回) 26.92%
樋口楓(第2回) 26.61%
グウェル・オス・ガール(第3回) 26.32%
夕陽リリ(第2回) 22.99%
小野町春香(第3回) 22.73%
シェリン・バーガンディ(第2回) 21.64%
三枝明那(第2回) 19.37%
える(第3回) 18.11%
弦月藤士郎(第3回) 17.37%

サンプリングしているので割合は絶対的なものではありませんが、どのライバーが笑いをとっていたのかが一目瞭然です。

第3回で1番コメント欄で草が生えていたグウェルさんの共起ネットワークは以下のようになりました。

f:id:viola_voila:20201231211151p:plain
図5.グウェル(第3回)コメント欄の共起ネットワーク
応援

続いて「応援」というコードで分析してみました。

対象の単語は「頑張る」「ファイト」「いける」「応援」「行ける」「勝てる」「がんばえ」です。

f:id:viola_voila:20201231205912p:plain
図6.各ライバー毎の「応援」コメント率
***応援
白雪巴(第3回) 19.05%
フミ(第3回) 16.10%
夢追翔(第3回) 14.80%
春崎エアル(第3回) 14.60%
鈴木勝(第2回) 13.29%
朝日南アカネ(第3回) 12.75%
飛鳥ひな(第2回) 12.50%
空星きらめ(第3回) 12.43%
白雪巴(第2回) 11.61%
出雲霞(第2回) 11.37%

応援が多かったのは上記ライバー達です。巴さんやフミ様、王子が多くの応援を集めています。

巴さんの共起ネットワークはこんな感じ。

f:id:viola_voila:20201231212318p:plain
図7.白雪巴(第3回)コメント欄の共起ネットワーク
お疲れ様/おめでとう

続いては「お疲れ様」と「おめでとう」の2つのコードを見てみます。

「お疲れ様」は「おつ」「お疲れ様」、「おめでとう」は「おめでとう」のみです。

f:id:viola_voila:20201231212811p:plain
図8.各ライバー毎の「お疲れ様」・「おめでとう」コメント率
***お疲れ様
飛鳥ひな(第3回) 11.86%
夜見れな(第2回) 7.65%
レヴィ・エリファ(第3回) 6.35%
グウェル・オス・ガール(第2回) 6.11%
白雪巴(第2回) 5.95%
夜見れな(第3回) 5.93%
夢追翔(第3回) 5.83%
シスター・クレア(第2回) 5.76%
エリー・コニファー(第2回) 5.29%
天宮こころ(第2回) 4.65%
***おめでとう
成瀬鳴(第3回) 6.67%
愛園愛美(第2回) 6.51%
黒井しば(第2回) 6.45%
安土桃(第3回) 6.15%
愛園愛美(第3回) 5.00%
白雪巴(第3回) 4.76%
天宮こころ(第3回) 4.65%
伏見ガク(第3回) 4.44%
家長むぎ(第3回) 4.44%
フミ(第3回) 3.75%

ここから先は去年使ったコードをおさらい。

褒め

「ナイスゥ」「上手い」「いいね」「えらい」「凄い」「良い」「よし」といった褒め言葉をまとめました。

f:id:viola_voila:20201231213113p:plain
図9.各ライバー毎の「褒め」コメント率
***褒め
安土桃(第3回) 20.00%
来栖夏芽(第3回) 12.90%
家長むぎ(第3回) 10.00%
葛葉(第3回) 9.85%
北小路ヒスイ(第3回) 9.49%
成瀬鳴(第2回) 7.52%
葉山舞鈴(第2回) 7.28%
シェリン・バーガンディ(第3回) 7.21%
樋口楓(第3回) 7.03%
鈴鹿詩子(第2回) 6.97%
叫び

「叫び」(「おおおおお!!!」「ああああ!」等)

f:id:viola_voila:20201231214828p:plain
図10.各ライバー毎の「叫び」コメント率
***叫び
奈羅花(第3回) 10.13%
フミ(第3回) 5.99%
健屋花那(第3回) 5.38%
黒井しば(第2回) 4.84%
卯月コウ(第2回) 4.74%
鈴木勝(第3回) 4.30%
愛園愛美(第2回) 4.19%
ラトナ・プティ(第2回) 4.13%
白雪巴(第3回) 3.81%
鈴鹿詩子(第2回) 3.60%
助かる
f:id:viola_voila:20201231214957p:plain
図11.各ライバー毎の「助かる」コメント率
***助かる
東堂コハク(第3回) 2.75%
夜見れな(第2回) 1.76%
春崎エアル(第2回) 1.65%
夕陽リリ(第3回) 1.56%
雪城眞尋(第2回) 1.39%
エリー・コニファー(第2回) 1.32%
社築(第3回) 1.29%
奈羅花(第3回) 1.27%
空星きらめ(第3回) 1.13%
黒井しば(第3回) 1.10%


ここら辺は割合が低いものをサンプリングしているのであまり当てにならないですね……



対応分析

さてコードを使って色々とライバーの特徴を見てきましたが、各ライバーを分類したいとなったときにコードだけでは難しいです。そこで対応分析を利用します。

対応分析とは各ライバーに特徴的なコードを散布図として表したものです。

f:id:viola_voila:20201231215221p:plain
図12.コードを用いた各ライバーの対応分析

中央の(0,0)に近いほど特徴的ではなく、全体的に使われていたコードになります。

本選出場者が多い上の方には「おめでとう」が、反対側の下の方には「お疲れ様」「可愛い」といったコードが出ています。

また、「草」といったコードが右側、それ以外のコードが左側と別れています。


昨年はこれらのコードをもとにライバーを3タイプに分類しました。

ライバー分類
ここからライバーを3種類に分類すると

中央右側、「草」のコードが特徴的な芸人気質ライバー
左下側、「かわいい」のコードが特徴的なアイドル的ライバー
左上側、「おめでとう」のコードが特徴的なゲーマーライバー
の3つに分類できるのかなと思います。


今年はコードの出現率をベクトルとして第2回と第3回のユークリッド距離を求めて距離が遠い=第2回から第3回でコメントの傾向が変わったライバーに注目したいと思います。

**ライバー名 **距離
フミ 0.206
剣持刀也 0.193
グウェル・オス・ガール 0.184
シスター・クレア 0.151
夕陽リリ 0.145
樋口楓 0.142
飛鳥ひな 0.138
雪城眞尋 0.129
葉加瀬冬雪 0.119
黒井しば 0.113

ベクトル距離のトップ10は上記ライバー達です。
上位4名を先程の対応分析の表で見比べてみましょう。


フミ
f:id:viola_voila:20201231215621p:plain
図13.フミのコメント傾向の変化

第2回では右下の芸人エリアに属していたフミ様が今回は上部のゲーマーライバーの領域に移動しています。
この動きは後述する剣持さんも同じなのですが、剣持さんは元々ゲームが上手いが芸人扱いされていたのに対して、フミ様はゲームが元々得意ではないが練習を重ねる姿からこのようにコメント傾向が変化したと考えられる。


剣持刀也
f:id:viola_voila:20201231220027p:plain
図14.剣持刀也のコメント傾向の変化

前述したとおり剣持さんも芸人エリアからゲーマーライバーエリアへ移動している。これに関しては本来の実力がきちんと評価されたというのが正しいだろう。


グウェル・オス・ガール
f:id:viola_voila:20201231220158p:plain
図15.グウェル・オス・ガールのコメント傾向の変化

前回は原点付近で特に目立つコメントの傾向がなかったが、芸人エリアへ移動。第3回トップの草率だったのでその変化は大きい。

シスター・クレア
f:id:viola_voila:20201231220349p:plain
図16.シスター・クレアのコメント傾向の変化

クレアさんは可愛いアイドルライバーエリアから芸人エリアへ近づいています。ちくわ大明神。


ちなみに変化が少なかった上位はこんな感じ。

**ライバー名 **距離
エクス・アルビオ 0.017
社築 0.030
リゼ・ヘルエス 0.030
卯月コウ 0.037
星川サラ 0.040
神田笑一 0.043
エリー・コニファー 0.045
山神カルタ 0.047
相羽ういは 0.050
舞元啓介 0.052
まとめ

というわけで今年は去年のコメントと比較して変化が大きかったライバーに着目してみました。
フミ様の変化とかが上手くデータで出ていたのは面白かったですね。

推しのチャンネル登録してください。
www.youtube.com