ネタフローダイアグラムで分かるサイトの影響力

(いつもはよそのサイトについて言及するときは呼び捨てっぽくなるのを避けるために「なになにさんのどこそこ」といった感じに書いているのですが、今回は煩雑さを避けるために「なになにさんの」は省いています。ご了承ください)

今までのこの日記の記事の中で一番大きな反響があった「はてなユーザの困惑 キャプサイトの混乱」のリファラを元に「ネタフローダイアグラム」を作ってみました。以前から作ったら面白いのではないかと思っていたのです。

ネタフローダイアグラム

個人ニュースサイトの多くは「(ネタ元:どこそこ)」という具合にその情報をどのサイトから得たかを明記する「ネタ元表記」をしています。この図は、その「ネタ元表記」を手がかりに、ネタが拡散していく様子を図示したものです。

一つの楕円が一つのサイトを表します。矢印は、根本のサイトが先のサイトの「ネタ元」になっていることを表します。

この図の全体を見渡せばネタの流れが一目瞭然というわけです。これを「ネタの流れ図」ということで「ネタフローダイアグラム」と名付けましょう。

ここで、大本(おけぐわの日記)から近い順に「初代」「2代目」「3代目」……と呼ぶことにします。リファラが記録された順番から、「カトゆー家断絶」と「かーずSP戯れ言」を「初代」という扱いにしました(なお、他のネタ元表記をしていないサイトも「初代」の可能性があるのですが、いまいちはっきりしないのでこの図では除外してあります)。

さて、たくさんの矢印が出ているサイトが多くのサイトの「ネタ元」になっていますから、それだけ影響力の強いサイトだと見なすことができます。

意外なのは、「カトゆー家断絶」から1本も矢印が出ていない点です。ここを参照したサイトはことごとく「ネタ元表記」をしない流儀だったのでしょうか(あまり考えにくいことですが)。まあ、単に「カトゆー家断絶」では関連情報扱いだったからかも知れません。

「初代」で一番大きな影響力を持っているのは「かーずSP戯れ言」です。そこから「2代目」に向けてたくさんの矢印が出ていますが、その中で一番大きな影響力を持つのが「RinRin王国」です。「3代目」では「BOGARD La+」、「4代目」では「コンビネーションバラエティ」が大きな影響力を持っていると言えます。

面白いのは各世代に一つずつしか大きな影響力を持っているサイトがないことです。これが偶然なのかそういうものなのかはよく分かりません。また、それぞれのサイトが「何代目」になるかも、ネタによって変わってくるはずです。

ネタフローダイアグラムが自動で描けるならば、話題になったあらゆる記事のダイアグラムを描くことでそういったことが分析できそうです。

──が、この図を自動で書くのはちょっと大変です。サイト同士の関係だけ分かっていれば、図を書くこと自体はGraphvizというソフトを使えば自動なのですが(この図もそれを使っています)、ネタ元の表記の仕方が各サイトにより様々なのでちょっとやっかいです。恐らく、サイト毎にパーザ(解析ツール)を作る必要があると思われます。

まあ、できなくはないと思うので誰かがやってくれないかな、なんて思うわけです。

以下、参照ドキュメント。

たった1行のネタだって、それを見つけてきた「功労者」がいるんデスよ。

2002-06-29の記事。ネタ元表記しないのはどうよ、という話。テキストサイト界隈で話題になったようです。

ネタの流れ

2002-11-02の記事。やはりネタ元表記についての話なんですが、特に問題提起というわけではなく「面白いなあ」という話。

「個人ニュースサイト相関図」について

ネタフローダイアグラムに似てるけど、ちょっと違います。いまはCGIがエラーになるようです。切ない。

個人ニュースサイトとblogと「情報元:○○○」

比較的最近の記事。海外のblogとの比較。なお、リンク切れになってる記事は人気ウェブログは頻繁に「無断引用」――ウェブログ間の情報の流れを解析の方にあります。