「○○のシェア」はあてにならない

そう言えば以前、Movable Typeの開発が日本主導になると発表があったとき、「アメリカでWordPressにシェアを奪われたので日本市場で生き残りをかけるらしい」という噂を聞きました(あくまで噂です)。実際、アメリカにおけるブログツールのシェアは現在、WordPressがトップだそうで、その理由は他のツールからのインポート機能が充実しているからだそうで。逆にMovable Typeはエクスポート機能が充実しているそうで、それがアダになっている%

たださんがアメリカで WordPress のシェアがトップ、という話にちらりと触れているけど、確かに以前より WordPress な blog をよく見るようになったとは言えにわかには信じ難い。おそらくたださんもそんな感じだろうので「あくまで噂」と強調しているのだと思います。

気になったので、ちょっと調べてみることにしました。

Movable TypeWordPress もフィードの中に generator としてツールの URI が入ってるので、Weblogs.com の changes.xml とかから blog の URI を拾って、Auto-Discovery をかけてフィードを拾い generator の数を計算してみるテスト。

#!/usr/local/bin/perl
use strict;
use warnings;
use URI;
use XML::Feed;
use XML::Simple;

my $xml = shift;
my $updates = XML::Simple->new->XMLin(
    $xml,
    KeyAttr => 'weblog',
    ForceArray => 1
);

handle_url($_->{url}) for @{$updates->{weblog}};

sub handle_url {
    my $url = shift;
    if (my @feeds = XML::Feed->find_feeds($url)) {
	my $feed = XML::Feed->parse(URI->new($feeds[0]))
	    or warn XML::Feed->errstr;
	print $feed->generator, "\n" if $feed;
    }
}

これの結果をリダイレクトで別ファイルに書き出して grep "movabletype" | wc -l とかで調べれば ok という段取り...と、ここまで用意したけど Weblogs.com の changes.xml がいまおかしいので実行できませんでした。ぐむ。

で、ping を元に計算するのがどれぐらい信憑性があるかと思ったときに、ツールがデフォルトで ping を飛ばすかとか、エントリーが更新される頻度によってもだいぶ差がでるわけで。スパム blog が多いかどうかも関係してくる。しかも今みたら Movable Type はデフォルトでは weblogs.com に ping を飛ばしてない。(昔はデフォルトだったような) これじゃ参考にもならないかもですね。

ところで、社会人になって、同業者との競争の中で仕事をするようになって学んだことのひとつが「シェア一位」というのがほとんどあてにならない、ということかもしれません。「全米 No.1 ヒット」があてにならん、と同じぐらいのレベルで。調べてみるとか言っておいてなんですが。

以前にソニーの香水瓶ウォークマンiPod Shuffle のシェアを抜いたとかニュースになって、違和感を感じたひとたちがそのカラクリを色々調べてたことがありましたが、あんな感じでデータの見方ひとつでシェアなんてものはどうにでも言い換えることができます。

ちょっと前には、livedoor Blog のシェアが数ヶ月で半分になったとか、そんな話もありました。結果は、集計をしてる側が、livedoor Blog の新着記事から計算していたものの、その新着記事の livedoor 側の自動化の処理が少し滞っていたとかで、それに引きずられてそういうデータが出てしまっただけのことでした。

シェアというのはある程度、その製品の良し悪しを測る物差しにはなるかもしれませんが、「シェア一位!」とか自分で言ったりする場合は、だいたいデータをいいように解釈してるだけだったりすることがほとんどだし、あてにならんと思っておいたほうが懸命だと思います。(なので、この WordPressMovable Type の件も、僕はちょっと疑った目で見ています。)

それよりも、どうやってそういうデータを出すことができるかに着目して、いろんな角度からその傾向を探ってみるという方が有益でしょうね。

そういえば、Weblogs.com の仕様を見てたらフィードのURIが載ってる版の changes.xml も新しく配信しているみたい。こっちもいまはちゃんと動いてなかったけど。