Google Blog Search Launched

いやあ、びっくりしましたね。Google Blog Search が何の予告もなく突如ローンチ。Google Maps のときもそうだったけど、Google の新サービスリリースにはいつも驚かされます。

g_bsrch_logo.gif

さて、何をどういう風にインデクシングしているかといった気になる点ですが、About Google Blog Search に結構詳しく書いてあります。

要点としては

  • RSSAtom などのフィードをベースにしている
  • Weblogs.com あたりに ping を飛ばしててフィードを吐いてる blog を集めている
    • Google のことだからアンカーもたどっているかもしれないけど、それは明記されていない
  • いまのところ 2005年6月以降の記事がインデクシングされている

といったことが書かれているところでしょうか。検索のインデックスにフィードそのものに含まれる文章が使われてるのか、記事の HTML までみているのかということは書いてないっぽいです。(フィードしか見てないようだったら、SEO な世界ではいずれ、Google Blog Search のために本文全開放がベター、という流れになるかもですね。)

あとソートはデフォルトは relevance だけど date でも可能で、かつフィードが配信されてるので未来検索もできます。フィードリーダーを使った自動エゴサーチもばっちりです。さようなら FeedBack (もう止まってるけど)。

しかし、今回の Google のサービス開始はサービスそのものについて以外にも、いろいろ考察として面白そうですね。先日 id:umedamocho

またYahooはFlickrを買ったし、Ask JeevesはBloglinesを買った。けれどGoogleは、そういう会社を買うことはたぶん一度も考えたことがないだろう。そんなもの、必要なら自分たちですぐに作れると思っているし(たぶん作っているだろうし)、そうすべきだと考えているに違いないからだ。だからGoogleTechnoratidel.icio.usを欲しいとは思わない。電通なら欲しいと思うかもしれない。そういうことだ。

なんてことを書いていたけど、まさにこの点あたり。彼の予想どおり Technorati 買収の件はこれで消えた、という感じ。(一方の"Hacker 欲しさに買収"ってことはありそうだけど。)

RSS をベースにしたサーチのサービスってのは、気づけば世の中山ほどあって、またその開発はそんなに難しいものではないです。難しい点は、記事に対する価値の重み付けのアルゴリズムと、システムそのもののスケーラビリティぐらい。そんなわけで、小さな会社から大きな会社までこぞって RSS サーチを作ってきたわけですが、そんなに簡単に作れるのに Google はなかなかそこに参入してきませんでした。この様子を見て「Google は HTML のサーチにこだわってるから、XML サーチには興味がないんじゃない?」なんて分析する人もいました。

RSSサーチ(blogサーチ)の世界では、Google がくる気配もないしということで、同じぐらいの規模のサービスが競争しあって少しずつビジネスの芽なんかも出てきた感じがありましたが、ここへ来て Google Blog Search が突然オープン。皮肉にも Ask Jeeves が、Bloglines と連携した blog 検索を発表したその日だったり。

よくよく考えてみれば、RSSサーチの要点になる価値の重み付けのアルゴリズムとスケーラビリティの確保ってのは、Google が世界で一番得意とするところなんですよね。なんとなく、「Google は来ない」「来るかもしれないけどまだ先」という温い空気が漂ってたところにそんな得意の兵器でガツンと一発です。

次に、ネット・ベンチャーの資金調達が苦しくなっているという指摘だ。シリコンバレーには投資資金は十分に余っているから、純粋にカネが足りないという問題ではない。ネット・ベンチャーがVCに行くと、

Why couldn't Google do what you're doing?

と聞かれてしまうと言う。実はこれが答に窮する厳しい質問になってしまったのだ。

「Why couldn't Google do what you're doing?」に対する決定的な答えが出せるかどうか、改めてそれを考えさせられる Google Blog 検索の到来でした。