2008-01-01から1年間の記事一覧

Kikker の学習の仕組みと Rocchio アルゴリズム

先日のソーシャルブックマーク研究会では id:kanbayashi さんによる発表がありました。id:kanbayashi さんは Kikker や はてブまわりのひと などの開発をされている方です。最近情報検索理論に入門した自分にとっては、非常に面白い発表でした。発表の中で K…

Introduction to Information Retrieval #9 の復習資料

Introduction to Information Retrieval 輪読会 9章の復習資料を以下にアップロードしました。 http://bloghackers.net/~naoya/iir/ppt/iir_09.ppt 9章は、検索結果の適合性を改善するするための二つのアプローチ、Relevance Feedback (RF) とクエリ拡張につ…

はてなでインターンシップ

8月4日から8月29日までの一ヶ月弱、はてなでインターンシップを開催します。アプリケーション開発をテーマにしたインターンシップです。はてなの京都オフィスにて開催します。時給 1,000 円でお給料を支払います。遠方からの参加者の方には宿を弊社で手配し…

祇園祭 山鉾巡行

京都は御池通、祇園祭で賑わっています。今日はハイライトの山鉾巡行。オフィスから撮影。

はてなブックマークの関連エントリー機能開発、PFI さんとの合宿

はてなブックマークに関連エントリーを配信する機能を追加しました。詳しくは 告知日記で。この関連エントリーは、株式会社プリファードインフラストラクチャー (以下 PFI) の技術者のみなさんと一緒に開発しました。週末に2泊3日で京都で合宿をしてコア部分…

Introduction to Information Retrieval #8 の復習資料

Introduction to Information Retrieval 輪読会 8章の復習資料を以下にアップロードしました。 http://bloghackers.net/~naoya/iir/ppt/iir_08.ppt 8章は、検索結果の適合性を定量的に評価する指標の解説が主です。適合性判断のための最も基本的な指標である…

WEB+DB PRESS Vol.45 - Introduction to Moose

WEB+DB PRESS Vol.45作者: 荒木稔,能登信晴,Zev Blut,ミック,nanto_vi,武者晶紀,川崎修平,梅原宗士,田中正吾,黒田昌樹,米田健治,溝口妙子,小飼弾,岩下忠資,縣俊貴,大塚知洋,伊藤直也,田中洋一郎,山本陽平,下岡秀幸,高林哲,はまちや2,松信嘉範,角田直行,中山…

OSC 2008 Kansai in Kyoto

7/18・19の二日間、京都でオープンソースカンファレンスが開催されます。自分も一枠、スピーチ枠をいただきました。はてな創業当時からこれまでの間、バックエンドシステム、開発体制や開発環境がどのように変遷してきたかを紹介させていただければと思って…

Introduction to Information Retrieval #7 の復習資料

Introduction to Information Retrieval 輪読会 7章の復習資料を以下にアップロードしました。 http://bloghackers.net/~naoya/iir/ppt/iir_07.ppt 7章の前半は、6章に引き続きスコアリングの話題です。Vector space model での内積計算を真面目にやろうとす…

Introduction to Information Retrieval #6 の復習資料

Introduction to Information Retrieval の6章の復習資料を以下にアップロードしました。 http://bloghackers.net/~naoya/iir/ppt/iir_06.ppt 6章はスコアリング(重み付け)がテーマです。スコアリングの基本として、文章の属性毎に重みを与えてスコアを計算…

Kansai.pm での発表資料 (Hadoop Streaming で MapReduce)

Kansai.pm に参加しました。とても楽しかったです。自分も "Hadoop Streaming で MapReduce" という題目で発表しました。取り急ぎ、資料を以下に公開します。 http://bloghackers.net/~naoya/ppt/080530kansaipm.ppt MapReduce は Google のバックエンドで動…

補足: 新はてなブックマークと Flash の利用について

昨日のエントリのブックマークコメントで、Flash に関するコメントを幾つかいただきました。"JavaScript や Flash などのコードは現在のチームの他二名が担当しています。" と記載しましたが、今のところ Flash を使う予定はありません。募集しているエンジ…

はてなブックマークエンジニア、ディレクターを募集します

ご存じの方も多いとは思いますが、新はてなブックマークの開発を進めています。はてなブックマークをスクラッチから開発し直し、ユーザーインターフェイスや各種機能の見直しと更なる楽しさを追加してユーザーのみなさんにお届けするための企画/開発作業です…

インターフェイス指向設計

本を読むこととは、その本を読んだことに費やした時間の間、その書籍のテーマについて考えを巡らせることではないか、と近頃思います。本を読みながら集中して、ある特定のテーマについて考え続ける。本を読み終えた頃には、その思考の量的な価値が、自らの…

Introduction to Information Retrieval #5 の復習資料

Introduction to Information Retrieval の5章の復習資料を以下にアップロードしました。 http://bloghackers.net/~naoya/iir/ppt/iir_05.ppt 5章はインデックス圧縮がテーマです。辞書の圧縮と postings files の圧縮に対するそれぞれのアプローチについて…

YAPC::Asia 2008

YAPC::Asia 2008 に来ています。ただいま二日目、昼食休憩中です。YAPC::Asia も今年で3回目ですが、配布されているスケジュールの冊子や会場案内の立て看板、全体の進行など...どこを見てもそのクオリティが年々上がっているように感じます。今年は昼食が無…

Introduction to DBIx::MoCo

YAPC::Asia 2008 で OR マッパの DBIx::MoCo について発表しました。DBIx::MoCo は最近のはてなのサービスで利用しているバックエンドのソフトウェアで、Ruby 風のリスト操作や memcached による透過的なキャッシュなどをサポートしています。 http://blogha…

Hadoop Streaming

id:naoya:20080511:1210506301 のエントリのコメント欄で kzk さんに教えていただいた Hadoop Streaming を試しています。Hadoop はオープンソースの MapReduce + 分散ファイルシステムです。Java で作られています。Yahoo! Inc のバックエンドや、Facebook…

MapReduce

"MapReduce" は Google のバックエンドで利用されている並列計算システムです。検索エンジンのインデックス作成をはじめとする、大規模な入力データに対するバッチ処理を想定して作られたシステムです。MapReduce の面白いところは、map() と reduce() とい…

LWP::UserAgent + POE::Filter::Line で行ベース処理

#!/usr/bin/env perl use strict; use warnings; use LWP::UserAgent; use POE::Filter::Line; my $filter = POE::Filter::Line->new; my $ua = LWP::UserAgent->new; ## POE::Filter::Line で $chunk を行入力に変換 $ua->get( 'http://d.hatena.ne.jp/naoy…

Introduction to Information Retrieval #4 の復習資料

Introduction to Information Retrieval の4章の復習資料を以下にアップロードしました。 http://bloghackers.net/~naoya/iir/ppt/iir_04.ppt 4章はインデックス構築に関するアルゴリズムなどがテーマです。前半では単一マシン上で二次記憶装置を使ったイン…

勉強、学ぶ

先週、サポートのアルバイトスタッフと、プログラミングの話題になった。プログラミングを勉強している、とのことだった。もちろん、自分は「それを続けると良いと思う」ということを言った。少し前の自分だったら「プログラミングの勉強を続けると良いと思…

Perl のリスト操作を Ruby 風に

Perl の言語組み込みのリスト操作は関数形式で、push(@array, 1, 2) のような記述になります。一つのリストに対して複数の操作をしたい場合などは、関数呼び出しを複数行にわたって書いていくことになり、少々面倒です。しかし Perl は、Perl のリスト実装で…

私信: MSNメッセンジャーからの 1fp9.info ドメインのメッセージについて

昨晩に自分の MSN メッセンジャーアカウント (es*** at ...) をメンバーリストに加えていただいている方に、"1fp9.info" ドメインの URL が送信されているかと思います。当該 URL はメッセンジャーアカウントのアカウント/パスワードを収集する悪質なサイト…

MySQL Enterprise の今後についてのニュース

カリフォルニアで MySQL カンファレンスが開催されて、その中で Sun に買収された以降の MySQL の今後の方針についてアナウンスがあったようですが、以下のようなニュースとして報じられています。 MySQLは16日、米カリフォルニア州サンタクララで開催中のMy…

京都オフィスの写真

京都オフィスの内装が終わりました。快適です。オフィスが綺麗だと会社に来たくなりますし、ついつい居着いてしまいます。昨日は気づけば開発環境をセットアップするのに夢中になってしまい、帰宅が深夜になってしまいした。オフィスの様子を写真で少し、紹…

Emacs の vc-annotate

もしかしたら常識なのかもしれませんが、Emacs の vc-annotate がとても良いです。vc-annotate は vc (version control, バージョン管理システムのフロントエンド。Emacs から直接 svn {diff, commit, revert} することができる) に含まれる機能の一部です。…

Google を支える技術

Google を支える技術 を読みました。Google のバックエンドで動いている各種分散処理システムに関しては Google 自身から論文がいくつも発表されています。それらの論文をはじめとする比較的最近の情報ソースをベースに、ある程度かみ砕いて要所要所を紹介す…

中島さんと古川さんの対談

中島聡さん の おもてなしの経営学 アップルがソニーを超えた理由 (アスキー新書) を読みました。とにかく古川さん との対談が面白い。「経営学」と題している書籍ではあるのですが、この対談の箇所だけを抜き取ると、一人のソフトウェアエンジニアがどのよ…

はてなブックマークの作り直しについて

id:naoya:20080320:1206009912 でも少し触れましたが、京都に来てからはてなブックマークの作り直しをしています。どういう意図を持って作り直そうとしているかを述べておきます。まず大前提として、今のはてなブックマークに追加したい機能、変更したい仕様…