2008-09-01から1ヶ月間の記事一覧

Introduction to Information Retrieval #12 の復習資料

Introduction to Information Retrieval 輪読会 12章の復習資料を以下にアップロードしました。 http://bloghackers.net/~naoya/iir/ppt/iir_12.ppt 12章は、は "Language models for information retrieval" ということで、確率的言語モデルを情報検索に適…

Perl で Range Coder

練習がてら、圧縮符号化の手法のひとつである Range Coder を Perl で実装してみました。 http://github.com/naoya/perl-algorithm-rangecoder/tree/master Range Coder は算術符号を実数ではなく整数で実現した手法です。高速な算術圧縮を実現する「Range C…

List::FrontCode

先日 Array::Gap という Variable Byte Codes による整列済み整数の圧縮の実装を作りました。(id:naoya:20080906:1220685978) 今日は Front Coding を使った同じような圧縮リストクラス、List::FrontCode を作ってみました。Front Coding は辞書式順に整列済…

第2回 アルゴリズムイントロダクション輪講

今日は id:motemen 主催のアルゴリズムイントロダクション輪読会 第2回でした。現在弊社では今年のインターンシップを 2回目(年に2回のうちの後半) 開催中ですが、先月まで来てくれていたインターン一期生も数名輪読会に参加し、東京オフィスからも数名参加…

Introduction to Information Retrieval #11 の復習資料

Introduction to Information Retrieval 輪読会 11章の復習資料を以下にアップロードしました。 http://bloghackers.net/~naoya/iir/ppt/iir_11.ppt 11章は、は "Probabilistic information retrieval" すなわち確率的検索モデルです。 IIR 10章までにあつか…

ATOK 2008

ハッカーのための IM (Input Method) と言えば SKK というイメージがあります。学生の頃、先輩や先生など知人が数名 SKK を使っていたことから、あの変換スタイルに憧れて、自分も何度か SKK にスイッチを試みましたが幾度となく挫折しました。もう一つ、「…

Array::Gap

明日は一ヶ月ぶりのIIR輪読会 です。主催のたつをさんから「教科書の話題から何か適当に実装せよ」という課題が出ていたので、5章 のインデックスの圧縮の所で見た Variable byte codes (以下 VB code) を使った圧縮の実装を作ってみました。 整列済みの整数…

第2回 インターンシップ

8月の第1回が終わり、続けて9月の第2回目のインターンが始まっています。今日はもう4日目、MVC フレームワークの講義です。8月のインターンでは、後半二週間の開発ではてなダイアリーの AtomPub や下書き機能、はてなハイクの API、新しいはてなキーワードの…