2012-05-01から1ヶ月間の記事一覧

gzファイルで保存したときの速度(読み込み編)

ファイルが大きくなると、どうしても圧縮して保存しなくてはいけません。 そんなときにpythonのgzipを使ったときにどれくらいの遅延がでるのか知りたくて調べてみました。 プログラム #-*- coding:utf-8 -*- import time import gzip def test_a(): """圧縮…

gzファイルで保存したときの速度(書き込み編)

ファイルが大きくなると、どうしても圧縮して保存しなくてはいけません。 そんなときにpythonのgzipを使ったときにどれくらいの遅延がでるのか知りたくて調べてみました。 プログラム #-*- coding:utf-8 -*- import time import gzip def test_a(): """圧縮…

Mosesに挑戦(日本語編)

前回は仏英翻訳だったので,今回は英日翻訳に挑んでみた. コーパス データはTanaka Corpus - EDRDG Wikiを使わせていただく.データの中身は以下のフォーマット. A: ムーリエルは20歳になりました。 Muiriel is 20 now.#ID=1282_4707 B: は 二十歳(はた…

Mosesに挑戦(実行編)

前回でMosesをインストールすることができたので,今回はチュートリアルにそって構築する. SMTに有効な要素 まずは統計的機械翻訳に必要な要素を理解する必要がある. Mosesのチュートリアルには以下の要素によって機械翻訳が正しくモデル化できる書いてあ…

Mosesに挑戦(続き)

おさらい 前回では,MosesをインストールするためにGIZA++,IRST,SRILMをインストールした.今回はMoses,Boostをインストールする. Boostのインストール Boostを入れるためにまずは本家からソースを手に入れる.その後はチュートリアル通りに進めていく.…

Mosesに挑戦

研究でMosesを使う必要がでてきたのでメモ.MosesはSMTを利用するために必要. さすがに自分で実装する能力はないのでMosesに頼る.Mosesに関する資料はここに置いてある. マニュアルはこのPDF. Mosesに必要だと思われるライブラリ Moses Boost GIZA++ Mec…