2011-01-01から1年間の記事一覧

線形分類してみた

研究室の輪読でPRMLを読んでいるため、線形分類を実際に実装してみました。 参考にしたURLは、パターン認識と機械学習(PRML)まとめです。とても参考になります。 線形SVM 点は正例、負例ともにガウス分布に従っていて、mean1 = [-1, 2]、mean2 = [1, -1]、…

小規模ECサイトのレコメンド[実装編]

前回は理論について考えました。今回は実装の方法を考えます。前回書いたとおり、データ数が少ないために、なるべくリアルタイムに処理をします。 1日1回夜中にバッチ処理で計算するよりも、正確な情報を与えることができます。 基本的な考え方 1.初めて…

小規模ECサイトのレコメンド[理論編]

現在のようにHadoopが使えるようになった今、大規模サイトではバッチで分散処理をすべきです。 しかし、小規模サイトの場合、そもそも計算するべきログが少ないため、わざわざ分散処理をするまでもありません。 ある程度リアルタイムに処理することを考えま…

プルダウンリストとカレンダーを連携させる

日付を選ぶ機能を実装するときにプルダウンリストとカレンダーの両方を使う方法です。理想はこんな感じ。 機能としては2つ必要です ・カレンダーでの変更をプルダウンに反映 ・プルダウンの変更をカレンダーに反映(こちらは必要な方だけ)以下にプログラム…

jQueryタブでGoogleマップのピンの位置がずれたときの対処法

GoogleマップをjQueryタブに表示したいとき、ajax使ったら一部が表示されないiframe使ったらピンが左上の方にずれているなどが起きたときの対処法です。 解決方法:ajaxとiframeを組み合わせて使い、srcをrelに置き換える以下に例を示します。ここではファイ…

Pythonのライブラリをインストール(研究室編)

前回、MeCabをインストールして、今回は機械学習に必要と思われるライブラリをインストールします。 (この作業をしてから数日後に書いているため、書き漏らしがあるかも)環境:Linux 5.4 x86_64bit順序: 1.numpy 2.matplotlib 3.blas 4.lapack 5…

MeCabのインストール(研究室編)

メモがわりに MeCab + Python のインストールで引っかかったところを書く。状況:研究室のサーバのローカル環境にインストールする。suになれる権限はない。1.MeCabのインストールとりあえずmecab-0.98を持ってくる。 wget http://sourceforge.net/project…

ブログの本文を抽出

Pythonでブログの本文を抽出するプログラムを書いてみました. 句読点が多い div が本文であると判断します. これだと長いコメントがある場合はそっちを抽出してしまいますが,気にしません. それもブログの一部ということで… #-*- coding:utf-8 -*- #scra…

クーポン共同購入について考える

IT

クーポン共同購入が流行り始めて1年が経ちます。以下のページに各サイトにおける2011年5月の売上が記載されています。 http://cp4u.jp/pdf/coupon-jp_report_201105.pdf現在はグルーポンとポンパレがほぼ独占状態となっており、その後に一休、シェアリーと…

Pythonで自然言語処理に挑戦(第1回)

入門自然言語処理を購入したので、Pythonで自然言語処理を勉強してみる。入門 自然言語処理(2010/11/11)Steven Bird、Ewan Klein 他商品詳細を見る今回は第1回。私の開発環境はWindowsなので、最初のうちはWindows環境で勉強していきます。準備したこと。1…

楽天とアマゾン

IT

楽天とアマゾン、両者を利用するときには違いを意識することは少ないかもしれませんが、2社のビジネスモデルには大きな違いがあるのです。アマゾンは一度商品をアマゾンで大量に購入して、それらを消費者に転売するというモデル。 楽天はプラットフォームと…

4/26 今週読んだ論文

今週読んだ論文です. 内容が間違っているかもしれませんがあしからず. Sadagopan Srinivasan and Krithi Ramamritham and Arun Kumar and M. P. Ravindra and Elisa Bertino and Ravi Kumar "Automatic construction of a context-aware sentiment lexicon…

Twitterと言語処理について考えてみる

Twitterと言語処理につて自分なりに考えてみる.まずはTwitterの特徴について考える.1.Tweet Tweetの文章は今まで自然言語処理で扱ってきたブログやWebページとは異なり,文字数が圧倒的に少ない.そのため,主語の省略が非常に多く扱いづらい.解析でき…

信念を貫くということ

ただの日記みたいなもんです. 信念を貫くということはとても難しく,とても辛いことだということを私はこの半年間感じた.このことは誰も経験することであり,誰もが悩むことだと思う.例えば,Facebookのザッカーバーグもかなり悩んでいたようだ.私の比で…

ソーシャル書籍

IT

「台風の目に入らなければ」 角川とGREEが提携、「ソーシャル電子書籍」配信 http://www.itmedia.co.jp/news/articles/1102/24/news061.htmlKindleにソーシャルリーディング機能、サイトはSNS化 http://techwave.jp/archives/51600207.html ついに電子書籍の…

食べログとぐるなび

IT

食べログとぐるなびを今回の決算をもとに比較してみます.まずは食べログ.食べログの収益源は主に広告収入と,有料会員と店舗会員からの課金となっています. 有料会員とは,月額315円を払うことにより,ソート機能が使えるようになります. 店舗会員とは,…

湿度と温度とウイルス

ウイルスが蔓延する季節になりました. 一番気をつけなければならないのが部屋の温度と湿度のようです.下の図を見てください. このように部屋の湿度が40〜60%であるとき,ほとんどのウイルスは死滅するため人間は快適な生活を送れます.湿度は温度も関係し…

クローラの仕組み

クローラという言葉を聞いたことがある人といない人がいると思います.いつもGoogleを使っているとき,どうしてGoogleですべてのWebサイトを検索できるんだろう?と疑問を持つことがあるかもしれません. 実はGoogleはクローラというプログラムを使って自動…

映画「ソーシャルネットワーク」

2011年1月15日いよいよ「ソーシャルネットワーク」が公開します.この映画は世界中で5億人が使っているSNS(ソーシャルネットワーキングサービス)facebookを題材とした映画です. 私は一足早く日経エンタテイメントの試写会で見てきたので, ここで感想とfaceb…