2012-01-01から1年間の記事一覧
1年前に軽く読み流した本だったけど,この度もう一度読み直した. 感想として,3つの点について書く. 救世主的な目的意識を持つ これはジョブズがペプシコの社長,ジョン・スカリーを口説いた言葉に集約されると思う. 「一生,砂糖水を売り続ける気かい…
WWW2012のAccepted paperが発表されたので,気になった論文をメモ. Spotting Fake Reviewer Groups in Consumer Reviews Arjun Mukherjee and Bing Liu ステマしてるグループを発見 Learning Causality for News Events Prediction Kira Radinsky, Sagie Da…
研究でtweet_idからテキストを取得する機会があったのでメモ. import json import urllib2 def getTweetFromId(tweet_id): """引数をtweet_idとしてツイートを出力する""" url = 'https://api.twitter.com/1/statuses/show/' + tweetId + '.json' fp = urll…
何度も忘れてしまうのでメモ find /usr/local/ -type f -print | xargs grep Mongoこのコマンドでは"/usr/local/"下に"Mongo"という文字列を含むファイルを出力してくれます. さらにその文字列を含む行まで出力します.便利ですが,ログが大量にある場合は…
Pythonを使っていてよく出会うのが、UnicodeEncodeError: 'ascii' codec can't encode charactersというエラー.これについてはPythonのUnicodeEncodeErrorを知るに詳しく書いてある.Unicodeは内部表現であって,これをエンコードすることで,sjisにもutf8…
何度も忘れてしまうのでメモkeyの値でソートして出力する場合 d = {'A':500, 'B':200, 'C':300, 'D':100, 'E':400} for k, v in sorted(d.items()): print k, v A 500 B 200 C 300 D 100 E 400 valueの値でソートして出力する場合 for k, v in sorted(d.item…
何度も忘れてしまうのでメモ list = [1, 2, 3] max(xrange(len(list)), key=lambda i: list[i]) #2
何度も忘れてしまうのでメモ #1次元配列 [0 for i in range(5)] #[0, 0, 0, 0, 0] #2次元配列 [[0 for i in range(3)] for i in range(3)] #[[0, 0, 0], [0, 0, 0], [0, 0, 0]] やっちゃいけないのは b = [[0] * 3] * 3 b[1][1] = 1 #[[0, 1, 0], [0, 1, 0…
自然言語処理を研究しているにも関わらず,初めての辞書追加. 単語の追加方法を参考にしながら作業を進める.しかし,エラー context_id.cpp(88) [it != left_.end()] cannot find LEFT-ID for 名詞,固有名詞,一般,*,*,*,* まずは検索すると,ちょっとだけM…
前回書いたエントリの続きです。 ネットで本屋の良さを出すにはどうすればいいか ネットの弱さは表示できる情報に制限があることだと思います。 ジョブズ本を買うプロセスで考えてみたいと思います。 1.検索窓にジョブズを入力した画面 もちろんジョブズ関…
年末年始でいろいろな本を買おうと思って、本屋に行って来ました。 その時に考えたことを書きたいと思います。 なぜ本屋に行ったぐらいで日記を書くのか? 私は最近はAmazonか楽天でしか本を買っていなかったからです。 IT系の本は普通の本屋に売っているこ…