2013-12-01から1ヶ月間の記事一覧

ScalaNLPのchalk/topicsを眺めてみた

topicsには、LDA.scalaしかありません。 LDAとは 文書のトピックを決めるときに使われることがあります。 スマートニュースを想像してもらえばよくわかりますが、ニュースがスポーツだったり、テクノロジーだったりとトピックごとにわけられています。 LDAは…

ScalaNLPのchalk/text を眺めてみた

ScalaNLPのbreezeは以前紹介した通りですが、他のプロジェクトとしてchalkやnakがありました。 今回はchalkの中でもtext以下にあるプログラムがどんなことができるのか調べてみました。ディレクトリを見ると、analyze、segment、tokenize、transformがあった…

MeCabを使ってみた

以前、C++, PythonからMeCabを使ったことがありますが、JavaやScalaから使ったことがなかったので、使ってみました。 mecab-javaの利用 mecab本体のインストールは他の記事を参照してください。当初、Sbtの設定に一行だけ加えるだけで使えるようになるんじゃ…

Jubatusを使ってみた

前回、Scalaで機械学習などをサポートすることを目的としたScalaNLPを紹介しました。 しかし、ScalaにはJavaの資産を使えるというメリットがあるので、今回はJavaを利用して、PFIが開発しているリアルタイム解析基盤Jubatusを使ってみました。 Jubatusについ…