Scala

ScalaNLPのchalk/topicsを眺めてみた

topicsには、LDA.scalaしかありません。 LDAとは 文書のトピックを決めるときに使われることがあります。 スマートニュースを想像してもらえばよくわかりますが、ニュースがスポーツだったり、テクノロジーだったりとトピックごとにわけられています。 LDAは…

ScalaNLPのchalk/text を眺めてみた

ScalaNLPのbreezeは以前紹介した通りですが、他のプロジェクトとしてchalkやnakがありました。 今回はchalkの中でもtext以下にあるプログラムがどんなことができるのか調べてみました。ディレクトリを見ると、analyze、segment、tokenize、transformがあった…

MeCabを使ってみた

以前、C++, PythonからMeCabを使ったことがありますが、JavaやScalaから使ったことがなかったので、使ってみました。 mecab-javaの利用 mecab本体のインストールは他の記事を参照してください。当初、Sbtの設定に一行だけ加えるだけで使えるようになるんじゃ…

Jubatusを使ってみた

前回、Scalaで機械学習などをサポートすることを目的としたScalaNLPを紹介しました。 しかし、ScalaにはJavaの資産を使えるというメリットがあるので、今回はJavaを利用して、PFIが開発しているリアルタイム解析基盤Jubatusを使ってみました。 Jubatusについ…

ScalaNLPのQuickStartをやってみた

ScalaNLPとは ScalaNLPには、BreezeとEpicという2つのプロジェクトがある。 Breezeは、Scalaで書かれた機械学習や数値計算のためのライブラリ Epicは、高パフォーマンスな統計的パーザー(Coming soon) Pythonにはnumpyやscipyという便利なライブラリがある…