ソフトウェア

アプリケーション
コーパス
GENIA Corpus
分子生物学の論文アブストラクトに専門用語情報等をタグ付けしたコーパス専門用語、品詞、構文木(treebankβバージョン)情報がタグ付けされたコーパス。 TEI形式の専門用語コーパス(Dr. Tomaz Erjavec, Jozef Stefan Institute, Sloveniaによる)
自然言語処理ツール
LRDEP
A shift-reduce dependency parserA shift-reduce dependency parser that uses maximum entropy models for scoring parser actions and a best-first strategy to search for the best parse.
GENIA Tagger
医学系テキストに特化した英語用の品詞タガー、Shallow パーサ医学系テキストに特化。 品詞タグ付けの精度は97%-98%。 Shallowパーサの精度は91%-94%。
GENIA Sentence Splitter
医学系テキストに特化した英語用のセンテンススプリッタ英文テキストを読み込み、センテンスに分割する。 GENIAコーパスの200個のアブストラクトに対するテストで99.7%のF値を達成。
機械学習
Amis
Feature Forest用の最大エントロピーモデルのパラメータ推定器Feature Forestに対するパラメータ推定が可能。 パラメータ推定アルゴリズムにGIS, IIS, limited-memory BFGSをサポート。
プログラミング言語
LiLFeS
型付き素性構造の高速処理をサポートした論理型言語論理型言語(Prologに近い)。 素性構造を基本型として操作可能。 高速なunification処理をサポート。 ライブラリを用いてC++プログラムで素性構造を扱うことが可能。




