English|Japanese  

ソフトウェア

アプリケーション

MEDIE

MEDLINEアブストラクト集合に対する知的検索システム

深い構文解析結果を利用した主語-動詞-目的語関係を指定した知的な検索

Info-PubMed

MEDLINEアブストラクト集合に対する

あるたんぱく質や遺伝子と相互作用するたんぱく質、遺伝子を表示


コーパス

GENIA Corpus

分子生物学の論文アブストラクトに専門用語情報等をタグ付けしたコーパス

専門用語、品詞、構文木(treebankβバージョン)情報がタグ付けされたコーパス。 TEI形式の専門用語コーパス(Dr. Tomaz Erjavec, Jozef Stefan Institute, Sloveniaによる)


自然言語処理ツール

Enju

深い構文解析を行うパーサ

高速(20文以上/秒)かつ高精度(述語項関係の精度88-90%)で句構造と述語項依存関係を出力.

LRDEP

A shift-reduce dependency parser

A shift-reduce dependency parser that uses maximum entropy models for scoring parser actions and a best-first strategy to search for the best parse.

GENIA Tagger

医学系テキストに特化した英語用の品詞タガー、Shallow パーサ

医学系テキストに特化。 品詞タグ付けの精度は97%-98%。 Shallowパーサの精度は91%-94%。

GENIA Sentence Splitter

医学系テキストに特化した英語用のセンテンススプリッタ

英文テキストを読み込み、センテンスに分割する。 GENIAコーパスの200個のアブストラクトに対するテストで99.7%のF値を達成。


機械学習

Amis

Feature Forest用の最大エントロピーモデルのパラメータ推定器

Feature Forestに対するパラメータ推定が可能。 パラメータ推定アルゴリズムにGIS, IIS, limited-memory BFGSをサポート。

Maxent Classifier

最大エントロピー分類器のためのC++ライブラリ

不等式制約付きモデリングが可能。 パラメータ推定アルゴリズムに高速なBLMVMを使用。


プログラミング言語

LiLFeS

型付き素性構造の高速処理をサポートした論理型言語

論理型言語(Prologに近い)。 素性構造を基本型として操作可能。 高速なunification処理をサポート。 ライブラリを用いてC++プログラムで素性構造を扱うことが可能。


開発ツール

Moriv

木構造/素性構造のグラフィカルな表示を行う、拡張HTMLブラウザ

LiLFeSと連携することが可能。

RenTAL

任意のLTAG文法をHPSG文法に変換する文法変換器

変換において理論的にstrong equivalenceを保障