事業内容

自然言語処理(NLP)やその周辺分野(コーパス、言語学、辞書編集など)において、大学、研究機関、出版社の向けに高度な専門性が要求される以下の業務を行っています。

テキスト処理多言語に対応したテキストの整形・クリーニング、形態素解析・係り受け解析・品詞タグ付与・統語解析(句構造文法、依存文法)などの各種アノテーション、LLM・生成AIを利用した各種タスク(ファインチューニング、分類タスクなど)、言語データの統計値の算出、コンテンツ制作のための基礎データ(語彙リスト、頻度リストなど)の作成、用例データの合成音声の作成など
コーパス構築モノリンガル(1言語)コーパス、バイリンガル(2言語)コーパス(アラインメント処理含む)、多言語に対応したコーパス(これまでに扱った言語:日本語、英語、ヒンディー語、アイヌ語、インドネシア語、マレー語、ボージュプリー語など)、言語教育用DDL(Data-Driven Learning)コーパスなど
ツール開発コーパス検索ツール(コンコーダンサ、レキシカルプロファイラー、UD Treebank検索ツールなど)、言語学用ツール(可視化ツール、アノテーションツールなど)、言語教育用DDLツール、辞書編集ツール(Dictionary Writing System)、開発したツール・ツールを設置したサーバの保守管理業務など
辞書制作コーパスを利用した英語辞書の校閲・執筆・編集補助、辞書制作のコンサルティングなど