文字・文字列・言語研究会(駒場)
この研究会では、自然言語処理やバイオインフォマティクスなどの系列データに対して、理論と応用の面から課題を検討します。
理論面では、形式言語・データベース・離散アルゴリズム・データ構造・機械学習の観点から系列データ処理について考えます。
応用面では、大規模配列データや大規模コーパス、低資源データ(古代語、古典籍、消滅危機言語、暗号文書)などの実課題について考えます。
参加者は随時募集中です。気軽にお問い合わせください。(katsuhiko-hayashi at g.ecc.u-tokyo.ac.jp)
構成員
- 林 克彦(東京大学大学院総合文化研究科)
- 小倉 甲陽(東京大学教養学部)
- 謝 佳彤(東京大学教養学部)
- 中田 琉稀(東京大学教養学部)
成果
- 知識や言語の線形空間での表現
- 低資源データ
- 分布意味論的アライメントによるヴォイニッチ手稿の言語系統に関する調査(YANS2025奨励賞)
- 消滅危機言語のコーパス作成を支える言語識別〜アイヌ語を対象として〜(YANS2025奨励賞)