文字・文字列・言語研究会(駒場)
この研究会では、自然言語処理やバイオインフォマティクスなどの系列データに対して、理論と応用の面から課題を検討します。
理論面では、形式言語・データベース・離散アルゴリズム・データ構造・機械学習の観点から系列データ処理について考えます。
応用面では、大規模配列データや大規模コーパス、低資源データ(古代語、古典籍、消滅危機言語、暗号文書)、マルチモーダルなどの実課題について考えます。
参加者は随時募集中です。気軽にお問い合わせください。(katsuhiko-hayashi at g.ecc.u-tokyo.ac.jp)
構成員
- 小倉 甲陽(東京大学大学院総合文化研究科)
- 加藤 優汰(東京大学理学部)
- 北野 由香利(東京大学経済学部)
- 謝 佳彤(東京大学教養学部)
- 中田 琉稀(東京大学教養学部)
- 花田 佳文(東京大学大学院総合文化研究科)
- 林 克彦(東京大学大学院総合文化研究科)
成果
- 低資源データ
- 消滅危機言語のコーパス作成を支える言語識別〜アイヌ語を対象として〜(YANS2025奨励賞)
- 視覚的言語学
- 言語学×マルチモーダル処理
- 古代・暗号文書
- 分布意味論的アライメントによるヴォイニッチ手稿の言語系統に関する調査(YANS2025奨励賞)
- 形式言語学
- 知識構造処理