そあん(soan):古活字データセットを用いた現代日本語テキストからくずし字画像への変換と共有

本論文は,今から400年ほど前に使われた印刷技術である古活字を題材に,印刷技術の謎をデータ駆動型のアプローチで分析するための古活字データセットの構築,および古活字を現代に再生させるためのデジタル組版技術の開発とサービスの展開に関わる成果をまとめる.まず古活字データセットの構築については,AIくずし字認識をはじめとする各種の機械学習技術を組み合わせ,古活字ブロックを自動的に推定するアルゴリズムを開発した.次にデジタル組版技術の開発については,くずし字など日本の過去の文字の使われ方と現代の組版習慣を両立させたデジタル組版システムをオープンソースで公開し,生成したくずし字画像を簡単に共有できるウェブサービスも開発した.最後にこれらの技術をくずし字教育やくずし字コミュニケーションに活用する際の課題についても考察する.

文献情報

北本 朝展, 本間 淳, カラーヌワット タリン, "そあん(soan):古活字データセットを用いた現代日本語テキストからくずし字画像への変換と共有", 人文科学とコンピュータシンポジウム じんもんこん2023論文集, pp. 51-58, 2023年12月

BibTeX フォーマット

      @InProceedings{ jm23a,
      author = {北本 朝展 and 本間 淳 and カラーヌワット タリン},
      title = {そあん(soan):古活字データセットを用いた現代日本語テキストからくずし字画像への変換と共有},
      booktitle = {人文科学とコンピュータシンポジウム じんもんこん2023論文集},
      pages = {51-58},
      year = 2023,
      month = 12,
      doi = {},
      note = {},
      }
    

関連資料・関連ウェブサイト

サイト内関連ページ

| リンク 1 |