1. 概要

デジタル・ヒューマニティーズとは、人文学的問題を情報学的手法を用いて解くことにより新しい知識や視点を得ることや、人文学的問題を契機として新たな情報学の分野を切りひらくことなどを目指す、情報学と人文学の融合分野である。またデジタル・アーカイブはデジタル・ヒューマニティーズの成果公開の有力な方法の一つである。

2. デジタル史料批判

史料批判の方法論をデータに拡張するというコンセプトのもと、特に地図や写真などの視覚的史料を批判的に利用するための手法を研究する。文字史料に対する史料批判が確立しているのに対し、非文字史料に対する史料批判はまだ十分に確立していない。デジタル史料と情報技術を活用した、新しい史料の「読み」について研究を進める。

3. テキストアーカイブを用いた文学作品の生成研究

文学作品をTEI (Text Encoding Initiative)にしたがって適切にマークアップする方法を研究するとともに、マークアップ文書から要素を抽出したり変換したりすることを通して、デジタルアーカイブの利点を活用した文学研究を進める。

4. 古典籍デジタル化と検索機能の高度化

国文学研究資料館が中心になって進める日本語の歴史的典籍の国際共同研究ネットワーク構築事業においては、デジタル化したあとの画像をどのように検索するかが重要な課題となっている。文字が書かれている古典籍については、専門家が文字を翻刻して検索可能とする方法が一般的にはベストであるが、この翻刻作業には膨大な時間を要するため、最も重要な古典籍以外にこの方法を適用することは事実上不可能である。そこで、クラウドソーシングの方法を用いて、一般の人々が翻刻に協力するという方法も試みられてはいるが、そもそもくずし字と呼ばれる昔の文字を読むためにはトレーニングが必要であり、一般の人々に協力を依頼しても対応できる人数には限りがあるという問題が避けられない。

そこで画像処理による自動化が焦点となってくる。まずは文字認識(OCR)の適用である。これである程度の精度が得られるのであれば現実的な解となるが、くずし字は複数の字の切れ目がわかりづらいことから、OCRは非常に難しいのが現状である。そうなると本文を読むのはあきらめ、画像解析手法を活用してなんらかの検索用インデックス(タグ)をつけたり、画像解析で抽出できる非文字情報を検索に活用したりする方法が重要となってくる。

我々はこのような問題意識のもとで、版本を対象とした異版の特定という問題に取り組んでいる。画像と画像をマッチングすることにより版本の間に存在する違いを浮だたせ、人間では気付きにくい異版の検出を行う技術を開発する。

5. 人文学とオープンサイエンス

デジタル化された史料はウェブ上で共有しやすくなる。こうしたデータをオープン化することによって、学術研究の上でもさまざまなメリットが生じることが予想できる。例えば、オープン化されたデータを制限なく閲覧できるようになれば、地理的、金銭的あるいは人脈的に不利な条件に置かれている研究者でも、公平な競争条件で研究を進めることができる。また、データを広く公開することは、これまでとは異なる研究者の参入を促して、研究成果の多様化につながる可能性がある。さらに分野を越えて、あるいは研究者という枠も越えて協働することにより、市民社会にも研究成果を浸透させ、市民とも新たな関係を結ぶことができるかもしれない。ただし、このようなオープン化は従来の研究評価から抜け落ちている側面でもあるため、こうした活動に取り組む研究者を正当に評価する仕組みも必要である点は忘れてはならない。

こうしたより開かれた研究環境の実現をオープンサイエンスと呼ぶ。この考え方は近年注目を集めており、人文学においても今後は広まっていくと考えられる。こうしたオープンサイエンスの延長に、より開かれた人文学を実現していくことも、デジタル・ヒューマニティーズの重要な課題である。

6. 参考文献(全リスト

  1. 扶瀬 幹生, 北本 朝展, "Finnegans Wakeのテキスト生成過程研究のためのTEI準拠電子アーカイヴの試作", 人文科学とコンピュータシンポジウム じんもんこん2012, pp. 143-150, 2012年11月 [ 概要 ] [ PDF ]
  2. Asanobu KITAMOTO, Yoko NISHIMURA, "Criticism of Maps: Methodological development for the Re-discovery of Silk Road Ruins and the Value of Sources", 第58回国際東方学者会議, pp. 17, 2013年05月 (in English) [ 概要 ]
  3. Asanobu KITAMOTO, Yoko NISHIMURA, "Data Criticism: a Methodology for the Quantitative Evaluation of Non-Textual Historical Sources with Case Studies on Silk Road Maps and Photographs", Third Annual Conference of the Japanese Association for Digital Humanities (JADH2013), pp. 11-12, 2013年09月 (in English) [ 概要 ]
  4. 北本 朝展, "『読む』という行為はデジタル技術でどう変わるか?", 人文情報学月報, No. 31, 2014年2月 [ 概要 ]
  5. Asanobu KITAMOTO, Yoko NISHIMURA, "Data Criticism: General Framework for the Quantitative Interpretation of Non-Textual Sources", Digital Humanities 2014, 2014年07月 (in English) [ 概要 ]
  6. 北本 朝展, "古典籍の画像分析に向けて", 第1回日本語の歴史的典籍国際研究集会「可能性としての日本古典籍」, 2015年07月 (パネルディスカッション) [ 概要 ]
  7. 北本 朝展, 西村 陽子, "Digital Criticism Platform: エビデンスベースの解釈を支援するデジタル史料批判プラットフォーム", 人文科学とコンピュータシンポジウム じんもんこん2015, pp. 211-218, 2015年12月 [ 概要 ] [ PDF ]