1. 概要

デジタル・ヒューマニティーズとは、人文学的問題を情報学的手法を用いて解くことにより新しい知識や視点を得ることや、人文学的問題を契機として新たな情報学の分野を切りひらくことなどを目指す、情報学と人文学の融合分野である。またデジタル・アーカイブはデジタル・ヒューマニティーズの成果公開の有力な方法の一つである。

主なプロジェクトとして、以下の2つを進めている。

  1. ROIS-DS人文学オープンデータ共同利用センター
  2. ディジタル・シルクロード

2. 歴史ビッグデータ

歴史ビッグデータとは、人類が生み出した記録に基づき、過去から現在までの環境や社会の状況を、シームレスに分析するプロジェクトである。ROIS-DS人文学オープンデータ共同利用センターの歴史ビッグデータプロジェクトでは、様々な分野における歴史の研究者と協力しながら、歴史データを扱う新たな方法論を研究する。

  1. 歴史ビッグデータ

3. IIIF Curation Platform

IIIF Curation Platformは、専門家の正確性、市民活動(キュレーソン)の多様性、機械(AI)の高速性を統合したIIIF検索エンジンのプロトタイプである。ROIS-DS人文学オープンデータ共同利用センターのIIIF Curation Platformプロジェクトでは、IIIF (International Image Interoperability Framework)というオープンな仕様をベースとしながら、人文学分野の画像データを研究に活用するためのツールを開発し、新しい方法論を研究する。

  1. IIIF Curation Platform

4. デジタル史料批判

史料批判の方法論をデータに拡張するというコンセプトのもと、特に地図や写真などの視覚的史料を批判的に利用するための手法を研究する。文字史料に対する史料批判が確立しているのに対し、非文字史料に対する史料批判はまだ十分に確立していない。デジタル史料と情報技術を活用した、新しい史料の「読み」について研究を進める。

5. 古典籍デジタル化と検索機能の高度化

国文学研究資料館が中心になって進める日本語の歴史的典籍の国際共同研究ネットワーク構築事業においては、デジタル化したあとの画像をどのように検索するかが重要な課題となっている。文字が書かれている古典籍については、専門家が文字を翻刻して検索可能とする方法が一般的にはベストであるが、この翻刻作業には膨大な時間を要するため、最も重要な古典籍以外にこの方法を適用することは事実上不可能である。そこで、クラウドソーシングの方法を用いて、一般の人々が翻刻に協力するという方法も試みられてはいるが、そもそもくずし字と呼ばれる昔の文字を読むためにはトレーニングが必要であり、一般の人々に協力を依頼しても対応できる人数には限りがあるという問題が避けられない。

そこでコンピュータビジョンによる自動化として、くずし字の文字認識(OCR)に取り組んでいる。また、画像と画像をマッチングすることにより版本の間に存在する違いを浮だたせ、人間では気付きにくい異版の検出を行う技術として、差読による画像照合技術を開発している。

6. 人文学とオープンサイエンス

デジタル化された史料はウェブ上で共有しやすくなる。こうしたデータをオープン化することによって、学術研究の上でもさまざまなメリットが生じることが予想できる。例えば、オープン化されたデータを制限なく閲覧できるようになれば、地理的、金銭的あるいは人脈的に不利な条件に置かれている研究者でも、公平な競争条件で研究を進めることができる。また、データを広く公開することは、これまでとは異なる研究者の参入を促して、研究成果の多様化につながる可能性がある。さらに分野を越えて、あるいは研究者という枠も越えて協働することにより、市民社会にも研究成果を浸透させ、市民とも新たな関係を結ぶことができるかもしれない。ただし、このようなオープン化は従来の研究評価から抜け落ちている側面でもあるため、こうした活動に取り組む研究者を正当に評価する仕組みも必要である点は忘れてはならない。

こうしたより開かれた研究環境の実現をオープンサイエンスと呼ぶ。この考え方は近年注目を集めており、人文学においても今後は広まっていくと考えられる。こうしたオープンサイエンスの延長に、より開かれた人文学を実現していくことも、デジタル・ヒューマニティーズの重要な課題である。

7. テキストアーカイブを用いた文学作品の生成研究

文学作品をTEI (Text Encoding Initiative)にしたがって適切にマークアップする方法を研究するとともに、マークアップ文書から要素を抽出したり変換したりすることを通して、デジタルアーカイブの利点を活用した文学研究を進める。

8. 参考文献(全リスト

  1. 扶瀬 幹生, 北本 朝展, "Finnegans Wakeのテキスト生成過程研究のためのTEI準拠電子アーカイヴの試作", 人文科学とコンピュータシンポジウム じんもんこん2012論文集, pp. 143-150, 2012年11月 [ 概要 ] [ Paper ]
  2. Asanobu KITAMOTO, Yoko NISHIMURA, "Criticism of Maps: Methodological development for the Re-discovery of Silk Road Ruins and the Value of Sources", 第58回国際東方学者会議, pp. 17, 2013年5月 (in English) [ 概要 ]
  3. Asanobu KITAMOTO, Yoko NISHIMURA, "Data Criticism: a Methodology for the Quantitative Evaluation of Non-Textual Historical Sources with Case Studies on Silk Road Maps and Photographs", Third Annual Conference of the Japanese Association for Digital Humanities (JADH2013), pp. 11-12, 2013年9月 (in English) [ 概要 ]
  4. 北本 朝展, "『読む』という行為はデジタル技術でどう変わるか?", 人文情報学月報, No. 31, 2014年2月 [ 概要 ]
  5. Asanobu KITAMOTO, Yoko NISHIMURA, "Data Criticism: General Framework for the Quantitative Interpretation of Non-Textual Sources", Digital Humanities 2014, 2014年7月 (in English) [ 概要 ]
  6. 北本 朝展, "古典籍の画像分析に向けて", 第1回日本語の歴史的典籍国際研究集会「可能性としての日本古典籍」, 2015年7月 (パネル) [ 概要 ]
  7. 北本 朝展, 西村 陽子, "Digital Criticism Platform: エビデンスベースの解釈を支援するデジタル史料批判プラットフォーム", 人文科学とコンピュータシンポジウム じんもんこん2015論文集, pp. 211-218, 2015年12月 [ 概要 ] [ Paper ]