| ||||||||
| ||||||||
|
デジタル・ヒューマニティーズとは、人文学的問題を情報学的手法を用いて解くことにより新しい知識や視点を得ることや、人文学的問題を契機として新たな情報学の分野を切りひらくことなどを目指す、情報学と人文学の融合分野である。またデジタル・アーカイブはデジタル・ヒューマニティーズの成果公開の有力な方法の一つである。
主なプロジェクトとして、以下の2つを進めている。
歴史ビッグデータとは、人類が生み出した記録に基づき、過去から現在までの環境や社会の状況を、シームレスに分析するプロジェクトである。ROIS-DS人文学オープンデータ共同利用センターの歴史ビッグデータプロジェクトでは、様々な分野における歴史の研究者と協力しながら、歴史データを扱う新たな方法論を研究する。
IIIF Curation Platformは、専門家の正確性、市民活動(キュレーソン)の多様性、機械(AI)の高速性を統合したIIIF検索エンジンのプロトタイプである。ROIS-DS人文学オープンデータ共同利用センターのIIIF Curation Platformプロジェクトでは、IIIF (International Image Interoperability Framework)というオープンな仕様をベースとしながら、人文学分野の画像データを研究に活用するためのツールを開発し、新しい方法論を研究する。
史料批判の方法論をデータに拡張するというコンセプトのもと、特に地図や写真などの視覚的史料を批判的に利用するための手法を研究する。文字史料に対する史料批判が確立しているのに対し、非文字史料に対する史料批判はまだ十分に確立していない。デジタル史料と情報技術を活用した、新しい史料の「読み」について研究を進める。
国文学研究資料館が中心になって進める日本語の歴史的典籍の国際共同研究ネットワーク構築事業においては、デジタル化したあとの画像をどのように検索するかが重要な課題となっている。文字が書かれている古典籍については、専門家が文字を翻刻して検索可能とする方法が一般的にはベストであるが、この翻刻作業には膨大な時間を要するため、最も重要な古典籍以外にこの方法を適用することは事実上不可能である。そこで、クラウドソーシングの方法を用いて、一般の人々が翻刻に協力するという方法も試みられてはいるが、そもそもくずし字と呼ばれる昔の文字を読むためにはトレーニングが必要であり、一般の人々に協力を依頼しても対応できる人数には限りがあるという問題が避けられない。
そこでコンピュータビジョンによる自動化として、くずし字の文字認識(OCR)に取り組んでいる。また、画像と画像をマッチングすることにより版本の間に存在する違いを浮だたせ、人間では気付きにくい異版の検出を行う技術として、差読による画像照合技術を開発している。
デジタル化された史料はウェブ上で共有しやすくなる。こうしたデータをオープン化することによって、学術研究の上でもさまざまなメリットが生じることが予想できる。例えば、オープン化されたデータを制限なく閲覧できるようになれば、地理的、金銭的あるいは人脈的に不利な条件に置かれている研究者でも、公平な競争条件で研究を進めることができる。また、データを広く公開することは、これまでとは異なる研究者の参入を促して、研究成果の多様化につながる可能性がある。さらに分野を越えて、あるいは研究者という枠も越えて協働することにより、市民社会にも研究成果を浸透させ、市民とも新たな関係を結ぶことができるかもしれない。ただし、このようなオープン化は従来の研究評価から抜け落ちている側面でもあるため、こうした活動に取り組む研究者を正当に評価する仕組みも必要である点は忘れてはならない。
こうしたより開かれた研究環境の実現をオープンサイエンスと呼ぶ。この考え方は近年注目を集めており、人文学においても今後は広まっていくと考えられる。こうしたオープンサイエンスの延長に、より開かれた人文学を実現していくことも、デジタル・ヒューマニティーズの重要な課題である。
文学作品をTEI (Text Encoding Initiative)にしたがって適切にマークアップする方法を研究するとともに、マークアップ文書から要素を抽出したり変換したりすることを通して、デジタルアーカイブの利点を活用した文学研究を進める。
|