導入事例
国立公文書館アジア歴史資料センター様
進化しつづけるアーカイブシステムに世界が注目
2,800万画像のアジア歴史資料がいつでも、どこでも、だれでも自由自在に
[2003年8月6日 掲載]

国立公文書館様(以下敬称略)のアジア歴史資料センター様は、国の機関が保管する膨大なアジア歴史資料を、インターネットを介することによって、自由に検索、利用できるようにした、まったく新しいデジタルアーカイブズの試みとして2001年11月に業務を開始しました。
オープンからまもなく2年。今では公文書館活動の先進国であるアメリカ、ヨーロッパ諸国をはじめアジア近隣諸国からも、前例のないプロジェクトとして注目を集めています。富士通が推進するIT基盤「TRIOLE」(トリオーレ)の技術と思想が、ここにはふんだんに活かされています。
アジア諸国と日本を結ぶデジタルアーカイブズ構想が発進
アジア歴史資料センター様は、1994年8月の、アジア近隣諸国の人々との関係改善を目的とした村山富市総理(当時)の談話を受け、2001年11月30日、国立公文書館の一組織として発足し、業務が開始されました。
目的は、インターネットを通じて、国の機関(現在は国立公文書館・外務省外交史料館・防衛庁防衛研究所図書館の3館)が保有する明治維新前後から第二次世界大戦終戦にかけての日本とアジア近隣諸国等に係わるアジア歴史資料(公文書等)を、研究者をはじめとする一般の方に提供すること。3館の原資料を画像データで直接、いつでも、どこでも、だれでもが、無料で自由に見られるということを基本コンセプトとしています。
これまでは3館とも、インターネットを使った原資料の公開はしてこなかったわけですが、アジア歴史資料センター様によって所蔵資料の原資料の画像を直接利用できるようにしたのは画期的なことです。
まず、画像圧縮形式をDjVu(デジャヴー)に決定。さらに、検索機能にも独自の工夫

計画当初は、膨大な原資料をどのような形で公開するかというのが一番の課題だったと言います。画像を公開するにはまず、大量の画像を利用者が簡便に、時間をかけずに見られるというのが大前提です。資料には、一件で1000ページを超えるものもあります。当初は画像を素早く処理できるソフトがなかったので、インターネットで原簿を見せる構想は無理かもしれないと考えられたこともありました。しかし当時開発されつつあったDjVuはデータが断然軽い上に、操作性に優れている。文字などの表現にも適していることがわかり、採用を決定しました。DjVuは、米国AT&Tが開発したWeb配信用超高圧縮画像フォーマットです。DjVuに合わせて、システムの大方の方向が定まったということです。
次に力を注いだのは、資料検索機能でした。まるで3館の目録を同じ机に並べているかのごとく検索できるようにならないか、というのが当初の発想でした。
資料を閲覧利用するには、違う方式で保管されてきた資料を一定の方式に統合しなければなりません。各館から画像データと件名データをCDで受け取りそれを目録化します。画像はDjVu形式に変換し、目録情報のために資料名、階層、書誌データ、およびキーワードを入力します。原資料の冒頭約300文字をテキスト化してキーワード検索に当てるという工夫も画期的なことでした。
以上のような基本構想が完成し、利用者がホームページにアクセスするだけで、3館の資料を横断的に検索できる、貴重な原資料を手に取るように閲覧できるという、世界でも例のないデジタルアーカイブズシステム構築がスタートしました。
「PRIMPOWER800」を核としたシステムで
スピーディーな業務構築と柔軟な拡張性が実現
富士通のIT基盤「TRIOLE」のコンセプトのひとつは“スピーディーな業務構築”です。システム決定から運用開始までわずか8ヵ月あまり、実作業は半年という条件下でのシステム構築は決してたやすいことではありませんでしたが、アジア歴史資料センター様の基本構想にブレがなく明確であったこと、両者間で絶え間ないミーティングと試行錯誤が行われた結果、オープン予定の2001年11月30日、無事運用を開始することができました。
アジア歴史資料センター様の資料提供システムに対して富士通が提案したシステムは、データベースはOracle、運用管理は「Systemwalker」、アプリケーションやWWWサーバには「Interstage」、検索には「Intelligent
Search(現eAccela
BizSearch)」を採用し、UNIXサーバ「PRIMEPOWER」上で構築したシステムです。画像圧縮ツールにDjVuをデータ保存形式で使用しているのは前記の通りです。
システムの中核であるデータベースサーバ「PRIMPOWER800」は、サーバがダウンしないことを最重要ポイントとして開発されているため、貴重なデータを安全かつスムースに管理できるという優れた特性を持っています。またコンポーネントが活性交換に対応しているため、システムを停止する事なく部品交換できるメリットは計り知れません。
不意のトランザクションや業務規模の拡大、改善に適切、柔軟に対応でき、「TRIOLE」の中核的なハードウェアに位置づけられています。
検索システム用に情報収集システムである「Intelligent Search」を使って4種の検索システムを準備し、ユーザー自身がもっとも使いやすい方式を自由に選べるよう配慮するのがアジア歴史資料センター様の考え方でした。こうした検索システムの構築は、これまで多数の図書館運用システムを手掛けてきた富士通の得意分野でもあります。
また、アジア歴史資料センター様の業務を維持するためにはより信頼性の高い運用管理システムが必要です。ハードウェアとソフトウェアのトータルサポート・サービス「SupportDesk」が、運用管理用ミドルウェア「Systemwalker」と連携し、365日24時間、サーバ、ソフトを監視し、特定ソフトの異常メッセージ等のチェック等、リモートでシステムを監視しトラブル時の復旧支援などを行います。なおネットワークは二重回線とし、この夏から3メガバイトを10メガバイトに拡張しました。
[図] システム概要図
- 画像データベース
Oracleを採用し、マスタ系データベースとして大容量の画像情報および目録情報を管理しています。 - データ投入システム
画像を管理するデータベースへ、各機関からCD-Rで提供された情報を登録するためのシステムです。 - 全文検索システム
「Intelligent Search」を採用し、利用者が必要な資料を容易に取り出すことを可能にします。 - 運用管理システム
利用者に対して24時間365日信頼性の高いサービスを提供する、運用・保守の全般的な機能を提供しています。 - セキュリティシステム
重要かつ改ざんの許されない歴史資料を、外部からの破壊等の不正アクセスから保護します。
利便性の高い横断検索システム

「Intelligent Search」を活用した検索システムには、階層検索・キーワード検索・キーワード詳細検索・レファレンスコード検索の4種類が用意されています。そのうち特徴的なのは階層検索です。これは、利用者がそれぞれの機関の簿冊のある書棚に行って資料を閲覧するのと同様のことができないだろうか、という基本構想に基づいて設けたのが階層検索です。キーワード検索は自由語から見たい資料にたどりつく方式、さらに一歩進んでキーワードを同義語や関連語に展開したり、階層検索と複合的に検索できるキーワード詳細検索があります。また、もう一つ特徴的なのがレファレンスコード検索。以前に利用したファイルをもう一度見たいとき、それぞれのファイルに付けられているレファレンスコードを入力すると一発でそこに行ける、いわばヘビーユーザーのための検索方式です。ユーザーの利用度、習熟度に配慮した優れた検索システムです。
利用状況はオープン以来すでに30万アクセスに迫ると言います。広報活動の結果、今年の1月からはアクセス数が急に増えてきています。去年の6月から英語でも検索できるようになったことから、英語圏からのアクセスも増え、この様な状況を踏まえ国際的な評価も高まってきています。
アクセスの増加には、富士通SEスタッフが24時間対応。その上、富士通館林データセンターが365日24時間、システムの稼働状況を監視し、サーバ機器やソフト、特定ソフトの異常メッセージなどにも対応しています。
ユーザーからの改善要求に対しては、アジア歴史資料センター様のスタッフと富士通との月1回の相談会で、少しずつ改良を進めています。本年度は、レファレンスコード検索でピンポイントに閲覧した資料を見た際、その前後の資料も見られるようにする。別々のシステムを使っている英語と日本語の目録をそれぞれ見比べられるようにするなど利用者の利便性を高める改善を行いました。初めから完全なシステムを求めているのではなく、試行錯誤しながらより良いものにしていきたいというアジア歴史資料センター様の姿勢がここにも現れています。
デジタルアーカイブズのスタンダードモデルを目指す
国際的に見て、公文書の扱いに対しては大きく水を空けられていた日本で、アジア歴史資料センター様の果たす役割はきわめて大きいと言えるでしょう。2003年1月東京での世界情報社会サミットにおいても、アジア歴史資料センター様はデジタルアーカイブズとして先駆的であり、世界も見習うべきものであるとの高い評価が与えられました。
アジア歴史資料センター様の動向およびそのシステムの成りゆきを、日本中の公文書館や関連機関を始め、世界中が見守っています。
システムのライフサイクルを通じて、「自律」・「仮想」・「統合」というコア技術を用いたサーバ・ストレージ・ネットワーク・ミドルウェア各製品と、それらのインテグレーションによって、オープン環境でシステムトータルの最適化を実現しようとする、富士通のIT基盤「TRIOLE」の思想と姿勢がここに実現されています。
【企業概要】
独立行政法人 国立公文書館アジア歴史資料センター
- 所在地: 〒102-0093 東京都千代田区平河町2-1-2 住友半蔵門ビル別館4階
- Tel: 03-3556-8801(代表)
- Fax: 03-3261-1521
- ホームページ: 国立公文書館アジア歴史資料センターホームページ
【お問い合わせ】
本事例中に記載の肩書きや数値、固有名詞等は掲載日現在のものであり、このページの閲覧時には変更されている可能性があることをご了承ください。
