検索   |   バックナンバー   |   著者索引   |   タイトル索引   |   目次

Articles

spacer

D-Lib Magazine
January 2003

Volume 9 Number 1

ISSN 1082-9873

DSpace

オープンソースの動的デジタルリポジトリ

(原文: DSpace: An Open Source Dynamic Digital Repository, D-Lib Magazine, v. 9, no. 1 (Jan. 2003)


 

MacKenzie Smith
Associate Director for Technology
MIT Libraries
<kenzie@mit.edu>

Mary Barton
Senior Business Strategist
MIT Libraries
<mbarton@mit.edu>

Mick Bass
HP External Engagement Manager
Hewlett-Packard Labs
<mick.bass@hp.com>

Margret Branschofsky
DSpace User Support Manager
MIT Libraries
<margretb@mit.edu>

Greg McClellan
DSpace Systems Manager
MIT Libraries
<gam@mit.edu>

Dave Stuve
Senior Developer
Hewlett-Packard Labs
<david.stuve@hp.com>

Robert Tansley
Lead Developer
Hewlett-Packard Labs
<robert.tansley@hp.com>

Julie Harford Walker
Senior Business Strategist
MIT Libraries
<jharford@mit.edu>

Red Line

spacer

摘要

過去2年間にわたって、マサチューセッツ工科大学(MIT)図書館とヒューレット・パッカード研究所は、共同でDSpace™と呼ばれるオープンソースのシステムを開発してきた。DSpaceは、研究大学や研究機関の構成員により生産されるデジタル化された研究資料あるいは教育資料のリポジトリとして機能する。多分野をカバーする機関リポジトリを運用することは、教育・研究機関の図書館や文書館の当然の役割であると見なされてきている。機関の構成員はオリジナル資料をますますデジタル形式で生産するようになっており、それらの多くは伝統的な形態では出版されていないので、リポジトリは機関自身や構成員の重要な財産を守るために不可欠なものとなっている。本論文の前半では、DSpaceシステムの機能とデザイン等について述べ、デジタル・ライブラリやデジタル・アーカイブの設計における問題点に対するDSpaceの取り組みについて述べる。後半では、MITにおけるDSpaceの実装とシステムの連合化計画、およびシステムの持続可能性の問題について論ずる。

DSpaceについて、特徴と機能

2000年3月、多くの学問分野を擁する研究機関でデジタル形式により生産される知的成果物のための動的なリポジトリシステム、DSpace™を開発するために、ヒューレット・パッカード社(HP)はMIT図書館に180万ドルを寄贈し、18ヶ月間の共同作業を行うことになった。2002年11月4日、HP研究所とMIT図書館は、システムをBSDオープンソースライセンス[1]により世界中に向けてリリースした。MIT図書館における新サービスとして導入されてから1ヶ月後のことであった。DSpaceはオープンソースシステムであるので、どんな機関でも自由に利用することができ、システムをそのまま利用することも、自らの要件に合わせて変更したり拡張したりすることも可能である。HPとMITは、はじめから、MIT以外の機関でもシステムを運用でき、技術的および社会的な意味での利用者連合をサポートするように設計していた。DSpace連合については後ほど検討する。

それでは、DSpaceとは何か。それはこの数年来MITの教員が図書館に対して表明してきた問題を解決するための試みである。教員や研究者は研究資料や学術出版物をますます複雑なデジタル形式で生産するようになっているので、これらを収集して、保存、索引化して、配布する必要性がある。しかし、これらを個々の教員や部局、研究室、センターが管理することは時間のかかる高価な雑用なのである。DSpaceシステムは、専門家により維持されるリポジトリによりこれらの研究資料および出版物を管理する方法を提供する。時間が経つにつれ、リポジトリはそれらに対する高い視認性と利用可能性を与えることになる。

DSpaceは多機能優先で構築されている。すなわち、DSpaceはデジタルリポジトリの本サービスを提供するために研究機関が必要とするあらゆる機能を、しかし、できるだけシンプルにサポートしている。プロジェクトの焦点は本サービスを提供できる品質のシステムを構築することにあった。それはコンピュータ科学とデジタル・ライブラリアーキテクチャにおける過去の研究[2]から影響を受け、それを補完するものである 。我々の目標は、MIT、そしてできれば他の機関ですぐに利用でき、長期にわたって拡張し、改良のできる、そして、将来の研究のプラットフォームとなることのできる、システムを構築することであった。オープンソースライセンスのもとでDSpaceを採用する機関の開発者の援助を受けて、我々は、利用者が本当に望むものや、デジタル保存やデジタル権利の管理のような複雑な要件をサポートする最適な方法を知り、システムに機能を追加したり機能を改善したりしていくつもりである。

DSpaceは投稿者による参加を容易にするよう設計されている。システムの情報モデルは、組織内「コミュニティ」、すなわち、一つの組織において、それぞれ固有の情報管理要件を有するサブユニット、という考えに基づいて構築されている。大規模研究大学であるMITに即して言えば、「コミュニティ」とは専門大学院や学部、研究室、あるいは研究センターにあたる。各コミュニティは、独自の要件に合わせてシステムを改造したり、独自の投稿プロセスを管理することが可能である。

Image showing the information model for DSpace

図1: DSpaceの情報モデル

メタデータ

DSpaceはアイテムを知的に記述するために限定子付きのダブリンコアメタデータ標準(厳密に言えば、図書館作業部会アプリケーションプロファイル)を使用している。必須のフィールドは、タイトルと言語、および投稿日の3フィールドだけであり、他のすべてのフィールドはオプションである。論文の抄録、キーワード、テクニカルメタデータ、および権利メタデータ用のフィールドを追加しているのが特徴である。このメタデータはDSpaceではアイテムレコードに表示される。また、メタデータは、(コレクション内、コレクション横断、あるいはコミュニティ横断の)ブラウジングおよび検索を可能にするために索引化されている。OAISフレームワークの発信用情報パッケージ(DIPs: Dissemination Information Packages)としては、現在のところシステムは、カスタムXMLスキーマによりメタデータとデジタル資料を出力しているが、METS[3] コミュニティと共同で、任意のデジタル形式についてのテクニカルおよび権利メタデータに必要な拡張スキーマを開発中である。

ユーザインターフェース

DSpaceのユーザインターフェースは現在のところウェブベースであり、投稿者用、投稿プロセス用、エンドユーザの情報検索用、およびシステム管理用といった複数のインターフェースが存在する。

エンドユーザ用あるいは一般向けのインターフェースは、メタデータのブラウジングと検索(現在のところ全フィールドが対象であり、近くフィールド指定による検索を実現予定)によりアイテムを検索して取り込む機能をサポートしている。システム上でアイテムが見つかったら、取り込みはリンクをクリックすればよく、利用者のブラウザにアーカイブ資料がダウンロードされる。資料が「ウェブ用の」形式(ウェブブラウザやプラグインで直接見ることができる形式)であれば、直ちに見ることができる。そうでない形式(たとえば、マイクロソフト・エクセルのスプレットシートやSASデータセット、CAD/CAMファイルなど)の場合は、いったん利用者のコンピュータに保存し、専用の読み取りプログラムを起動して資料を見ることになる。

ワークフロー

DSpaceは、多分野対応システムに必要な複数の投稿登録ワークフローの対応という複雑な問題に取り組んだ最初のオープンソース・デジタル・リポジトリ・システムである。専門大学院や学部、研究室や研究センターに代表される各DSpaceコミュニティは、どのように資料をDSpaceに投稿するのか、誰が投稿するのか、あるいはどのような制限を設けるのかといった点で、それぞれ異なる考え方を持っている。アイテムのデポジットが許可されるのは誰か。どのような形態の資料をデポジットするのか。投稿された資料を査読し、修正し、承認する者が必要か。どのコレクションに資料をデポジットすることができるのか。デポジットされた資料を見ることが出来るのは誰か。このような問題はすべて、コミュニティの代表者によって図書館のDSpaceユーザサポートスタッフと共同で解決され、その決定を実行するためにコレクションごとにワークフローとしてモデル化される。システムは、あるコレクションとの関連で特定のコミュニティのワークフローにおいて何らかの「役割」を有する「e-people」をモデル化している。コミュニティの各メンバはDSpaceに登録され、適当な役割を割り当てられる。

たとえば、ある部局が2つのコレクション、研究報告書コレクションとデータセットコレクションを持つことを選択したとする。次に、教員ならだれでも、どちらのコレクションにも直接アイテムを投稿でき、さらに、一般の人なら誰でもこれらのコレクションにアクセスできると決定したとする。この例では、ワークフローは極めて単純であり、唯一の「役割」は投稿者の役割だけである。

もっと複雑な例として、同じ学部が学部長による厳しい編集管理を必要とする研究報告書コレクションを持つとする。この場合に、「投稿者」としては上と同様すべての教員とするが、少人数のグループを「査読者」、管理職員を「メタデータ編集者」、学部長を最終の「調整者」に任命するとする。教員により投稿されたアイテムは、該当するDSpaceコレクションに最終的にデポジットされる前に、査読、修正、承認のプロセスを経ることになる。このプロセスにおいて実行すべき役割を持つ者には、新しい投稿があったことが通知される。そうしたら、システム上の各自のワークスペースにアクセスして割り当てられた仕事を果たすことになる。このプロセスを済ませていないアイテムはシステムにアーカイブされることはない。

技術的プラットフォーム

DSpaceは、最低限のリソースしか有しない機関や組織でも運用できるようにオープンソースとして開発された。システムはUNIX上で稼動するよう設計されており、他のオープンソースのミドルウェアやツール、および、DSpaceチームにより書かれたプログラムにより構成されている。オリジナルコードはすべてJavaプログラミング言語で書かれている。その他の技術要素としては、リレーショナルデータベースシステム(PostgreSQL)、ウェブサーバとJavaサーブレットエンジン(Apache FoundationのApacheとTomcat)、Jena(HP研究所のRDFツールキット)、OCLCのOAICat、およびいくつかの役に立つライブラリがあげられる。利用したコンポーネンツやライブラリもすべてオープンソースソフトウェアである。可能な場合はライブラリを同梱している(例外はインストール手順書に記載されている)。システムは、DSpace情報サイト [5]とHP研究所のウェブサイト[6]の双方からリンクされているSourceForge [4]のサイトから入手可能である。

DSpaceはオープンソースで自由に利用できるが、MIT図書館もHPも、DSpaceを採用した者に対して公式なサポートを提供するものではない。DSpaceを使用する機関は、UNIXオペレーティングシステムを稼動できるハードウェアや、システムをインストールして、設定する[7]UNXIシステム管理者など、システムを使用するためのリソースを有していると、我々は仮定している。DSpaceを使用する多くの機関は、システムをローカライズしたり、カスタマイズしたり、拡張したりすることのできるJavaプログラマの助けを必要とするかもしれないが、これはシステムを運用するための絶対要件ではない。

DSpaceは、HPやMIT図書館のスタッフ、あるいは来年DSpaceを採用する他の機関のスタッフにより改良が続けられているが、これらの改良を評価して、一般に利用できるようにオープンソースシステムに取り込む責任はMITが持っている。DSpace連合による、より持続的なオープンソースメンテナンス戦略の構築計画については後ほど論ずる予定である。

システムアーキテクチャ

Image showing the archtecture for DSpace

図2: DSpaceのアーキテクチャ

DSpaceのアーキテクチャは単純明快な3層アーキテクチャであり、ストレージ層、ビジネス層、アプリケーション層からなる。各層には将来のカスタマイズと拡張のために文書化されたAPIが存在する。ストレージ層はファイルシステムを使って実装されており、PostgreSQLデータベーステーブルで管理されている。ビジネス層はDSapce特有の機能が存在する場所であり、ワークフロー、コンテンツ管理、システム管理、および検索・ブラウズモジュールなどを含む。各モジュールごとにAPIが用意されており、DSpaceを採用した機関では必要に応じて機能を置き換えたり、拡張したりすることが可能である。最後に、アプリケーション層は、システムに対するインターフェースをカバーしている。ウェブユーザインターフェースやバッチ処理によるデータ一括登録だけでなく、OAIのサポートやDSpaceアイテムの永続的識別子を解決するためのハンドルサーバを含んでいる。この層は、将来のリリースにおいて多くの注目を集めることになるだろう。なぜなら、この層は、ウェブサービスに新機能(たとえば、他のシステムとの相互運用のサポートなど)を追加したり、DSpaceを採用する機関を横断する連合サービスを定義する層だからである。

オープン・アーカイブズ・イニシアティブ(OAI)

DSpaceの採用機関との相互運用性をサポートするだけでなく、さらに、他のデジタルリポジトリやプレプリントサーバ、e-プリントサーバとの相互運用性を持つために、DSpaceはオープン・アーカイブズ・イニシアティブのメタデータ・ハーベスティング・プロトコル(OAI-PMH) [8]を実装している。これを実現するためにDSpaceでは、OCLCのOAICat [9]を使用しており、現在のところ、システムの全アイテムについてダブリンコアメタデータを提供している。ローカルアクセスだけに制限されている資料については、アイテムのメタデータはOAIハーベスタに提供しているが、ユーザが該当する資料(ビット列)を要求した際に、システムは制限を加えることになる。MITにおけるDSpaceは最近、OAIレジストリに追加された。このシステムは他の機関にも設置されているので、この将来有望なインフラストラクチャの上に、連合を横断して稼動するどのような付加価値サービスを構築できるのかを研究するつもりである。たとえば、OAI準拠の多分野をカバーする機関リポジトリに分散して存在する個々のアイテムから、ある特定の学術分野のプレプリントあるいはe-プリントコレクションを定義して、構築する可能性の調査が考えられる。

永続的識別子(ハンドル)

永続的デジタルリポジトリの目的の1つは、デポジットされたアイテムを遠く将来にわたって、検索し入手することができるようにすることである。特に、アーカイブされた資料に対する引用は、それが出版された論文にあろうとオンラインであろうと、長期にわたって有効であり続けることが重要であると考えられる。この目的のために、DSpaceでは各アイテムの永続的識別子としてCNRIハンドル [10] を実装することにした。ハンドルシステム®は、永続的識別子(すなわち、「ハンドル」)の割り当て、管理、解決を担当する。CNRIは公式の名前空間としてIETFに登録されていないが、ハンドルはIETFのURN(Uniform Resource Name)の仕様に準拠している。

ハンドルの解決は特別なクライアントを使って行うことができる。あるいは、ハンドルをURLの形に埋め込み、プロキシサーバがこれを解決してハンドル形式にし、ついで、ハンドルを解決してアイテムのローカルシステム上の位置を判明するといった形をとることもできる。DSpaceでは2番目の方法を採用した。時間の経過とともにアイテムが移動することを可能にするハンドル使用に代わる主な方法は、永続的URLをHTTPのredirectionと共に使用する方法である。この代替手段の長期的有効性はまだ十分理解されていない。

われわれは,この判断と来年以降DSpaceを採用する他の機関への影響とについて議論を深め、DSpace連合が分散サービスを提供する際に他の永続的識別システムをサポートできるか否かを検討していく予定である。

MIT図書館におけるDSpaceの実装

DSpaceは、デジタルアイテムの収集、管理、索引化および配布のためのシステムであり、ツールであり、プラットフォームである。DSpaceを、どのように、どのような種類のデジタル資料のために、誰により、どれだけ長期にわたって使用するか、などはシステムを採用する各組織で決定されるべきポリシー上の問題である。システムとポリシーの違いをより分かり易くするために、また、他の機関の運用開始を支援するために、MITはDSpaceに関する自らのポリシーを公開し共有している。我々のポリシーが他の機関でうまく働かない場合があることは承知しているし、我々も時間が経てば間違いなくポリシーを変えることになるであろうが、我々のポリシーが、検討すべき問題の深さと幅を他の機関に教えるためのガイダンスになることを期待している。

コレクションの範囲

MITにおけるDSpaceの本来の目的は、教員のデジタル形式の知的生産物、すなわち、研究論文や他の文書、データセット、画像、AV資料、データベース、あるいは彼らが重要であると判断した他の形式の生産物を捕捉することであった。この目的は2つの重要なポリシーをもたらした。1つは、教員の研究だけが受け入れられる(学生の資料や機関の記録、教員が保証人になっていない非教員の研究者の資料は受け入れられない)というものであり、今1つは、(図書館や文書館により設定された一般的な制約の範囲内で)何を投稿できるのかを教員が選択するというものである。

教員や初期に参加したコミュニティなどによる議論の結果、目的に変更はなかったが、ポリシーは変えられた。第1の変更は、何を投稿できるかという部分であった。DSpaceコミュニティが、コレクションの有用性を保つために教員以外(あるいはMIT以外の教員)により作成された資料を含むべきだと規定した場合、必要な著作権の許諾が得られる限りにおいて、コミュニティによりその資料をデポジットすることが出来るとした。第2の変更は、MIT図書館や文書館からの資料の提供であった。我々は図書館および文書館コミュニティを作成し、電子版の学位論文や、非常に良く使われる資料あるいは機関にとって資産価値のある資料を画像化した資料などのデジタルコレクションを保存することにした。

DSpaceによりサポート可能な資料として、教員により作成された文書やデータ以上に、別のカテゴリーの資料が脚光を浴びた。教育資料、すなわち、「ラーニング・オブジェクト」である。コース・ウェブサイトやオンライン教育学習環境が増えるにつれ、教員は教育活動を支援する新しい価値あるデジタル資料をますます作成するようになっている。これらは従来からある講義録や例題、講義日程表の形をとる他に、複雑なシミュレーションや視覚化、マルチメディアプレゼンテーション、主要な講義のビデオなどを含んでいる。ローカルポリシーの問題として、MIT図書館はこの種の資料を受け入れ、MITで行われているこの分野の2つのプロジェクト、OKI(Open Knowledge Initiative) [11]とOCW(OpenCourseWare)[12]と積極的な共同作業を行っている。OKIに対しては、DSpaceは講義用の「コンテンツアイテム」(現在も今後も価値のあるアイテム、たとえば、様々な講義で一様に使用される物理シミュレーションなど)のアクティブ・リポジトリの役割を果たすことができる。OKIプロジェクトではOKI準拠の講義管理システムやOKI準拠のデジタルリポジトリ間の相互運用性をサポートするAPIを開発している。OCWに対しては、DSpaceは古くなったコース・ウェブサイトを収集することで、講義がもはや開講されなくなった後で、講義を調査したり、講義資料を見つけたりすることを可能にする。DSpaceのようなデジタルリポジトリと急成長しているオンライン教育環境の間の適切な関係については多くの課題が残っているが、この分野の教員に対する重要性は無視することができないものである。

教員への約束

資料を提供する教員およびこの試みを支援する管理者に対して機関リポジトリの価値を説明するにはいくつかの方法がある。また、両者に対するこれらの利点の説明およびサービスの売り込みが重要である。

MITにおける学術的成果を表す多分野にわたるリポジトリとして、MITにおけるDSpaceは我々の教員が個人としても団体としても国際的に突出していることを示すショーケースである。アーカイブの学際的なコンテンツは、単一の学問分野に専念するリポジトリに比べ、幅広い利用者をひきつけるに違いない。さらに、学際的な研究努力をしている成長中の団体に対して、彼等が現在のところ持っていないサービスを提供する。研究成果をすばやく配布する能力は、MITにおける研究の先進性を際立たせ、知識を生み出し、発信し、保存するという大学の使命[13]をサポートするものである。

MITの教員の研究成果は研究者にとって将来にわたって価値のあるものであろうが、デジタル資料(出版物やデータセット、画像、視覚資料、など)の保存は極めて困難である。この重要な学術成果に対する長期にわたるアクセスを保証するために、MIT図書館は、DSpaceをこれら資料を将来にわたってアクセス可能として、多くの場合直ちに利用できるように保持する保存アーカイブとして管理するつもりである。

図書館は新しいコミュニティを形成する際にガイダンスを提供し、システムの使用法について教員等を補助している。DSpaceは、あらゆる種類の重要な学術資料、特にMITの教員や研究コミュニティにより生産された資料を集めて、利用可能にし、保存するという図書館の使命の延長として、MIT図書館が思い描いたものである。図書館はデジタル時代において自らのサービスを拡張し、学術コミュニティや教育における最近の傾向を反映し、ネットワーク技術により可能となった研究資料の新しい配布方法を提供するために作業をおこなっている。

過去数年間にわたって、MITはOpenCourseWareやOpen Knowledge Initiativeのようなイニシアティブと共に、教育技術に新たな重点を置いてきた。教員は、貴重な財産となるオンライン教育資料を作成するのに、多大な時間と努力を費やしている。DSpaceは、OpencourseWareなどの大学における主要な教育技術イニシアティブと協力しており、そのため、講義コンテンツの保管、再配置、再利用、および二次利用は,確実で簡単になっている。

出版済みであろうと出版前のものであろうと文献をオンラインで探すのに慣れている教員は、決められた分野のコレクションを使って仕事を続けることを期待する。DSpaceは、ホスト機関からのプレプリントやe-プリントを保管し配布することができ、多くの参加機関からなる連合という方法で異なる学問分野からなる仮想コレクションを作ることができる。主題アーカイブが既に存在する学術コミュニティ(コーネル大学にあるarXivシステム[14]など)では、DSpaceは、ローカルのデポジットプロセスの中で、該当する文献をこの主題アーカイブにコピーする処理を自動的に行うことができる。

移行チームと事業計画

2001年秋から2002年春まで、図書館はプロジェクト職員と主要な部門(たとえば、文書館や集書担当、閲覧担当、システム部門)の上級図書館職員から成るDSpace移行チームを結成した。このチームはMIT図書館の新しいサービスとしてDSpaceをどのように設置するかについて決定する任務を任された。検討する内容は、必要なポリシー、職員要求、コミュニケーション戦略、管理機構、訓練計画、運用要件などであった。このチームへの参加は、図書館職員にとってシステムにより親しくなるための有益な方法であった。また、これら様々な問題を議論することは、DSpaceの実サービスを開発する上で極めて貴重なものであった。

アンドリュー・W・メロン財団からの助成金を得て、MITにおける持続可能なDSpaceシステムのための公式の事業計画を作成するために、2人の上級ビジネスコンサルタントが移行チームに加わった。彼らの仕事は、移行チームの討議結果と決定事項をまとめ、システム運用のための詳細な経費情報を組み込み、可能な収益オプションの要点をまとめることであった。

この計画プロセスにおける主な結論として、MITにおけるDSpaceは、助成金によるコアサービス(図書館の運営予算に組み込まれている)と、特定のコミュニティのDSpaceに対する固有の要件を図書館が満たすことによる費用回収型のプレミアムサービス(たとえば、例外的なディスクストレージ量、メタデータ作成の補助、サポート形式へのファイル変換など)との組み合わせとして提案された。この戦略により、MIT図書館にとってDSpaceは、提供可能なサービスにおいて妥協する必要のない、経済的に成立する仕事であることが保証された[15]。

保存

デジタル保存に関する最近の議論においては少なくとも2つのレベルに焦点が置かれている。1つは「ビット列保存」であり、この場合、デジタルファイルは、作成時とまったく同じ形で少しの変更も加えずに注意深く保存される。もう一つは我々が「機能的保存」と呼ぶもので、デジタルファイルは、技術的な形式やメディア、あるいはその時々のパラダイムに合わせて利用できる形で保存される。前者の場合、5年から10年過ぎてもファイルを読んだり処理したりすることができるとは到底思えない。おそらく、「デジタル考古学者」が、特にそのファイル形式に関する何らかの情報(たとえば、仕様書、作成あるいは処理プログラム、ユーザ用ドキュメントなど)を持っている場合に、何年も経ってからその秘密の鍵を開くために使うことができるぐらいであろう。後者の場合、資料は常に直ちに使用できる(見ることやプレイすること、検索すること、すなわち、もともとそれを使ってすることができたことなら何でもすることができる)ように維持される。明らかに機能的保存の方が望ましいが、費用がかかることになる。

コミュニティとして言えば、我々は機能的デジタル保存が興味深い転機にあると理解している。すなわち、その必要性がいかに重要であるかを理解しており、また、それが理論的なレベル(たとえば、フォーマット移行や複雑なシステムエミュレーションなど)ではいかにして可能であるかを理解している。しかし、様々な種類の大量の資料に基づく実運用を設定する際に、実際に機能的保存をしなければならなかった機関はほとんどない。そのため、現実的な実行戦略、経費、情報ロスに対する利用者の反応、これらすべてをサポートするのにどの程度テクニカルメタデータが必要であるか、といった事に関する情報を我々はほとんど持っていない。

これらの問題はDSpaceとどのように関わるか。システムはデジタルビット列保存をサポートするための最低限のテクニカルメタデータ(ファイル形式、MD5チェックサム、作成日)を記録し、より多くの情報を記録するために利用可能な記述フィールドを提供している。このメタデータと適切な運用方法(たとえば、高性能サーバやストレージ機器、適切なバックアップと障害回復計画)により、DSpaceは「ビット列保存」をサポートできるので、デポジットされた資料は将来の利用者にも受付けた当時のオリジナルな形のまま提供することが可能である。ある種のデジタル形式にとっては、これは利用できる選択肢のうちで最良のものである。たとえば、ソースコードが提供されていない実行形式のプログラムや非常に特殊な(あるいは独自の)形式の資料の場合、DSpaceを運用する機関は機能的保存を提供するための方法を知ることはできないからである。

一方で、機能的保存は現在では機関のポリシーに関わる問題であり、実行技術や利用者の要請、費用対効果のトレードオフに関してもっと理解が進めば、DSpaceにおいてももっと完全な形で実装されることになるであろう。それまでの間は、DSpaceを運用するそれぞれの機関は、投稿ポリシー(すなわち、すべての形式を受け入れるのか、TIFFやAIFFのような標準的な形式のみを受け入れるのか)に応じた保存ポリシーを作成することになるだろう。

MITでは、「サポート対象」としたいくつかの形式について,機能的保存を実現することを計画している。「サポート対象」形式のリストはウェブサイトで公開され、利用者の投稿手続きの際に表示される。サポート対象形式には(TIFFやAIFF、XMLのような)標準的な文書形式や(PDFやRIFFのような)仕様が公開されている形式が含まれる。MITのDSpaceにはあと2つのサポート種別がある。「既知」と「サポート対象外」である。「既知」の形式とは、よく知られており、非常によく利用されているが、独自形式であり、機能的保存の基礎となる仕様が公開されていない形式である。「サポート対象外」の形式とは、(コンパイル済みのプログラムや商用のCAD/CAMファイルなど)図書館が知らないか極めてまれな形式である。「既知」と「サポート対象外」を区別する理由は、「既知」の形式は、これらの形式が時代遅れになった際に商用の変換プログラムが登場することが期待できるからである。なぜなら、これらの形式のファイルは現に非常に多く存在し,多くの産業がそれらのファイルに依存しているからである。先に述べたような商用変換プログラムがもし登場したら、そのときにはMITはこれらの形式を「サポート対象」に入れ、機能的保存を提供するつもりである。

DSpace連合

非常に初期の段階から、DSpaceはシステムをオープンソースにし、他の機関に積極的に普及することを意図していた。何故か。それには多くの理由が存在する。

  • 世界中の先導的研究大学の知的生産物を表す重要なコンテンツ集成を作成するため
  • オープンソースコミュニティを通してDSpaceサービスの持続的開発を促進するため
  • アーカイブリポジトリの相互運用性と学術生産物の長期的保存を促進するため

2002年に、MITはアメリカとイギリスおよびカナダの少数の学術研究機関と協力的関係を結び、次のような特定の問題の解決をめざした。すなわち、他の機関へのシステム設置を成功させるためにはどうしたらよいか。どの程度のローカライズ、カスタマイズ、時間と努力が必要か。機関のデジタルコレクションを活用するにはどのようなサービスを用意すればよいか、また、それはDSpaceにどのように実装できるか。連合はどのような種類の組織になるか。それはコンソーシアムか、新しい会員制組織か、非公式の緩やかな協力関係か。その組織はMITの内部組織とするか、他の機関の組織とするか、あるいは完全に独立した組織とするのか、である。この協力関係の公式な参加組織は以下の7大学である。ケンブリッジ大学(イギリス)、コロンビア大学(アメリカ)、コーネル大学(アメリカ)、ロチェスター大学(アメリカ)、オハイオ大学(アメリカ)、トロント大学(カナダ)、ワシントン大学(アメリカ)。

この公式の協力関係に加えて、多くの組織がDSpaceシステムをダウンロードしており(11月初めから約1,500件)、その多くの機関では自らの要件にシステムが合致するか評価を行っているところである。明らかに、DSpaceのようなシステムに対する大きなニーズが存在しており、我々は来年に向けてDSpace連合の定義付けを検討している。システムをいかに進化させるか、あるいはMITを超えてシステムをいかに持続させていくかについて、ダウンロードした多くの機関からの意見や助言をお願いしたい。

結論

ここから先に進むためには、まだまだ多くの課題が残っている。しかし、偉大な進歩がなされたと我々は感じており、事態がどのように発展していくかを見たいと熱望している。MITでは、大学内で、また、学術情報へのオープンアクセスに関する課題およびデジタル資料の管理や保存を前進させたいと望む他の機関と共同で、これらの課題を調べ始めるためのプラットフォームを持つことができ、非常に満足し、興奮している。HPでは、DSpaceが、標準を調査し発展させるための、また、デジタル資産を管理、アーカイブ、保存するシステムの進行中の研究のための乗り物になるという役割に興奮している。我々は共に、DSpaceが将来の学術図書館や学術アーカイブにおいて重要な役割を果たすだろうということを予想している。また、この分野での他の機関との生産的な協力関係を期待している。

謝辞

本論文の著者は、スポンサーであるヒューレット・パッカード/MITアライアンスおよびアンドリュー・W・メロン財団に感謝の意を表したい。また、DSpaceプロジェクトのかつてのメンバ、 Eric Celeste、Bill Cattey、Dan Chudnov、Peter Breton、Peter Carmichael、および、Joyce Ng. Finallyに対し感謝の意を表したい。彼らの貢献ははかりしれないものであった。最後に、HPとMITの、そして特に図書館の多くの同僚に対し感謝の意を表したい。彼らのおかげでこのプロジェクトを行うことができた。

注記

[1] BSDライセンス(Berkeley Standard Distribution License), <http://www.opensource.org/licenses/bsd-license.php>。

[2] 特に、Armsの論文, <http://www.dlib.org/dlib/July95/07arms.html>; および、 KahnとWilenskyの論文, <http://www.cnri.reston.va.us/home/cstr/arch/k-w.html>で述べられている作業; およびFEDORA プロジェクト <http://www.fedora.info/>。

[3] METSに関する情報は <http://www.loc.gov/standards/METS/> から入手できる。

[4] SourceForge.net <http://sourceforge.net/projects/dspace/>。

[5] DSpace <http://dspace.org/>。

[6] HP研究所の研究者により開発されたダウンロード可能なソフトウェア <http://www.hpl.hp.com/research/downloads/>。

[7] システムはJavaで書かれているので、理論上、UNIX以外のプラットフォームでも実行可能であるが、DSpaceの開発チームはこれをテストしていない

[8] オープン・アーカイブズ・イニシアティブ・メタデータ・ハーベスティング・プロトコル(OAI-PMH) <http://www.openarchives.org/OAI/openarchivesprotocol.htm>(日本語訳)。

[9] OAICatは <http://www.oclc.org/research/software/oai/cat.shtm>で見つけることができる。

[10] Handle System ® <http://www.handle.net/>を参照のこと。

[11] Open Knowledge Initiativeに関するさらなる情報は <http://web.mit.edu/oki/> を参照のこと。

[12] OpenCourseWareに関するさらなる情報は <http://www.ocw.mit.edu/>を参照のこと。

[13] MITのミッションステートメントについては <http://web.mit.edu/about-mit.html> を参照のこと。

[14] arXivプロジェクトに関する情報はコーネル大学にある arXiv.org e-プリント・アーカイブ <http://arxiv.org/> を参照のこと。

[15] MIT図書館のDSpace事業計画については <http://www.dspace.org/mit/plan.html>を参照のこと。

Copyright © MacKenzie Smith, Mary Barton, Mick Bass, Margret Branschofsky, Greg McClellan, Dave Stuve, Robert Tansley, and Julie Harford Walker
spacer
spacer

先頭に戻る | この号の目次
検索 | 著者索引 | タイトル索引 | バックナンバー
前の論文 | 次の論文
ホーム | 編集者へメールを出す

spacer
spacer

D-Lib Magazineアクセス条項

DOI: 10.1045/january2003-smith