Open Society Institute

機関リポジトリ構築ソフトウェアガイド

第1版
2003年10月

謝辞

Open Society Instituteおよび本文書の著者は、これから検討するシステムの以下の代表者に対して感謝の意を表したいと思います。各氏にはここに取り上げた情報を査読していただき、ご意見をたまわりました。
Seek You Too社のErik Groeneveld(i-Tor); サウサンプトン大学のChristopher Gutteridge (Eprints.org); オランダ科学情報サービス研究所のHenk Harmsen (i-Tor); CERNのJean-Yves Le Meur (CDSware); エッセン大学のFrank Lüzenkirchen (MyCoRe); ティルブルグ大学のThomas Place (ARNO); MITのMacKenzie Smith と Richard Rogers (DSpace)。

さらに、 DAREのLilian van der Vaart (SURFプログラム)、InnervationのMartin Feijen (DAREのコンサルタント)、 Susan Gibbons (ロチェスター大学)、そして William Nixon (グラスゴー大学) の各氏からは全般的に貴重な洞察に満ちたご意見をいただきました。

本文書に事実の相違や理解の誤りが残っている場合、その責任は一切著者にあります。

本文書は クリエイティブ・コモンズ(Creative Commons)のアトリビューショ ン―ノーデリブス 1.0(著作(権)者表示―二次的著作物禁止)(http://creativecommons.org/licenses/by-nd/1.0)(ライセンスの日本語訳)によりライセンスされてます。OSI は第三者に対し作品の複製、配布、表示および上演を許可します。ただし、利用に際しては著作権者の表示をしなければなりません。なお、OSIが第三者に対し許可する複製、配布、表示および上演は改変されていない原作品についてのみです。原作品に基づく派生作品についてはこれを許可しません。

© 2003, Open Society Institute, 400 West 59th Street, New York, NY 10019


作成者: Raym Crow
Chain Bridge Group
703.536.7447   crow@chainbridgegroup.com   www.chainbridgegroup.com


目次


1) はじめに

1.1 本文書の目的

世界中の大学や研究センターで機関リポジトリの構築が盛んに計画されています。そのような計画は方針、法律、教育、文化、技術の各側面から検討する必要があります。これらの多くは互いに関係しており、また、リポジトリを成功に導くためにはいずれもないがしろにすることはできません。

Open Society Institute ではそうしたリポジトリ構築計画の一側面である機関のニーズを満たす最適のソフトウェアを選択する際の一助となるようこの文書を作成しました。各機関のシステムに対するニーズは、コンテンツの提供方針やそれを実現するために必要な方法により決まります。リポジトリを注意深く計画し上手に設計すれば本文書で検討するどのシステムを使用してもうまく機能させることができます。逆に、計画がずさんで設計がまずくてはどのシステムを使用してもリポジトリを成功に導くことはできません。そこで、システムの特徴と機能一覧表(2.2 節)の注記では必要に応じて、リポジトリの計画、設計および方針といったより一般的な枠組みに関連させて各システムの技術的特徴の妥当性について説明しようと思います。

1.2 本文書の適用範囲

本文書で検討するソフトウェアは 以下の3 つの基準を満たすものです。

本文書で検討するシステム、CDSware、DSpace、Eprints、i-Tor、MyCoRe はすべてこれらの基準を満たしています。これらのシステムを使用することにより独自の開発をすることなく OAI 準拠のリポジトリの完全な枠組みを構築することができます。なお、本文書ではこれらのシステムについて検討しますが、「最適の」システムを特定したり、一つのシステムを推奨したりすることはありません。各機関に最適なシステムは各機関特有の要件にもっともよく合致するシステムです。

システムを解説した章は2つの節からなります。(1) 各システムの概要(2.1 節)では各システムの要点をまとめ、連絡先とさらなる情報へのリンクを提供します。(2)システムの特徴と機能一覧表(2.2 節)ではシステムの具体的な機能についてさらに詳細に解説します。本文書で述べるシステムはそれぞれ異なる設計思想と目的に基づいて開発されています。一覧表にあげた機能は、これらの機能が機関リポジトリに必須であることを示しているわけではありません。ある機能が重要であるか否かはシステムの全体設計や機関各自の要件に照らして検討すべきものです。さらに、これらのシステムは日々開発が進んでいますので、その特徴や機能の最新情報についてはシステムのウェブサイトを参照したり、開発者に直接連絡を取ったりしてください。

注1: ただし、いくつかのシステムでは所有権のあるソフトウェア(たとえば、Oracle や DB2)や OS (Windows や Solaris) の使用がオプションとして用意されています。

2) システムの解説

2.1 各シテムの概要

CERN Document Server Software (CDSware)

CERN Document Server Software (CDSware) は CERN Document Serverをサポートするために開発されました。このシステムは CERN により保守され、一般に公開されています。このシステムは電子プレプリントサーバやオンライン図書館目録、その他のウェブベースのドキュメントリポジトリシステムで使用されています。CERNでは CDSware を使用して、62 万件をこえる書誌レコードと、プレプリントや雑誌論文、書籍、写真を含む 25 万件のフルテキストドキュメントからなる 450 をこえるデータコレクションを管理しています。

CDSware はマルチメディアコンテンツ目録や博物館収蔵品目録、機密文書や公開文書などといった種類の異なる資料を所蔵する非常に大規模なリポジトリ向けに作成されました。各リリースバージョンは CERN という厳しい環境下で実際にテストをされてから一般に公開されています。

連絡先
Jean-Yves Le Meur 
CERN 
CH-1211 
Geneva, Switzerland 
jean-yves.le.meur@cern.ch 
+41-22-7674745 
http://cdsware.cern.ch
補足情報

CDSware関連の二つのメーリングリストがあります。

DSpace

MITのDSpaceは多くの学問分野を擁する研究組織の知的生成物を保存するデジタルリポジトリとして作成されました。MITはHewlett-Packard社と共同で2000年3月から2002年11月にかけてシステムを設計しました。最新版のバージョン1.1.1は2003年8月にリリースされています。DSpaceはMITにおける実働サービスとして運用されており、さらにこのシステムを採用した世界中の大規模研究施設からなる共同体が形成されつつあります。

DSpaceはユーザコミュニティ指向をシステム構造に取り入れています。この設計は専門スクールや学部、研究センター、大規模研究施設によく見られるその他の組織の参加を支援します。これらのコミュニティの要件はそれぞれ異なるかもしれませんので、DSpaceではシステムのワークフローやポリシー関連の設定を変更可能にすることで、各コミュニティ独自のコンテンツやユーザ認証、知的所有権問題に対処するようにしています。

この分散化されたコンテンツ管理法の採用とデジタル保存計画を支援する統合化されたツールによって、DSpaceは大規模機関が設置するリポジトリを管理する現実的なシステムとしてふさわしいものになっています。

DSpaceはまた保管された研究資料の長期保存の問題にも焦点をあてており、DSpaceを採用した多様な機関でこの問題について活発な研究と開発がなされています。将来的にはDSpaceは研究資料を保管して利用可能とするサービスを提供するシステムとしてだけでなく、永久保存用のユーティリティとしても利用できることになるかもしれません。

連絡先
MacKenzie Smith 
Associate Director for Technology 
MIT Libraries 
Building 14S-208 
77 Massachusetts Avenue 
Cambridge, MA USA 02139 
kenzie@mit.edu 
(617) 253-8184 
http://www.dspace.org/ 
補足情報

Eprints

Eprintsソフトウェアは、本文書で述べるリポジトリ構築システムのうちもっとも多くかつ広くインストールされているシステムです。サウサンプトン大学(2)で開発され、最初のバージョンは2000年末に一般公開されました。プロジェクトは初めCogPrintsによるスポンサーを受け、現在はOpen Citationプロジェクトの一つとしてJISCのスポンサーを受け、同時にNFSのスポンサーも受けています。

世界中でインストールされているEprintsには新規利用機関をサポートする大規模なネットワークが形成されています。Eprintsのインストール数が多いことは、Eprintsが比較的短期間でシステムを立ち上げて運用することができ、専門家の手を煩わす手間も最小限で済むことを示唆しています。また、たとえば詳細検索や拡張版メタデータの利用などの機能を統合することでシステムの基本機能を向上させているインストール例が多いことは、Eprintsが利用機関の要件にあわせて容易に変更できることを示しています。

Eprints連絡先
Christopher Gutteridge 
Department of Electronics and Computer Science 
University of Southampton 
SO17 1BJ 
United Kingdom 
cjg@ecs.soton.ac.uk 
+44 (0)23 8059 4833 
http://software.eprints.org 
補足情報

注2: Eprintsは(Matt Hemusにより開発されたCogPrintsに基づいて)Rob Tansleyにより開発されました。以後、Chris Gutteridgeにより改良・保守されています。

i-Tor

i-Tor (Tools and technologies for Open Repositories)はオランダ科学情報サービス研究所(NIWI(3))の革新的技術応用(IT-A)部門で開発されました。NIWIではi-Torを「様々な種類の情報をウェブインターフェースで提供するためのウェブテクノロシー」と呼んでおり、データの保管場所、保存形式を問いません。i-Torでは「データに依存しない」リポジトリを構築することを目的としており、コンテンツとユーザインターフェース機能をシステム上で独立させています。手短に言うと、i-Torは、OAI互換のリポジトリや他のデータベースからデータを収集するOAIサービスプロバイダとデータを提供するOAIデータプロバイダの両プロバイダとして機能するシステムです。

i-Torは多くのリレーショナルデータベース、ファイルシステムおよびウェブサイトのデータを公開することができるので、リポジトリの組織法に関して利用機関には高い自由度が与えられています。リポジトリのために新たにデータベースを作成することもできますし、既存のリレーショナルデータベースを使用することもできます。さらに、i-Torは研究者個人のホームページから直接データを収集する機能もサポートしています。

この設計のおかげで、i-Torは利用機関に特定のワークフローを強制しません。i-Torは各機関で必要なワークフローをi-Torシステム自体に組み込むことをせず、各機関で必要なワークフローに外付けするツール、たとえばきめ細かいセキュリティ機能や通知機能、を提供します。i-Torはその設計により既存の種々のデジタルリポジトリの上に新たにリポジトリを設けたいと願う機関にとって望ましい選択となるかもしれません。

連絡先
 
Henk Harmsen 
Head of Operational Management 
Netherlands Institute for Scientific Information Services 
henk.harmsen@niwi.knaw.nl
+31 20 462 8605 
http://www.i-tor.org/en/toon 

注3: http://www.niwi.knaw.nlを参照。

MyCoRe

MyCoReはエッセン大学のMILESSプロジェクトから派生したもので、現在複数の大学からなるコンソーシアムで開発中です。MyCoReはデジタルライブラリとアーカイブソルーション(すなわちコンテンツリポジトリ(Content Repositories)、だから「CoRe」)を支援するソフトウェアツール群を提供するものです。システムは設定変更可能で利用機関の要件に対応できるように設計されており(ゆえに、「My」)、利用機関でプログラムする必要はありません。

限定子付きのダブリンコアデータモデルをプログラムに書き込んだMILESSとは対照的にMyCoReのデータモデルは完全に設定変更が可能です。MyCoReでは「コア」機能を使用したサンプルアプリケーションを提供しており、これにより利用機関はメタデータ設定ファイルを使って利用機関独自のアプリケーションをどのように構築するかを知ることができます。コア機能にはリポジトリを構築するために必要なすべての機能、たとえば、地理的に分散された複数のリポジトリに対する統合検索機能、OAI準拠機能、オーディオ・ビデオストリーミングのサポート機能、ファイル管理機能、オンラインメタデータ編集機能など、を含みます。

MyCoReは特定のデータベースの専用システムではありません。永続化層(persistence layer)インターフェースが提供されており、複数の異なるデータベースにより実装することができます。オープンソースデータベースシステムによる実装に加えて、非常に大きなリポジトリで利用される可能性のある商用のIBM Content Managerシステムもサポートされています。

連絡先
Frank Lüzenkirchen 
Technical Contact 
Essen University Library 
University of Duisburg-Essen 
Universitätsstraße 9-11 
45141 Essen, Germany 
luetzenkirchen@bibl.uni-essen.de 
+49-(0)201-183-2124 
http://www.mycore.de/engl/index.html 

2.2 各システムの特徴および機能一覧表

機能CDSwareDspaceEprintsi-TorMyCoRe
技術仕様
1.0 標準準拠
1.1 サポートするOAI-PMHの版 OAI-PMH 2.0 OAI-PMH 2.0 OAI-PMH 2.0 OAI-PMH 2.0 OAI-PMH 2.0
1.2 Z39.50対応 いいえ いいえ いいえ いいえ いいえ1
1.3 ソースライセンス1 GNU GPL BSD GNU GPL GNU GPL GNU GPL
1.4 最新版リリース日 2002年4月 2003年8月 2002年3月 2003年8月 2003年10月
1.5 最新版次 0.0.9 1.1.1 2.2.1 1.1.4 1.0
2.0 ハードウェア
2.1 最小限のハードウェア要件2 特別な要件なし1 特別な要件なし1 特別な要件なし 特別な要件なし 特別な要件なし2
2.2 SANサポート3   あり あり    
3.0 ソフトウェア
3.1 (検証済の)OS Linux/Solaris UNIX/MacOS/Windows2 GNU/Linux/Solaris1 Linux/Windows AIX/Windows/Linux/Solaris
3.2 プログラム言語 Python/PHP Java Perl Java Java
3.3 データベース MySQL PostgreSQL3 MySQL MySQL & Oracle MySQL, PostgreSQL; XML:DB準拠;商用DB3
3.4 Webサーバ Apache/PHP, Python 任意4 Apache 1.32 Jetty Apache
3.5 Javaサーブレットエンジン   任意4 該当なし Jetty 任意4
3.6 検索エンジン cdsware2 Lucene 該当なし Lucene JDBCおよびXML:DB経由
3.7 その他 WML(Website META Language) OAICat 該当なし   Apache Ant
4.0 サポートするクライアント HTML 4.0を解するすべてのクライアント すべてのwebブラウザ Netscape, Mozilla, IE, Lynx3 HTML 4.0を解するすべてのクライアント すべてのwebブラウザ
5.0 必要なスタッフ4
5.1 UNIXシステム管理者 必要 必要 必要 推奨1 推奨
5.2 Javaプログラマ 不要 推奨 不要 不要 推奨5
5.3 Perlプログラマ 不要 不要 推奨4 不要 不要
5.4 Pythonプログラマ 不要3 不要 不要 不要 不要
6.0 インストール実績
6.1 インストール数 7+4 10+5 1065 10 106
6.2 利用地域 ヨーロッパとアメリカ5 世界中 世界中6 オランダ ドイツとスウェーデン
機能CDSwareDspaceEprintsi-TorMyCoRe
リポジトリおよびシステム管理
7.0 インストール
7.1 自動インストールスクリプト あり あり あり あり あり
7.2 システム更新スクリプト あり あり6 あり7 なし CVSリポジトリ経由
7.3 カスタマイズ内容を維持したままでのシステムアップグレード5 あり   あり8 あり あり7
8.0 モジュールレベルAPI6 あり6 あり7 あり あり2 あり
9.0 ユーザ登録、認証およびパスワード管理
9.1 パスワード管理 あり あり あり あり  
9.1.1 パスワードのシステム付与 あり7 あり なし なし  
9.1.2 パスワードのユーザ指定 あり あり あり あり  
9.1.3 忘失パスワード対応7 あり なし あり なし  
9.2 ユーザ登録検査/その他のセキュリティ機構8 MySQLテーブル/Apache ACL email/X.509 MySQLテーブル9 なし RDBMSテーブル
9.2.1 ユーザプロファイルの編集 あり なし あり あり  
9.3 ユーザ種別によるアクセス制限9 あり あり あり なし3  
9.4 複数のユーザ認証方式10 あり あり なし なし4  
9.5 ファイル/オブジェクト単位のアクセス制限11 あり あり あり あり なし
10.0 コンテンツ登録管理
10.1 同一システムでの複数コレクションの定義12 あり8 あり あり あり  
10.1.1 コレクション毎に異なる登録パラメタの設定13 あり        
10.1.2 コレクション毎のホームページ管理 あり9 あり なし なし  
10.2 登録処理の状態14 提出、修正、改訂、承認、など10 整理、保留、承認   あり5 なし1
10.2.1 隔離された登録作業空間15 あり あり あり10 あり5  
10.2.2 登録処理の役割16 提出者、仲裁者、査読者、是認者、管理者 提出者、査読者、是認者、編集者 利用者、編集者、管理者11 あり5  
10.2.3 コレクション単位で個別に登録処理の役割を設定17 あり あり   あり5  
10.3 登録支援機能
10.3.1 提出者へのemail通知18 あり9 あり あり あり なし
10.3.2 コンテンツ管理者へのemail通知19 あり9 あり あり あり なし
10.3.3 登録済ユーザの個人専用システムアクセス20 あり あり あり あり なし
10.3.3.1 保留中コンテンツの表示21 あり あり あり 該当なし なし
10.3.3.2 承認済コンテンツの表示22 あり あり あり 該当なし なし
10.3.3.3 保留中コンテンツ管理作業の表示23 あり あり   該当なし なし
10.3.4 配布ライセンスの管理24
10.3.4.1 配布ライセンスのリクエスト25 なし あり なし なし  
10.3.4.2 コンテンツと配布ライセンスの保存26 なし あり なし12 なし  
11.0 システム作成の利用統計および報告書
11.1 利用統計作成27 なし11 あり なし13 あり6 なし
11.2 利用報告書作成28 なし あり なし あり なし
機能CDSwareDspaceEprintsi-TorMyCoRe
コンテンツ管理
12.0 コンテンツ入出力
12.1 圧縮ファイルのアップロード あり あり8 あり あり なし1
12.2 URLからのアップロード あり なし あり あり7 なし1
12.3 オブジェクトの一括入力29 あり あり あり なし あり
12.4 メタデータの一括入力30 あり あり あり あり あり
12.5 一括出力/コンテンツ可搬性31 あり あり あり なし8 あり
13.0 ドキュメント/オブジェクトフォーマット
13.1 承認ファイルフォーマットの設定32 あり あり あり なし なし
13.2 入力可能なファイルフォーマット33 すべて12 すべて すべて14 すべて すべて
13.3 提出アイテムに複数のファイルフォーマットを認める34 はい はい はい   はい
14.0 メタデータ
14.1 基本となるメタデータスキーマ35 Marc21規格 限定子付きダブリンコア ダブリンコア 任意 限定子付きダブリンコア8
14.2 拡張されたメタデータのサポート36 あり カスタマイズ可能 あり 任意 任意9
14.3 メタデータの査読サポート37 あり あり 受付、編集、差戻し(要変更)、削除 なし なし
14.4 メタデータ出力38 OAI-Marc出力 カスタムXMLスキーマ9 カスタムXMLスキーマ あり あり
14.5 メタデータハーベスティングの許可39 あり あり あり あり あり
14.6 メタデータフィールドの追加・削除 あり     あり3 あり
14.7 メタデータのデフォルト値設定40 あり     あり3  
14.8 Unicode文字セットのサポート あり あり あり なし あり
15.0 受理されたコンテンツの即時更新・索引付け あり あり あり15 あり あり
機能CDSwareDspaceEprintsi-TorMyCoRe
データ公開(ユーザインターフェースと検索機能)
17.0 ユーザインターフェース
17.1 インターフェースの「ルック&フィール」の変更41 あり あり10 あり16 あり あり
17.2 静的/動的webページへのカスタムヘッダ・フッタの適用 あり13 なし あり あり あり
17.3 多言語インターフェースのサポート あり あり あり あり あり
17.4 エンドユーザ用ドキュメントフォルダ42 あり なし なし あり  
17.5 ディスカッションフォーラムのサポート43 なし14 なし あり17 あり なし
18.0 検索能力
18.1 フルテキスト検索44 あり あり11 なし18 あり なし10
18.1.1 論理演算 あり なし なし あり  
18.1.2 トランケーション/ワイルドカード45 あり なし なし あり  
18.1.3 ステミング検索(Word stemming)46 なし なし なし19 なし  
18.2 全メタデータ検索47 あり あり あり あり あり
18.2.1 論理演算 あり     あり あり
18.2.2 トランケーション・ワイルドカード あり あり   あり  
18.2.3 ステミング検索(Word stemming) なし あり   あり あり
18.3 指定したメタデータフィールドの検索48 あり あり あり あり あり
18.4 ブラウズ
18.4.1 著者によるブラウズ あり あり あり20 あり9 あり
18.4.2 タイトルによるブラウズ あり あり あり20 あり9 あり
18.4.3 日付によるブラウズ あり あり あり20 あり9 あり
18.4.4 件名によるブラウズ あり なし あり20 あり9 あり
18.4.5 コレクションによるブラウズ あり あり あり20 あり9 あり
18.5 検索結果のソート
18.5.1 著者によるソート あり なし あり あり あり
18.5.2 タイトルによるソート あり なし あり あり あり
18.5.3 日付によるソート あり なし あり あり あり
18.5.4 適合率によるソート なし なし なし あり  
18.5.5 その他のソート 任意のメタデータフィールドによるソート なし あり21 あり9 あり
19.0 Googleあるいは他の検索エンジンによる索引付け49 可能15 あり   あり 可能
機能CDSwareDspaceEprintsi-TorMyCoRe
アーカイブ化
20.0 永続的なドキュメント識別50
20.1 識別子のシステム付与 あり あり あり あり あり
20.2 CNRIハンドル51   あり あり なし あり
21.0 データ保存のサポート
21.1 定義されたデジタル保存戦略52 あり16 あり なし なし なし1
21.2 保存用メタデータのサポート(14.2参照)53 あり17 あり なし なし なし1
21.3 データ保全性検査 なし MD5チェックサム MD5チェックサム なし MD5チェックサム
22.0 オブジェクト履歴とバージョンコントロール バージョン管理システム ABCハーモニーデータモデル いくつかあり なし なし1
機能CDSwareDspaceEprintsi-TorMyCoRe
システム保守
23.0 システムサポート
23.1 ドキュメント/マニュアル あり あり あり あり3 あり
23.2 メーリングリスト あり あり あり あり3 あり
23.3 バグ追跡/仕様追加リクエストシステム あり あり12 なし あり3 なし
23.4 正式なサポート/ヘルプデスク 有料 なし なし なし なし

システムの特徴と機能に関する注記

1) 本文書で検討したシステムのほとんどにおいて、その動作するオペレーティングシステムとそれをサポートするソフトウェアはすべてはGNU一般公衆利用許諾契約書(GPL)でライセンスされたオープンソースです。MITとHewlett-Packard社はDSpaceのすべてのソフトウェアをBSDライセンスのオープンソースとしてライセンスすることに合意しています。DSpaceはサードパーティのソフトウェアを構成部品として追加する場合は同一の条件で行う予定です。

2) システムにより様々な利用機関側の条件が与えられていますが、最低限のCPU要件を指定しているシステムはありません。システムのウェブサイトに想定されるハードウェア構成が記述されている場合は、その情報へのリンクを示しました。

3) システムがSAN (Storage Area Network)上で作動することを表します。

4) 項目3.0(ソフトウェア)で示したソフトウェアによっては、オペレーティングシステムやストレージシステム、ウェブサーバ、コマンドマネージャー、サーチエンジンについての経験を有するテクニカルスタッフが必要なシステムもあります。構築するシステムの大きさや要件によりますが、システム管理者とプログラマは既存の人員を割り当てればよく、必ずしもフルタイムスタッフである必要はないでしょう。

5) ページテンプレートやemailアドレス、ヘルプページ、検索ページなどに利用機関が加えた変更を上書きすることなくシステムを更新可能とします。

6) ほとんどのシステムではある程度利用機関側でシステムのカスタマイズをすることが可能です。このカスタマイズをシステムが用意したスクリプトを変更することで行うシステムもありますし、各自の要望にあわせて利用機関側でシステムの機能を変更できるようにAPI(Application Programmer Interface)を提供しているシステムもあります。

7) パスワードを忘れてしまった人が人手を介することなく新しいパスワードを選ぶことのできる安全な方法を提供します。多くの場合、システムは新しいパスワードを与えるためにユーザのメールアドレスを使用します。

8) リポジトリにコンテンツを提供すること、あるいはリポジトリのコンテンツを管理することを許可されたユーザを登録し認証します。これにより一般公開されたコンテンツにアクセスできる世界中の無名ユーザと登録ユーザを区別します。

9) リポジトリの管理者がユーザに権限レベルを設定することにより特定のコンテンツへのアクセスを制限できるようにします。たとえば学部の研究報告書へのアクセスをその学部の教員のみに制限することに利用できます。また、研究費の契約条項により利用が制限されている資料へのアクセスを制限することにも利用できます。

10) リポジトリの管理者が複数のユーザ認証方式を使用することにより様々なレベルで提出アイテムへのアクセスを制限できるようにします。たとえば、ほとんどのアイテムはすべてのユーザに広くアクセスを認め、いくつかのアイテムはIPアドレスで制限して特定の大学の構成員のみが利用できるようにし、残りのアイテムはIDとパスワードを使って比較的少人数のグループの利用に限定するなどの利用例が考えられます。

11) リポジトリの管理者が提出アイテムへのアクセスをファイル単位で制限できるようにします。たとえば、学位論文がアクセスを制限すべき画像ファイルやその他のファイルを含んでいる場合などに利用できます。

12) 運営機関がインストールした1つのシステムに複数のコレクションやユーザグループを定義できるようにします。コレクションは、コンテンツの主題や種類あるいは目的、対象者など様々な方法で定義することができます(たとえば、研究報告書シリーズやカリキュラムサポート資料コレクションなど)。ユーザグループは、各機関の必要に応じて、学部や専門スクール、研究所、管理部門(たとえば博物館や附属病院など)に対応させて定義することができます。

13) リポジトリの管理者がリポジトリで定義したコレクションやユーザグループの各々に(もし必要なら)異なるコンテンツ登録パラメタや査読・承認パラメタを設定できるようにします。

14) リポジトリの管理者がコンテンツの提出からリポジトリへの入力にいたる登録処理の処理状態の数と種類を指定できるようにします。

15) 処理の終了していない、あるいは承認前の状態の提出コンテンツを保存する個別の作業空間を提供します。これによりユーザはドキュメントの提出が中断されたり、完了できなかった場合に作業を保存することができ、提出作業をすべて放棄する必要がなくなり提出処理が簡単になります。

16) リポジトリに設定変更可能な一連のコンテンツ査読機能および登録管理機能を提供します。たとえば、(ユーザグループ毎に決めた基準により)コンテンツを承認したり、メタデータの作成に査読、編集、承認の処理段階を設けたりすることができます。

17) リポジトリ内のすべてのコレクションに対して同じ役割と登録プロセスを適用するシステムもありますし、これらの機能をコレクション毎に設定できるので、1つのシステムに存在する複数のコレクションに対して異なる登録・査読プロセスを提供できるシステムもあります。

18) 提出コンテンツの処理状態(アイテムのリポジトリへの入力が承認された、アイテムが提出者に差し戻された、など)にあわせてユーザにemailで通知します。

19) 提出物の処理状態が査読や承認など各コンテンツ管理者(査読者や承認者など)が作業すべき状態になった場合に該当する担当者にemailで通知します。

20) 登録ユーザがコンテンツや処理状態情報へアクセスできるようにします。この機能によりユーザは提出コンテンツの状態や保留中のコンテンツ承認作業の状態を確認できます。

21) ユーザがリポジトリに提出したすべてのコンテンツを見られるようにします。

22) ユーザが処理未了の提出コンテンツ(すなわち、処理は開始されたが何らかの理由でまだ処理が完了していない提出コンテンツ)を見たり完了させたりすることができるようにします。

23) コンテンツ管理者(査読者、編集者、承認者など)が処理待ちの提出物を見られるようにします。

24) 一般にリポジトリの運営機関が提出された資料を管理し公開するためには、コンテンツの配布、およびデジタル保存のためのコンテンツフォーマットの変換、ならびに永続的なコンテンツの保存、の3つの行為に対する取消不能で包括的かつロイヤルティ不要なライセンスを、資料提供者がリポジトリ運営機関に与えることを必要とします。

25) 運営機関がコンテンツの保存および配布のための諸権利を提供者に求める機能をコンテンツ登録処理の一部として組み込むことを可能にします。コレクションやユーザにより異なる可能性のある複数のライセンス条項をサポートするシステムもありますし、そのようなライセンス条項をシステムの外部で処理させるシステムもあります。

26) 運営機関が特定のライセンス条項を各提出コンテンツと一緒に格納できるようにします。ライセンス条項は時がたてば、あるいはコンテンツの種類が変われば変化するかもしれませんが、この機能は各提出物にどのライセンス条項を適用するかを明確にします。

27) リポジトリの管理者がリポジトリの利用や選択を追跡できるようにします。この機能はシステムの性能設計を容易にし、機関の資源配分や予算確保の問題を支援します。

28) あらかじめ登録した、あるいは設定変更可能な利用報告書はシステムが出力する利用統計の有用性を増すことができます。

29) 運営機関が既存のデジタル図書館やその他のデジタル資料をリポジトリに取り込めるようにします。

30) リポジトリが既存のデジタルコレクションのメタデータを取り込めるようにします。

31) 機関リポジトリにおいては、システムにより管理されるコンテンツはシステムそれ自体より長生きし、新しく開発される技術に移行されていくだろうということが明らかに予測されます。この機能はコンテンツをシステムからエクスポートする方法を示しています。

32) この機能はシステム管理者が提出コンテンツのフォーマットを承認された種類に限定できるようにします。この機能はリポジトリが(運営方針上)受け入れる用意のあるデジタルフォーマットを示すことができるようにします。システムが(技術的に)対応可能なフォーマットを示すためのものではありません。この機能は、リポジトリがコンテンツへのアクセスとコンテンツの保存を保証するために策定した運営方針の実行を支援します。

33) システムが入力できるデジタルフォーマットを示しています。(機関の運営方針でサポートすると決定したフォーマットではありません。)

34) ユーザが1つの提出物の一部として複数のファイルやファイル種別を提出できるようにします。たとえば、研究報告書に対応するデータ集をつけたり、会議の報告書に会議で使用したOHP資料をつけたりすることができます。

35) この項目はシステムが格納し、あるユーザインターフェースの下で検索可能にできる提出コンテンツに関するメタデータの範囲を示しています。OAIプロトコルは限定子なしのダブリンコアメタデータを収集します。ここに示したシステムはすべてこの基本的なダブリンコアをサポートしており、そのため、これらのシステムを使用するリポジトリをまたぐ検索を可能にしています。

36) 最低限の要件としての限定子なしのダブリンコアでは多くの機関リポジトリのコレクションを詳細に記述するには不十分です。そのため、OAIプロトコルではダブリンコアに加えて、他のメタデータセットを使用できるようにしています。これにより、リポジトリは特定のコレクションやコンテンツタイプ専用のメタデータを公開できます。特定分野に固有のメタデータや保存用メタデータ、諸権利向けのメタデータなど、その他のメタデータ規格をサポートする(あるいはサポートを計画している)システムがあります。

37) メタデータの収集を効率的に行うために、リポジトリはシステムに保存するメタデータの品質コントロールプロセスを確立したり、最低限度の品質水準を設けたりしなければなりません。これは著者に自分で論文を保存させたり、メタデータを提出させようと考えているリポジトリには特に重要です。この機能はメタデータ承認プロセスを提供します。この機能によりメータデータを公開する前に査読、修正、向上、承認することができます。

38) 運営機関がリポジトリのメタデータをXMLなどの構造化フォーマットでエクスポートできるようにし、後継システムへの移行を容易にします。

39) リポジトリ管理者がリポジトリ全体からメタデータを収集するOAIハーベスタの機能を「止める」ことができるようにします。これは事実上リポジトリの相互運用性を無効にするものです。

40) リポジトリ管理者がメタデータ入力を簡単にするためにメタデータフィールドにデフォルト値を設定できるようにします。たとえば機関フィールドにデフォルト値として運営機関名を設定する(Institution="ペンシルバニア大学")ことができます。

41) 運営機関がAPIを使用したりスクリプトを変更したりすることによりインターフェースの見た目を変更できるようにします。

42) ユーザがシステムに設けた個人用のドキュメントフォルダにリポジトリのコンテンツを保存できるようにします。

43) システムがリポジトリ内にディスカッションフォーラムを持てるようにします。

44) この項目はシステム内部の検索ソフトウェアやプレゼンテーション層のソフトウェアを指しています。システム外部のサービスプロバイダやサーチエンジンは対象としていません。検索エンジンを持たないシステムにはオープンソースの検索ツールを付加する方法を提供しているものもあります。

45) ワイルドカード(たとえば、*で任意の複数文字、?で任意の1文字を表す)が使用できます。

46) 検索が単語の語幹にヒットする結果を返すようにします。たとえば、検索語「land」は「landed」「landing」「lands」などにもヒットします。

47) ユーザがメタデータの定義された全フィールドを検索できるようにします。

48) ユーザがメタデータフィールドを指定して検索できるようにします。たとえば、「タイトルフィールド」と「著者フィールド」のみを検索する、というように。

49) サーバを正しく指定すればGoogleや他のインターネットサーチエンジンからシステムが検索できるかどうかを示します。

50) ドキュメントに対する永続的命名はリポジトリが参照引用やその他のリンクに影響を与えることなくシステムの検索メカニズムを変えたり、コンテンツを物理的に動かしたりすることを可能にします。この永続的識別子はたとえリポジトリのコンテンツが新しいシステムに移行しても、あるいは、リポジトリの管理責任が第三者に譲渡されても、有効であり続けます。

51) CNRIハンドルシステムは機関リポジトリが上で述べた(20.0項参照)継続性と永続的命名を実現できるようにします。ハンドルシステムプロトコルは分散されたコンピュータシステムがデジタルリソースのハンドルを保存し、ハンドルからリソースの場所やアクセス法を解読できるようにします。各ハンドルに付随する情報はハンドル自体を変えることなくハンドルを付与されたリソースの現状に合わせて変更することができます。このように、アイテムの名前(ハンドル)は参照引用やリンク同様、保存場所やその他の状態情報が変化しても永続的に変わりません。

52) システムの中には提出された資料の長期保存を容易にする機能を含むものがあります。これは重要な機能と考えられます。なぜなら、電子リソースのライフサイクルの早い時期に手を打っておけば将来的には保存に対する経費や技術的な問題を軽減できることを保存に関する最良事例が示唆しているからです。しかしながら、デジタル保存プログラムを成功させるには絶え間ない運営方針の練り直しや資金、保存支援機能をサポートする計画も必要となります。なお、これらの機能がないからといってデジタル保存ができないと結論づけるべきではありません。

53) 保存メタデータには保存を決定し行動することを支援する情報、実行した保存行動を記載する情報、保存戦略の効果を記録する情報およびデジタルリソースの信頼性を長期にわたって保証するためにコレクション管理や諸権利の管理を記述した情報を格納します。

特定のシステムに関する注記

CDSwareに関する注記

1) システム要件はコレクションの規模、想定されるユーザ数、使用するデータベースなどによります。

2) CDSwareは独自の索引化技術および検索エンジンを使用します。

3) 独自にシステムに新しい機能を追加したい場合にのみ必要です。

4) CERNはCDSwareパッケージのインストール・ダウンロードをすべて追跡しているわけではないので、正確な数は不明です。

5) スイス(3)、フランス、ドイツ、イタリア、アメリカ。

6) APIとコマンドラインインターフェース。

7) 必須ではありません。

8) 複数のコレクションを1つの仮想コレクションに見せる(「水平ビュー」)ことも、(任意のツリー形態で)コレクションを階層的に構築することもできます。

9) 設定変更可能です。

10) 幅広いオプションがあります。http://doc.cern.ch/EDS/current/guide/english/を参照してください。

11) Webalizerのようなサードパーティのツールを使用します。

12) ドキュメントをPDFに自動変換するためにCERN変換サーバをCDSwareに組み込むことができます。(http://doc.cern.ch/Convertを参照してください。

13) コレクションのホームページもカスタマイズが可能です。

14) 次のリリースに向けて開発中です。

15) web検索を可能にするためにファイルに保存されるHTMLフォーマットのCDSwareレコードはその場で自動作成することも、事前に処理して作成することもできます。

16) PDFフォーマットへの自動変換。

17) Marc21規格

DSpaceに関する注記

1) DSpaceの推奨ハードウェア構成はhttp://dspace.org/what/dspace-hp-hw.htmlを参照してください。

2) DSpaceは、MacOSおよびWindowsはもちろん、複数のUNIXプラットフォーム(Linux, hp/ux, Solarisなど)上でテストされています。

3) DSpaceを使用している機関ではDB2、MySQL、Oracleを含むさまざまなデータベースシステムを試みています。

4) DSpaceはApacheとTomcatを付けて配布していますが、任意のwebサーバおよびjavaサーブレットエンジンで作動します。JBossなどでもテストされています。

5) 10のCDSpace実装システムが世界中で稼働中です。さらに100をこえる構築が世界中で進行中です。

6) 更新スクリプトは若干の手直しが必要です。

7) 主要なモジュール毎にあります。

8) 圧縮ファイルをアップロードしますが、解凍はしません。

9) METSを開発中です。

10) プログラムが若干必要です。

11) GoogleあるいはカスタマイズしたLucenceを実装することにより可能です。

12) SourceForgeシステムを利用します。

Eprintsに関する注記

1) ほとんどのUNIX環境で作動するよう設計されています。

2) Apache 2.0対応を開発中です。

3) Javascriptは使用しません。CSSのサポートが望ましいですが必須ではありません。

4) Perlプログラマが必要か否かは必要なカスタマイズの量によります。

5) v2稼動中が88、v1.1稼動中が18です。

6) イギリス、アイルランド、インド、イタリア、ブラジル、オーストラリア、アメリカ、カナダ、フランス、オーストリア、スウェーデン、ドイツ、スロベニア。

7) 更新スクリプトは、設定ファイルに若干の手直しが必要です。

8) ページテンプレート、emailアドレス、ヘルプページ、検索ページに加えた変更を上書きすることなくシステムを更新することができます。

9) たとえばLDAPのような他のシステムを使用するように変更することができます。

10) ファイルの状態はSQLデータベースに格納されます。

11) デフォルト値です。登録処理の役割は変更も追加もできます。

12) この機能を提供するように設定できるかもしれません。

13) 計画中です。

14) デフォルトのフォーマットはPostscript, PDF, ASCIIテキストファイル, HTMLです。

15) (システムパフォーマンスを改善するための)バッチ処理を実験中です。

16) プログラムを若干必要とします。

17) サードパーティのツールを使用します。

18) フルテキスト検索は開発中です。Eprints.orgは今のところシステム内部にフルテキスト検索機能を持っていませんが、この機能を補足するフルテキストエンジンがいくつかのEprintsインストールシステムに組み込まれています。たとえば、インドのBangaloreにあるインド科学研究所(IISc)(http://eprints.iisc.emet.in/)はGreenstoneデジタルライブラリーオープンソースソフトウェアをフルテキスト検索用に組み込んでいます。また、Archive SIC (Archive Ouverte en Sciences de l'Information et de la Communication)ではhtdig検索エンジンを組み込んでいます。(http://archivesic.ccsd.cnrs.fr/search.htmlを参照)

19) 現在のところ複数形のためのステミングのみを提供しています。完全なステミング検索を開発中です。

20) デフォルトとしては設定していませんが、機関指定のメタデータに基づいてシステム管理者により設定可能です。

21) システム管理者はソートフィールドを選択できます。検索結果は任意の標準的フィールドでソートできます。

i-Torに関する注記

1) インストールをするために推奨されます。

2) i-Torは運営機関がJavaを使ってインターフェースの一部の外見を変更できるようにしています。(たとえば検索結果のためのカスタムビューの作成など)

3) 2003年12月公開を計画中です。

4) IPによる認証はサポートしません。

5) i-Torは運営機関に必要なワークフローを設定するツールを提供するよう設計されていますが、システム自体に含めるワークフローは設計していません。

6) サードパーティのソフトウェアであるAnalogを使用します。

7) i-Torではデータを研究者のホームページから直接収集できます。個々の研究者のホームページが適切に保守されていれば、リポジトリを定期的に更新する必要はなくなります。

8) 計画中です。

9) 機関指定のメタデータに基づいてシステム管理者により設定可能です。

10) 開発中です。

MyCoReに関する注記

1) 計画中です。

2) システム要件はコレクションの規模、想定されるユーザ数、使用するデータベースなどによります。

3) オープンソース環境: JDBC準拠のRDBMS(MySQLとPostgreSQLはテスト済)。XML:DB準拠のデータベース(Apache Xindice, eXist, Tamino)。商用環境: IBM Content Manager with IBM DB2。

4) TomcatとWebsphereをテスト済です。

5) ユーザインターフェースのレイアウトを変更するにはXSLの知識が必要です。

6) MyCoReの基礎となった前身のMILESSのインストール数は10。非公式のMyCoReテストサイトが5。

7) CVS(Concurrent Versions System)を使って可能です。

8) 設定変更可能です。

9) 設定変更可能です。MyCoReにはプログラムに直接書き込んだメタデータモデルはありません。システムは例として限定子付きのダブリンコアを提供していますが、ユーザは必要に応じてデータモデルを定義したり設定したりすることができます。

10) Luceneの使用を計画中です。限定されたテキスト検索機能がMyCoReが使用しているXML:DB APIにより与えられています(たとえば、オブジェクトのアブストラクトや記述内容の検索)。