英国のリポジトリをリンクする

機関リポジトリおよびその他のデジタルリポジトリを対象とする
リポジトリ横断型のユーザー指向サービスを支援する技術・組織モデル

調査研究報告書

Alma Swan(キー・パースペクティブ有限会社)
Chris Awre(ハル大学)

プロジェクト参加機関:
キー・パースペクティブ有限会社
ハル大学
ノッティンガム大学 SHERPA
サウサンプトン大学電子工学・計算機科学科


報告書概要

JISCは、デジタルリポジトリ横断型のユーザー指向サービスを支援する持続可能な技術モデルおよび組織モデルの特定を目的とする調査研究を行うよう本プロジェクト参加機関に委託した。この研究に特に関連するものとして、英国の成人教育・高等教育コミュニティで関心がもたれているオープンアクセスリポジトリが挙げられていた。本研究は、リポジトリへのアクセスと利用を支援する戦略に情報を提供すること、および、全国レベルのリポジトリサービスの基盤ないしは枠組みを確立するための視点を提供することを目的とするものである。

ユーザーの要求と既存の研究からの経験

対象となるユーザーとその要求は次のようにまとめられる。

利用者の要求分析に基づいて、リポジトリサービスの全体的枠組みを構築した。この枠組みには、3つの主要レベルに位置するサービスが含まれている。受入レベルのサービスは、リポジトリ管理者やデポジットするユーザーの技術上・処理上の要求を満たすものである。コンテンツアグリゲータレベルのサービスは、メタデータの作成・品質向上サービスとそれに付随する技術である。アグリゲータレベルの上に位置する出力レベルのサービスは、各専門分野独自の要求を満たす保存、研究評価とモニタリング、資源発見、出版、オーバーレイジャーナル、メタ分析、(橋渡しサービス)をリポジトリのコンテンツを利用して提供するものである。

過去に行われた、あるいは現在行われている研究や専門家の意見から、英国のリポジトリをリンクする枠組みに関する数多くの重要な教訓や識見が得られた。その主なものは次のとおりである。

受入レベル: 技術的能力は、機関により大きく異なる。これは、リポジトリが提供するメタデータの品質、リポジトリレベルで行われている保存活動、コンテンツを捕捉するシステムが大きく異なるからである。リポジトリが有するコンテンツの量もまた大きく異なっている。研究論文プレプリントの登録件数を上げるには、著者コミュニティへの広報宣伝活動が極めて重要である。この点において、知的財産権と著作権は依然として大きな躓きの石となっている。これらの障害物の中には、リポジトリの成長を模索する管理者のやる気を大きく損ねる効果を持つものもある。また、サービスに利用できるオープンアクセス資料の量が依然として少ないことも意味している。

アグリゲータレベル: メタデータの品質———あるいは、メタデータの提供自体———が依然として重要な問題である。本研究で提案する技術モデルは、この点に関する最適なアプローチを説明する(以下を参照)。

出力レベル: 専門分野に特化した資料発見ツールが重要である。ユーザーは様々な方法でリポジトリに至ることができるが、このツールは、具体的な要求を持つユーザーがリポジトリに至るルートを提供するものである。ユーザーがある特定のリポジトリを検索するのは、探している物がそこにあることを知っている場合である。特定の分野や主題を探している場合は、主題ベースのポータルや(動画や学位論文などの)オブジェクト種別でリポジトリコンテンツを集約したポータルを利用するだろう。多くの場合、ユーザーは、Googleやその他のWebサーチエンジンを経由してリポジトリのコンテンツにたどり着くことになる。また、リポジトリ管理者や著者は、Googleやその他のWebサーチエンジンによるコンテンツやリポジトリの公開を評価している。これは国レベルの枠組みにも組み込まれることが望ましい。

英国の全国的にリンク化されたリポジトリ環境のためのサービス候補と組織化モデル

全国的にリンク化されたリポジトリ環境の構成要素とそこで必要とされるサービスの候補は次のとおりである。

受入レベル

データレベル

アグリゲータレベル

出力レベル

最後の項目を除いて、これらの活動は、レベルは様々であるが、全て既存のサービスやプロジェクトで行われているか、現在検討されているものである。ただし、多くの場合、個々別々に限られた分野で行われているか、実証プロジェクトとして行われているかである。そのようなパイロットレベルあるいはプロジェクトレベルの活動を実行可能な全国的枠組みとして必要とされるレベルに拡大するには、慎重な計画とJISCによる強力な指導を必要とすることになる。

最優先のサービスであると認められたものは次のとおりである。

二番目に優先すべきサービスは次のとおりである。

技術モデル

エンドユーザサービスの開発を支援する集約(aggregation)モデルが提案された。このモデルは、望ましい技術アプローチとして先に勧告したオープン・アーカイブズ・イニシアティブのメタデータハーベスティングプロトコル(OAI-PMH)によるハーベスティングの上に構築されている。しかしながら、オープンアクセスリポジトリやその他のリポジトリの潜在的なコンテンツ量の大きさを考えるとOAI-PMHの能力だけでなく、同じ目的を達成するために使用できるかもしれないその他の標準や技術の存在についても詳細に調査する必要がある。

集約は、エンドユーザサービスの基礎としてメタデータと場合によってはコンテンツを同時に提供することにより、サービスが数多くのリポジトリに個別に対応する必要性を無くしている。集約は、この基礎を安定したものにするためにメタデータを強力にコントロールしているが、コンテンツのコントロールに関してはメタデータの提供元であるリポジトリに完全に任せている。定期的な集約により、これを利用するエンドユーザサービスは効率的で最新のアクセスが可能になる。個々のリポジトリの横断サービスに比べて集約が最も価値があるのは、エンドユーザサービスの支援に都合の良いようにメタデータやコンテンツをリファクタリングすることができることである。

メタデータとコンテンツ

リポジトリ横断型のすべてのエンドユーザサービスの肝は、リポジトリが有するデジタルコンテンツに関する高品質のメタデータである。あらゆる形態のメタデータの自動生成はさらなる研究が必要な分野であるが、メタデータが作成されうる場所を特定するための水平思考にもなる。生成は、アグリゲータに公開するための外部メタデータフォーマットの基礎として機能する一方で、可能であればリポジトリが内部的に使用できるベースとなる内容豊富なメタデータレコードの作成につながるべきである。

集約のためにコンテンツを公開することは、メタデータの公開ほどには理解されていない。集約の要件に最も適した技術にするためには、コンテンツを公開する際に我々が望んでいることを正確にモデル化することが必要である。モデル化というアプローチは、アグリゲータやエンドユーザサービスが利用しているものを明確に識別できるように、デジタルコンテンツや関連する構成要素に識別子を付与したり、その粒度を決定したりする際にも重要になる。

リポジトリインターフェース

OPAI-PMHは、リポジトリを横断するアクセスを容易にするためにOAIサービスプロバイダの間で広く使用されている。セットやその他のプロトコルコンテナを使用することにより、OAI-PMHの価値は高まり、サービスプロバイダは提供するエンドユーザサービスに合わせて集約の対象を絞ることが可能になる。RSSやATOMニュースフィードはそれ自体、個々のリポジトリを対象とする小規模な集約であり、RSS/ATOMリーダーは多くのリポジトリからニュースフィードを集めるアグリゲータの役目を果たす。Webクローラは利用可能なWebページ情報を集約し、通常Webサーチエンジンを通じてこれらの情報を提供する。これら2つの代替アプローチは、エンドユーザサービス構築の基礎となる集約を可能にする別のルートを提供するものである。

集約とエンドユーザサービス

集約は、ひとたび作成すればメタデータ生成の基礎の役目を果たすことができ、スケールメリットを生かしてより成功の見込めるオプションを提供できる。通常、集約自体は直接エンドユーザサービスの役目を果たすことはなく、これを基礎とするエンドユーザサービスを実現するための様々なインターフェースを提供している。これには、OAI-PMHやRSS、あるいはWebクローラを通じたさらなる集約のためにデータを再公開することも含めることができる。ただし、エンドユーザサービスにより公開された後も、機能を追加したり、全コンテンツを入手したりするために、常にメタデータ提供元のリポジトリにアクセスできるようにするべきである。

アーキテクチャ上のアプローチ

集約モデルの3つの主要要素は、リポジトリ、アグリゲータ、エンドユーザサービスである。リポジトリとアグリゲータは独立であると思われるが、エンドユーザサービスは通常アグリゲータと密接に関係する。ただし、(Web 2.0アプローチなどを通じて)両者を分離する傾向が高まっている。これら3要素をサービスとして捉え直すことにより、要素の実装方法に最高の柔軟性を与えることができるサービス指向アーキテクチャに近づけることが容易になる。これらの要素を連携させる方法を示す2つの具体的な事例が、aDOReとCORDRAである。両プロジェクトは、できるだけ内容豊富なメタデータを公開して集約を容易にするという考え方とリポジトリ横断型のエンドユーザサービスの開発を推進している。aDOReはCORDRAの概念の多くを実際に実証しており、両者は将来の開発に資することができる。

将来展望

集約モデルの要素間のコミュニケーションは、効果的なエンドユーザサービスの開発にとって極めて重要である。これは、エンドユーザが教育と研究で変化する各自の役割に合わせるために必要な個別化されたサービスの開発を支える根拠となるものである。

リポジトリサービスのためのビジネスモデル

リポジトリサービスは、それにふさわしい様々なビジネスモデルを採用できる。ここでは、5つのモデルを取り上げる。

最も経費がかかるのは、保存サービスとアクセス・認証サービスであると思われる。資源発見サービスとメタデータサービスにかかる経費は中から高程度であろう。リポジトリの提供、ホスティング、デジタル化、利用統計、橋渡し、出版の各サービスは中程度の経費で運用できるだろう。助言、モニタリング、メタ分析、技術移転、主題リポジトリ、暫定リポジトリ、オーバーレイジャーナルの各サービスは、比較的低額の経費で運用可能であると予想される。

勧告

ビジョンを実行に移す方法に関する多くの勧告がJISCに対してなされた。連絡と調整に重点を置いた全体的かつ強力な運営が必要とされる。システムの様々な要素はそれらだけでは効率的な方法で正しい場所に収まることはない。その主な理由は、配分される助成金をシステムのある部分が継続的に必要とするからである。開発を調整する候補として自然なのはJISCである。JISCは望ましい成果に対するビジョンと全体システムを支える公共部門の開発を左右し推進するために必要な資金を持っている。私企業に残すことのできる、あるいは残すべき開発の機会は、全体計画の一部として意見交換をすることができる。

従って、勧告ではJISCが、運営上で強力な役割を果たすこと、必要に応じて研究コミュニティやリポジトリ、サービスプロバイダ候補との連絡窓口を持つこと、これらの活動を調整することを求めている。

さらに、情報がどのように利用されるかについてさらなる研究を行うことが勧告された。その結果により、サービスの開発方法やリポジトリのコンテンツ公開方法に影響を与えるからである。さらなる研究が必要と思われるその他の課題は、メタデータの自動生成と識別子の役割である。集約のための標準として、OAI-PMHに加えてRSSとATOMの採用が勧告された。これらは特定のユーザーコミュニティを対象としたサービスにおいて明確な利点を持っているからである。

JISCに対するすべての勧告は以下の通りである。

  1. 研究コミュニティは、すべての高等教育機関および成人教育機関にリポジトリを確立すること、およびコンテンツの収集を確保するための方針を作成することを促進するよう最大限働きかけるべきである。
  2. リポジトリ管理者との連絡窓口を設けるべきである。また、コミュニティの確立が奨励されるべきである。これには既存のシステムを利用することができる。UKCORRはそれに最もふさわしいものである。また、2つの主要なオープンソースのリポジトリソフトウェア(EPrintsとDSpace)は各々独自のユーザーコミュニティを持っており、この目的を果たすためにも利用することできるだろう。この勧告の目的は、JISCと運用中のすべてのリポジトリとの間に明確で効率的なコミュニケーションシステムを持つことであり、これにより双方向の議論を促進し、開発を可能とすることである。
  3. 同様に、JISCと既存のサービスプロバイダ、あるいはその候補者との連絡窓口も確立するべきである。これにより、協調的で方向性を持った方法によりエンドユーザ指向のサービスを開発することが可能になる。
  4. リポジトリ、アグリゲータ、エンドユーザサービス、仲介サービスの開発は、サービス指向アーキテクチャへ向かうべきである。また、ユーザーの要求に合ったエンドユーザサービスを構築する際の柔軟性を最大化するために集約モデルにおける個別の階層を確立するべきである。
  5. エンドユーザサービスの開発には、これらのサービスにより表面化する情報の利用方法の研究という要素を含んでいる。この研究は、情報を提供することによりサービスの開発を支援し、サービスを通じて公開されたメタデータの提供元であるリポジトリにフィードバックを与えることになる。
  6. 自動的にメタデータを生成するさらなる方法が必要である。関連する技術とツールの研究に早急に取り組むことを勧告する。
  7. その利点と使用を十分理解させるために、識別子、特に配置場所とは独立な識別子とそれに必要なリゾルバシステムにさらに注目することを勧告する。
  8. メタデータとコンテンツを収集する際に使用する標準としてOAI-PMHに加えて、RSSとATOMの使用を検討することを勧告する。これらは、特定のコミュニティを対象とするエンドユーザサービスの開発に役立つ対象を絞ったリポジトリ資源の公開の可能性を提供する。また、Webサーチエンジンによるリポジトリコンテンツの公開をより詳細に検討することにより、既存の公開ルートの評価とこのルートによる公開がリポジトリに与える意味合いの評価を行うことを勧告する。
  9. 将来、アグリゲータやエンドユーザサービスを開発する場合には、当初からリポジトリと連絡を取り、関係を持つことを勧告する。これは、集約モデルの3つの主要要素が開発において互いに孤立しないことと相互運用性が増大することを保証する。また、インフラを共有する仲介者が開発に含まれている場合は、これともコミュニケーションをとるべきである。
  10. 英国のリポジトリを基礎として開発されるリポジトリサービスの構成を最適なものにするためには、システムの一部に引き続き助成金が配分されることが必要なことは当然である。JISCは中長期のスパンでこれを計画する必要がある。

キー・パースペクティブ有限会社 Alma Swan
ハル大学 Chris Awre

2006年6月5日