![]() |
Open Archives Initiative Object Reuse and Exchange |
![]() |
オープン・アーカイブズ・イニシアティブのオブジェクトの再利用と交換(OAI-ORE)プロジェクトは、Webリソースの集合体を記述、交換するための標準を定義する。本文書は、これらの標準の基礎となる抽象的なデータモデルの手短な概要を提供する。データモデルは [Data Model] で詳細に記述されている。本ユーザガイドは、OAI-ORE仕様書およびユーザガイドを構成する文書の1つである。
OREモデルは、Webリソースの集合体に実体を関連付け、その構造とセマンティクスの記述を可能にする。OREモデルでは、リソースマップ(ReM)を導入することによりこれを実現している。ReMとは、URI(ReM-1
と呼ぶ)で識別されるリソースであり、一連のRDF記述をカプセル化したものである。これらの記述はURIを持つ1つのリソースとして集合体を実体化し、集合体の構成要素と構成要素間の関係、Web上における集合体のコンテキストを列挙する。OREモデルは様々なフォーマットでシリアル化することができ、OREモデルの概念との対応付けと共に姉妹編のORE文書で記述される予定である。最初のシリアル化はAtomによる [ORE Atom User Guide、ORE Atom Profile] 。直接RDFによるシリアル化も [Representing Resource Maps Using RDF Syntaxes] に記述されている。
OREモデルはWebアーキテクチャ [Web Architecture] を基本としている。Webアーキテクチャでは情報の単位はリソースと呼ばれ、URIで識別される。一部のURIは、HTTPなどの一般的なプロトコルに基づいており、逆参照することにより表現(Representation)を得ることができる。本文書ではこのようなURIをプロトコルベースのURIと呼ぶ。また、OREモデルはRDFのトリプル(triple)を使って、述語(関係)を介した主語となるリソースと目的語となるリソースまたはリテラルとの関係を記述する。トリプルの例は(N3形式で)次のようなものである。
# リソースURI-1は型T-1を持ち、Joe Bloggsにより作成された <URI-1> rdf:type <T-1>. <URI-1> dc:creator "Joe Bloggs".
これは、リソース URI-1
がURI T-1
で示される型を持ち、Joe Bloggs
により作成されたことを意味している。OREモデルは様々な語彙の述語を使用するが、本文書では次の名前空間プリフィックスを使用する。
プリフィックス | 名前空間URI | 記述 |
---|---|---|
dc |
http://purl.org/dc/elements/1.1/ |
ダブリンコア要素 |
dcterms |
http://purl.org/dc/terms/ |
ダブリンコア用語 |
ore |
http://www.openarchives.org/ore/terms/ |
ORE語彙用語 |
owl |
http://www.w3.org/2002/07/owl# |
OWL語彙用語 |
rdf |
http://www.w3.org/1999/02/22-rdf-syntax-ns# |
RDF語彙用語 |
リソースマップ(Resource Map)は、リソースの集合である集合体(Aggregation)、および、それらの型とリソース間の関係を記述する。集合体に含まれるリソースは集合リソース(Aggregated Resources)と呼ばれる。
Web上で集合体について語れるようにするために、集合体はURIを持たなければならない(A-1
と呼ぶ)。OREモデルは集合体とリソースマップの間に一対一の対応を要求する。このReM-1とそれに対応するA-1の一対一の関係は構文的に強制される。集合体のURI、A-1はリソースマップのURI、ReM-1にフラグメント識別子を付加することにより構成されなければならない。フラグメント識別子は文字列 #aggregation
でなければならない。たとえば、URI http://sample.org/ReM-1
で公開されているリソースマップは集合体 http://sample.org/ReM-1#aggregation
を記述する。
リソースマップはプロトコルベースのURI、ReM-1で識別されるリソースの表現として取得される。次の図は、主語となるリソースから目的語となるリソースまたはリテラルに引かれた矢印で示されている記述を持つ完全なリソースマップを示している。この節では、このグラフの構成要素を順番に説明する。
リソースマップは ReM-1
で識別される。ReM-1
に対するHTTPのGETリクエストによりリソースマップのシリアル化が得られなければならない。また、ReM-1
は図ではノードで示されており、いくつかのトリプルの主語になっていることにも注意されたい。第1に、リソースマップの型、集合体の型、リソースマットからそれが記述する集合体へのリンクを提供するトリプルが存在しなければならない。
# 必須, ReM-1 はリソースマップ(T-1で示されている)である <ReM-1> rdf:type ore:ResourceMap. # 必須, A-1 は集合体(T-2で示されている)である <A-1> rdf:type ore:Aggregation. # 必須, ReM-1 は A-1 を記述する <ReM-1> ore:describes <A-1>.
リソースマップに関するいくつかのメタデータは必須であり、オプションとしてその他のメタデータを表すことができる。
# 必須: ReMの作成者と変更時間 <ReM-1> dc:creator "Joe Bloggs". <ReM-1> dcterms:modified "2007-10-15T00:00:00Z". # オプション: ReMに付随する権利とReMが最初に作成された時間 <ReM-1> dc:rights <http://creativecommons.org/licenses/publicdomain/>. <ReM-1> dcterms:created "2007-10-15T00:00:00Z".
集合体が他の識別子を持つ情報オブジェクトであることを示す場合は、述語 ore:analogousTo
を使って表現する。
<A-1> ore:analogousTo <DOI-1>.
集合体が別のURIでも識別される特別な場合は、owl:sameAs
を使用しても良い。
すべての集合リソースは述語 ore:aggregates
で集合体とリンク付けされる。
<A-1> ore:aggregates <AR-1>. <A-1> ore:aggregates <AR-2>. <A-1> ore:aggregates <AR-3>.
ここまでは、集合体は、集合体の構成要素であるという点を除いては互いに関係のないリソース AR-1、AR-2、AR-3
の単なる入れ物に過ぎない。リソースマップは、集合体と集合リソースの内的関係を表現することにより集合体の構造を記述することもできる。たとえば、
# R-1で示されている <AR-2> dc:hasFormat <AR-3>.
最後に、リソースマップは次の2種類の外的関係を含めることができる。(1) 述語 rdf:type
を使って、集合体または集合リソースにセマンティクな型を関係付けることができる。(2) 他のリソースとの関係における集合体のコンテキストは任意の語彙の述語を使って表現することができる。この場合、主語または目的語のいずれかは集合体または集合リソースである。
# A-1は型T-4(おそらく雑誌論文)を持ち、リソースAの一部である。 <A-1> rdf:type <T-4>. <A-1> dcterms:isPartOf <A>. # AR-1はB(おそらく別の論文)を参照し、AR-3はテキスト型である <AR-1> dcterms:references <B>. <AR-3> rdf:type <http://purl.org/dc/dcmitype/Text>.
リソースマップとそれが記述する集合体を再利用する際には、これら2つの概念を区別することを忘れないことが重要である。ReM-1
に関する記述はリソースマップに関する記述であり、集合体に関する記述ではない。すなわち、A-1
(= ReM-1#aggregation
)に関する記述は集合体である知的オブジェクトに関する記述である。
集合リソースは2つ以上の集合体(A-1
とA-2
とする)に集められている場合がある。述語 ore:isAggregatedBy
は ore:aggregates
の逆の意味であり、別の集合体のメンバを表現することを可能にする。
# ReM-1の作成者はAR-1がA-1だけでなくA-2にも集められていることを知っている。 <AR-1> ore:isAggregatedBy <A-2>.
A-2
を記述しているリソースマップは、A-2
を逆参照する処理でA-2
のフラグメント識別子部分を取ることにより自然と得られる(A-2
= ReM-2#aggregation
であるのでReM-2
が残る)。
ore:isAggregatedBy
の第2の利用法は、ある集合体が別の集合体の集合リソースとなるネスティングを示すことである。 A-1
がある巻号(集合体A-3
)に掲載された雑誌論文であると仮定する。この状況は、次のトリプルを持つReM-1
で表すことができる。
# ReM-1は、集合体A-1がA-3により集められていることを示す <A-1> ore:isAggregatedBy <A-3>.
本文書は、オープン・アーカイブ・イニシアティブの成果です。OAIオブジェクトの再利用と交換プロジェクトへは、アンドリュー・M・メロン財団、Microsoft社、全米科学財団から資金をご提供いただいています。さらに、ネットワーク情報連合からもご支援をいただいています。
本文書は、OAI-ORE技術委員会(ORE-TC)の会議に基づいています。会議にはOAI-OREリエゾングループ(ORE-LG)も参加しています。ORE-TCの委員は、次のとおりです。Chris Bizer(ベルリン自由大学)、Les Carr(サウサンプトン大学)、Tim DiLauro(ジョンホプキンス大学)、Leigh Dodds(Ingenta)、David Fulker(UCAR)、Tony Hammond(Nature出版グループ)、Pete Johnston(Eduserv財団)、Richard Jones(インペリアル・カレッジ)、Peter Murray(OhioLINK)、Michael Nelson(オールドドミニオン大学)、Ray Plante(NCSAおよび国立仮想天文台)、Rob Sanderson(リバプール大学)、Simeon Warner(コーネル大学)、Jeff Young(OCLC)。ORE-LGの委員は次のとおりである。Leonardo Candela(DRIVER)、Tim Cole(DLF AquiferおよびUIUC図書館)、Julie Allinson(JISC)、Jane Hunter(DEST)、Savas Parastatidis(Microsoft)、Sandy Payette(Fedora Commons)、Thomas Place(DAREおよびティルブルグ大学)、Andy Powell(DCMI)、Robert Tansley(Google, Inc.およびDSpace)
また、OAI-ORE諮問委員会(ORE-AC)のご意見にも感謝いたします。
本文書は、Creative Commons Attribution-Noncommercial-Share Alike 3.0 Unported Licenseによりライセンスされている。