ORE仕様書 - 語彙

2008年2月29日

注: 本文書はアルファバージョンであり、常に変更の可能性がある。評価およびコメントを受けるために本文書は一般に公開されている。本仕様書または本仕様書でなされた勧告を実装する場合は、これがアルファバージョンであることを認識した上で行うべきである。コメントはOAI-ORE Googleグループにお願いしたい。
このバージョン:
http://www.openarchives.org/ore/0.2/vocabulary
最新バージョン:
http://www.openarchives.org/ore/vocabulary
前のバージョン:
http://www.openarchives.org/ore/0.1/vocabulary
編集者(OAI役員)
Carl Lagoze, コーネル大学情報科学
Herbert Van de Sompel, ロスアラモス国立研究所
編集者(ORE技術委員会)
Pete Johnston, Eduserv財団
Michael Nelson, オールドドミニオン大学
Robert Sanderson, リバプール大学
Simeon Warner, コーネル大学情報科学

要旨

オープン・アーカイブズ・イニシアティブのオブジェクトの再利用と交換(OAI-ORE)プロジェクトは、Webリソースの集合体を記述、交換するための標準を定義する。本文書は、OAI-OREのコンテキストにおいて対象となる事項を記述し、これらの間の関係を表現するために必要な用語と語彙を解説する。本仕様書は、OAI-ORE仕様書およびユーザガイドを構成する文書の1つである。


目次

1. はじめに
     1.1 表記法
     1.2 名前空間
2. ORE実体
3. 属性
4.
5. 関係
6. その他の語彙
7. 参考文献

付録

A. 謝辞
B. 変更ログ


1. はじめに

本文書の目的は、OAI-OREのコンテキストで使用される概念を記述し、これらの概念を機械が理解可能な形で矛盾なく実装するために必要な技術的語彙を詳細に記述することである。

ガイドラインでは、OREモデルに特定しない基本的な用語についてはできるだけ既存の語彙を再利用することを原則とした。そのため、本文書で取り上げる事項の多くは他の情報源から採用した。詳細については参考文献を見ていただきたい。特に、ダブリンコア・メタデータ・イニシアティブ [DCMI] とRDF(Resource Description Framework) [RDF] は中心となる定義を数多く提供している。

一連の仕様書がこの分野における過去・未来の作業と調和するように、できるだけWorld Wide Web [Web Architecture] のアーキテクチャおよび用語に従った。

必要とされる語彙には主に次の4種類がある。

実体(Entities)
OAI-OREのコンテキストにおいて対象となる中心的なオブジェクト
属性(Properties)
実体を記述する情報
型(Types)
実体の意味上の、または物理的な型
関係(Relationships)
実体間に存在する関係

OREのコンテキストにおけるオブジェクトを記述するために必要な、または望ましい概念に利用できる語彙は既に数多く重複して存在するので、以下では、OAI-OREデータモデルを実装するために必要な中心的な語彙のみを記述する。本文書では、主にリソースマップと集合体に焦点を絞る。これらはOREのコンテキストにおける中心的なオブジェクトであるからである。各ドメイン固有の語彙は、対象のコミュニティにより作成されるべきである。そして、使用と実装を通じて形成される合意に基づいて、各ドメイン共通の用語や勧告が将来本文書や関連するベストプラクティス文書に組み込まれることになるだろう。したがって、現段階において本文書は基本的な用語のみを含める。

1.1 表記法

本文書におけるキーワード「しなければならない(MUST)」「してはいけない(MUST NOT)」「必須とする(REQUIRED)」「とする(SHALL)」「とはしない(SHALL NOT)」「べきである(SHOULD)」「べきでない(SHOULD NOT)」「推奨する(RECOMMENDED)」「できる(MAY)」「オプションである(OPTIONAL)」は、RFC 2119 [IETF RFC 2119] に記述されているように解釈されるものとする。

1.2 名前空間

本仕様書では、次の名前空間とそれを示すプリフィックスを使用する。

プリフィックス 名前空間URI 記述
dc http://purl.org/dc/elements/1.1/ ダブリンコア要素 [DC Elements]
dcterms http://purl.org/dc/terms/ ダブリンコア用語 [DC Terms]
dcmitype http://purl.org/dc/dcmitype/ ダブリンコア型 [DC Types]
ore http://www.openarchives.org/ore/terms/ ORE語彙用語
rdf http://www.w3.org/1999/02/22-rdf-syntax-ns# RDF語彙用語 [RDF Vocabulary]
rdfg http://www.w3.org/2004/03/trix/rdfg-1/ 名前付きRDFグラフ語彙 [RDFG]
rdfs http://www.w3.org/2001/01/rdf-schema# RDFスキーマ語彙 [RDF Vocabulary]

2. ORE実体

集合体(Aggregation)
その集合を1つのリソースとして扱うことができるように集められた関連するリソース(集合リソース)の集合。これは、ORE相互運用フレームワークにおいてリソースマップにより記述される実体である。
  • 名前: ore:Aggregation
  • 上位クラス: dcmitype:Collection
  • 型URI: http://www.openarchives.org/ore/terms/Aggregation

リソースマップ(Resource Map)
OAI-OREデータモデルによる集合体の記述。リソースマップは実装ガイドラインにしたがってリソースマップ文書として機械可読形式にシリアル化される。リソースマップは、型情報を含むことができる。また、関係情報を含むことができる
  • 名前: ore:ResourceMap
  • URI: http://www.openarchives.org/ore/terms/ResourceMap
  • 上位クラス: rdfg:Graph

3. 属性

実体の必要不可欠な属性。これらは関係として表現することができるが、通常、その関係の目的語は別のリソースではなくリテラルである。

Creator(作成者)
実体の作成に責任を負うエージェント。これは文字列リテラルまたはエージェントを識別するURIである。エージェントは、ソフトウェア(たとえば、リソースマップはリポジトリソフトウェアのメタデータ変換機能により自動的に作成されるだろう)の場合もあれば、原作者としての責任を負う個人の場合もある。URIの使用が推奨されるが、これが常に可能であるわけではないことは理解されている。
  • 名前: dc:creator
  • URI: http://purl.org/dc/elements/1.1/creator

  • リソースマップは、作成者を持たねばならない。グラフベースのモデルの用語で言えば、作成者はリソースマップに書かれている記述を表明するエージェントである。
例:
URI-R dc:creator "mailto:azaroth@liverpool.ac.uk"
URI-R dc:creator "Rob Sanderson"

Created Time(作成日時)
作成者が実体を作成した時点。これはISO8601形式の文字列リテラルでなければならない
  • 名前: dcterms:created
  • URI: http://purl.org/dc/terms/created

  • リソースマップは、作成日時を持たねばならない
例:
URI-R dcterms:created "2007-10-11T11:30:00Z"

Last Modified Time(最新更新日時)
実体が最も最近に更新された時点。これはISO8601形式の文字列リテラルでなければならない
  • 名前: dcterms:modified
  • URI: http://purl.org/dc/terms/modified

  • リソースマップは、最新更新日時を持たねばならない
例:
URI-R dcterms:modified "2007-10-12T14:00:00Z"

Rights(権利)
リソースに含まれる、および課せられた権利に関する情報。これは自由記述のテキスト属性であり、機械により理解されることは期待されない。しかし、該当する場合はクリエイティブコモンズライセンスのURIにすることを推奨する。これは集合リソースリソースマップ全体の再利用性を議論する際に使用されるだろう。
  • 名前: dc:rights
  • URI: http://purl.org/dc/elements/1.1/rights

  • リソースマップは、権利記述を持つことができる
例:
URI-R dc:rights http://creativecommons.org/licenses/by-nc-sa/2.5/
URI-R dc:rights "This resource map is free for non-commercial use"

4. 型

ORE語彙仕様書は、OREデータモデルに欠かせない型付けのみを記述する。そのような全ての型付けは上で定義したORE実体rdf:type 関係を使用する。将来の仕様書ではORE固有の型以外の型の勧告を含むことになるだろう。

例:
URI-R  rdf:type ore:ResourceMap
URI-A  rdf:type ore:Aggregation

5. 関係

Aggregates(集める)
集合体は、その名のとおりリソースを集めている。したがって、集合体とその集合リソース間のこの関係は、たとえば dcterms:hasPart で表されるような単純な部分と全体の関係よりも個別具体的なものである。 例:
URI-R#aggregation ore:aggregates URI-AR-1

Is Aggregated By(により集められる)
ore:aggregates の逆の関係である ore:isAggregatedBy は、ある集合リソースがある集合体により集められていることを表明する。この関係の想定使用法は、あるリソースが別のリソースマップにも集められていることをリソースマップが表明できるようにすることであり、それにより発見や来歴を容易にすることである。 例:
URI-AR-1 ore:isAggregatedBy  URI-R-2#aggregation 

Describes(記述する)
リソースマップは様々な詳細レベルで集合体を記述する。この関係は、主語(リソースマップ)が目的語(集合体)を記述していることを表明する。この関係は、リソースマップ(グラフ)を集合体(リソースのコレクション)に明示的にリンクするので、不可欠なものである。 例:
URI-R ore:describes URI-R#aggregation

Analogous To(に似ている)

この関係の主語は集合体でなければならない。この集合体はOREのコンテキストではこの関係の目的語の表現であると考えられるべきである。なぜなら、それは広義にはそのリソースと同等なものだからである。たとえば、集合体が全体としてDOIが付与された1つの雑誌論文を形成する複数のリソースからなる場合がある。集合体はDOIが付与されるた論文ではないが、ある意味その代理物である。

意味的には、この関係は owl:sameAs と rdfs:seeAlso の間に位置する。owl:sameAs は主語と目的語が他の関係においても交換可能であるという属性を持つ。したがって、集合体の作成時間とそれに相当する論文の作成時間が異なる場合に使用するのは適当でない。一方、rdfs:seeAlso は「主語に関する追加情報を提供するかもしれないリソースを指定する」(強調は本文書が追加)ものであり、ここでの目的とする関係にとっては弱すぎる。


例:
URI-R#aggregation ore:analogousTo info:doi/10.1045/february-2006-smith

Type(型)
オブジェクトの性質または意味上のクラス。オブジェクトは雑誌論文である、またはソフトウェアである、がその例である。オブジェクトはクラスでなければならないが、使用するクラスはドメインにより異なるだろう。
例:
URI-R rdf:type ore:ResourceMap

6. その他の語彙

他にも多くの語彙が存在し、ドメインに有益な用語を含んでいる。集合リソースを包括的に記述するためには、他の語彙の使用が必要になることはほぼ確実である。たとえば、本語彙文書では、OAI-ORE固有のクラス以外は、rdf:type を使ったセマンティックな型付けのためのクラスを規定も推奨もしていない。その代わり、関心を持つコミュニティがプロファイル文書を作成し、コミュニティの要件を正確に満たすために本文書で規定した語彙と合わせて使用されるべき属性、関係、クラスを指定することを推奨する。

7. 参考文献

[DCMI]
Dublin Core Metadata Initiative
[DC Elements]
Dublin Core Metadata Elements, DCMI Recommendation, 18 December 2006
[DC Terms]
DCMI Metadata Terms, DCMI Usage Board, 18 December 2006
[DC Types]
DCMI Types, DCMI Usage Board, 18 December 2006
[RDF]
RDF Primer, F. Manola, E. Miller, Editors. W3C Recommendation, 10 February 2004
[RDFG]
Named Graphs, Jeremey Carroll, 29 November 2004
[RDF Vocabulary]
RDF Vocabulary Description Language 1.0: RDF Schema, Dan Brickley and R.V. Guha, Editors. W3C Recommendation, 10 February 2004
[RFC 2119]
IETF RFC 2119: Key words for use in RFCs to Indicate Requirement Levels, S. Bradner, March 1997
[Web Architecture]
Architecture of the World Wide Web, Volume One, I. Jacobs and N. Walsh, Editors, World Wide Web Consortium, 15 January 2004.

A. 謝辞

本文書は、オープン・アーカイブ・イニシアティブの成果です。OAIオブジェクトの再利用と交換プロジェクトへは、アンドリュー・M・メロン財団Microsoft社、全米科学財団から資金をご提供いただいています。さらに、ネットワーク情報連合からもご支援をいただいています。

本文書は、OAI-ORE技術委員会(ORE-TC)の会議に基づいています。会議にはOAI-OREリエゾングループ(ORE-LG)も参加しています。ORE-TCの委員は、次のとおりです。Chris Bizer(ベルリン自由大学)、Les Carr(サウサンプトン大学)、Tim DiLauro(ジョンホプキンス大学)、Leigh Dodds(Ingenta)、David Fulker(UCAR)、Tony Hammond(Nature出版グループ)、Pete Johnston(Eduserv財団)、Richard Jones(インペリアル・カレッジ)、Peter Murray(OhioLINK)、Michael Nelson(オールドドミニオン大学)、Ray Plante(NCSAおよび国立仮想天文台)、Rob Sanderson(リバプール大学)、Simeon Warner(コーネル大学)、Jeff Young(OCLC)。ORE-LGの委員は次のとおりである。Leonardo Candela(DRIVER)、Tim Cole(DLF AquiferおよびUIUC図書館)、Julie Allinson(JISC)、Jane Hunter(DEST)、Savas Parastatidis(Microsoft)、Sandy Payette(Fedora Commons)、Thomas Place(DAREおよびティルブルグ大学)、Andy Powell(DCMI)、Robert Tansley(Google, Inc.およびDSpace)

また、OAI-ORE諮問委員会(ORE-AC)のご意見にも感謝いたします。

B. 変更ログ

日付 編集者 記述
2008-02-29 sanderson パブリックアルファ0.2のリリース
2007-12-10 sanderson パブリックアルファ0.1のリリース
2007-10-15 sanderson アルファ版をORE-TCに提出

Creative Commons License
本文書は、Creative Commons Attribution-Noncommercial-Share Alike 3.0 Unported Licenseによりライセンスされている。