学術コミュニケーション構成ユニットの発見・利用・再利用のための相互運用性
Herbert Van de Sompel, ロスアラモス国立研究所
Carl Lagoze, コーネル大学
CTWatch Quarterly
2007年8月

1. はじめに

コンピュータおよびネットワーク技術、デジタルデータの捕捉、データマイニング技術の進歩により、ネットワークを基本とする高度協調型でデータ集約的な研究方法が可能になった。この方法は、デジタル技術ではなく主に物理的な技術(紙とインク、声)を基本とする既存の学術コミュニケーションメカニズムに課題を突きつける。

既存システムに対する大きな課題の1つは、学術コミュニケーションの 構成要素の変化である。従来の学術コミュニケーションシステムにおける主要なコミュニケーションユニットは雑誌とそれに掲載された論文である。このシステムは一般に、自然科学や人文科学における雑誌や論文とは異なる種類の研究成果、すなわち、データセットやシミュレーション、ソフトウェア、動的な知識表現、注釈、およびこれらの集合体を扱うことができない。しかし、これらすべては学術コミュニケーションの構成ユニットであると考えられるべきである[1]

もう1つの課題は、学術資料の消費者としてコンピュータエージェント(Webクローラやデータマイニングソフトウェアなど)の重要性が高まってきたことである。従来のシステムが対象とする消費者は一般に人間である。しかし、(雑誌出版を含む)全てのコミュニケーションユニットは、学術資料を発掘(マイニング)・解釈・視覚化して新しいコミュニケーションユニットや知識を生み出すコンピュータアプリケーションがソース資料として利用できるようにならなければならない。

既存システムのさらにもう1つの課題は、学術コミュニケーションを構成する社会的活動の性質の変化である。この社会的活動は伝統的な雑誌や会議録を超えますます拡大している。プレプリントシステムや機関リポジトリ、データセットリポジトリといった最近の現象さえも超え、今や、ブログのような、より非公式かつ動的なコミュニケーションも含むようになっている。学術コミュニケーションは突如としてWeb全体に広がり、従来の出版ポータルだけでなく新たに登場したソーシャルネットワーキングの場にも進出した。そして、より広範なWebソーシャルネットワークと連結するようになった。このコミュニケーション革命に適切に対応するには学術コミュニケーションシステムの抜本的な変革が必要である。

これらの課題に対して必要とされる変革の多くは社会文化的な性格を持っており、この新しい環境において学術レコードを構成するものは何かと言う疑問に直接関係する。これは、登録、認証、啓蒙、保存、褒賞といった学術コミュニケーションに不可欠な機能を新しい環境において如何に再構築するのかという根本的な問題を提起する[2]。これら社会文化的な問題の解決は、ひとつにはネイティブなデジタル学術コミュニケーションシステムを支援する基本的な技術基盤の開発にかかっている。

本稿では、学術コミュニケーションパラダイムの大変革に対処するためのこの新たな基盤の一構成要素となる標準を策定するオープン・アーカイブズ・イニシアティブ(OAI: Open archives Initiative)のオブジェクトの再利用と交換(ORE: Object Re-Use and Exchange)プロジェクトの作業を紹介する。この標準は、新しいタイプの複合型学術コミュニケーションユニットをネットワークサービスやアプリケーションが容易に発見、利用、再利用できるようにするものである。ここで複合型ユニットとは、明確に区別できる情報ユニットの集合体であり、一体化されることにより論理的全体を形成するものである。その1つの例は、章の集合体であるデジタル図書であり、各章はスキャンしたページの集合体である。もう1つの例は学術出版物であり、これはテキストとそれに関連するデータセットやソフトウェアツール、実験を記録したビデオなどの資料の集合体である。OREの目的は、実際の内容や再利用するアプリケーションの種類とは無関係に機械可読な方法で複合型の情報ユニットを表現・参照するメカニズムを開発することである。

2. 複合型情報オブジェクト

現代の研究環境に登場した新たなコミュニケーションユニットは、従来の紙媒体の出版物やそのデジタルバージョン(pdfやLaTeXなど)には直接対応するものがない複合的な性格を持っている。この新ユニットは、セマンティック種別(論文、シミュレーション、ビデオ、データセット、ソフトウェアなど)やメディア種別(テキスト、画像、音源、ビデオ、複合など)、メディア形式(PDF、XML、MP3など)、ネットワークロケーション(様々なリポジトリで様々な要素が公開されている)に従って変化する複数の明確に区別できる構成要素の集合体である。さらに、各集合体は自分を作成した情報システムによって付与された識別子を持っており、これにより学術コミュニケーションの論理ユニットを確立している。以後、本稿ではこの集合体を複合型情報オブジェクト、または 複合型オブジェクトと呼ぶ(図1)。

Figure 1
図 1. 情報システムにより作成された複合型情報オブジェクト

これら複合型オブジェクトはeサイエンスやeスカラシップを構成する基本単位であり、これをサポートすることはサイバーインフラストラクチャにとって不可欠な機能である[3]。例えば、オックスフォード大学のDavid Shottonが率いるバイオインフォマティクス研究グループによるImageWeb [4]の活動では、出版社や研究機関、博物館、機関リポジトリに所蔵されている細胞の画像を統合する、いわゆるイメージ・ウェブの作成を研究している。また、人文学の主導的研究者であるGregory Craneは、組み換え文書(recombinant documents)という概念を構想している[5]。これらの文書は、複合型文書と物理的な文書やその初期デジタル版とを区別する数多くの機能を持っている[5]。これらの文書は新しい情報と既存の高精細度のデジタル情報の集合体を形成する。集合体は、例えば、いわゆる研究ワークベンチで作業した結果として人間が作成したもの[6]でも、例えば、機械学習技術やWebクローリングなどによりコンピュータが生成したもの[7]でも構わない。既存の情報ユニットが複合型オブジェクトとして一体化(再利用)されるのは、一体化されたユニットの生来の性質によるものではなく、アルゴリズム設計の結果もしくは複合型オブジェクトを作成した人間の意志である。最後に、複合型オブジェクトは動的なものであり、それに含まれる情報に新しい意味を提供する利用パターンや社会的活動に基づいて時間と共に成長する[8]

3. 複合型オブジェクトをWebへ公開する

既存のレイヤの上に新しい機能レイヤを構築するレイヤ・ケーキのたとえが情報基盤を説明する際にはよく利用される。例えば、Tim Berners-Leeは、基礎となるWebアーキテクチャの上に構築された機能で構成されているセマンティックWebを説明するためにこのモデルを使っている[9]。OREの作業もこのパラダイムを採用した。OREは、相互運用性のための事実上の基盤としてWebアーキテクチャ[10]を仮定し、ORE標準をこのWeb基盤の上にある1つのレイヤとして位置づけている。したがって、OREの作業は、Webアーキテクチャで提供されている機能を活用して、Web基盤レイヤには存在しない複合型オブジェクトに関連する機能を追加するものである。

Figure 2


図 2. Webアーキテクチャ(www.w3.org/TR/webarch/から引用)

このWeb基盤レイヤ(図2)は、複合型オブジェクトの個々の構成要素にURIを関連づけることにより構成要素をURIで識別されるリソースとする、複合型オブジェクトを作成する情報システムが複合型オブジェクトをWeb上に公開するためのアーキテクチャ上の概念を定義する。ブラウザやクローラなどのWebサービスやアプリケーションはこれらのURIを使用し、コンテント・ネゴシエーションを通じて、リソースの表現(Representation)を得ることができる。

Figure 3


図 3. 複合型オブジェクトをWebへ公開する

複合型オブジェクトの構成要素がリソースとしてWeb上に公開される際、これらの構成要素は互いにリンクを張ること(図3のSから2へのリンクなど)も、他のリソースにリンクを張ること(図3の1から8へのリンクなど)も、また、他のリソースがこれらの要素にリンクを張ること(9から2へのリンクなど)も可能である。これらのリンクはWebそのものであるリッチな情報環境の基礎である。しかし、これらのリンクは通常型がない(標準的なハイパーリンクである)か、あったとしても一般的などの標準にも準拠していないので、複合型オブジェクトの構成要素であるリソースの間に存在する境界関係を規定しない(図3)。複合型オブジェクトである論理的全体は分解すると明確に区別できるリソースの集合になるが、これらのリソースはWebグラフの他のリソースと区別することができない。

多くの情報システムはこの問題に対処するために、複合型オブジェクトを構成する全ての要素と様々な関連リソースへのリンクを掲載するユーザ指向の「スプラッシュ」ページや「ジャンプ・オフ」ページにより複合型オブジェクトを表現している。この例を図4に示した。これはarXivのスプラッシュページであり、1つの文書に関する利用可能な様々なフォーマットや引用情報などの外部リソースへのアクセスを提供している。このスプラッシュページも1つのリソースであり、図3ではリソースSで示されている。

Figure 4


図 4. arXiv文書のスプラッシュページ(arxiv.org/abs/hep-th/0507171

これらのスプラッシュページは事実上、Web上で複合型オブジェクトを「全体として」表現するものになってきた。その結果、スプラッシュページのURIを複合型オブジェクトそのもののURIとして使用するという慣習ができてきた。この方法は人間が利用する分には便利であるが、コンピュータによる再利用という観点からは問題がある。その理由は次のとおりである。

これらの複合型オブジェクトの識別とその構造定義に関する問題に加えて、Webアーキテクチャは、リソースを複合型オブジェクトのコンテキストに即して明示的に参照する方法を持っていない。この機能は学術コミュニケーションにとって重要である。既存のリソースは多くの複合型オブジェクトの構成要素として再利用される可能性があるからである。たとえば、ある特定の細胞画像は、共焦点顕微鏡技法を示す画像Webのものであるかもしれないし、別のがん治療に関するWebのものであるかもしれない。来歴の追跡と引用にとって、どちらか一方の複合型オブジェクトの構成要素であるリソース(例えば、がん治療の画像Webにある細胞画像)をその事実がわかるように参照する能力を持つことは重要である。なぜなら、リソースやリソースへの参照の正確な意味はそのようなオブジェクトにより提供されるコンテキストに依存すると考えられるからである。

OREプロジェクトの目標はこのWebアーキテクチャの欠点を取り上げ、様々なネットワークアプリケーションで利用できる、複合型情報オブジェクトとオブジェクトへの参照の相互運用可能な利用と再利用を可能とする基盤レイヤをWebアーキテクチャ上に定義することである。このOREレイヤは、Webアーキテクチャのコア概念のいずれかを置換または再定義するものではまったくない。実際、OREレイヤは複合型オブジェクトを表現するという問題を解決するためにWebアーキテクチャの概念を全面的に活用している。

OREレイヤは、コンピュータやエージェントが処理できるような方法で複合型オブジェクトの境界を表現している。これは、複合型オブジェクトの構成要素やその内部関係と必要に応じてその対外関係を掲載する機械可読なスプラッシュページの仕様であると考えることができる。この仕様は次のような機能をサポートすることになる。

4. 複合型情報オブジェクトの解決に向けて

Webアーキテクチャの上にORE相互運用レイヤを構築するこれまでの作業は次の3つの要素からなる。

相互運用可能で機械可読な研究成果の表現を策定している他の学術コミュニティの試みと同様に、OREの作業もセマンティックWebコミュニティの活動から影響を受けている。注目すべき影響は、リンクデータ(Linked Data)[11]と名前付きグラフ(named graphs)の2つである。ただし、OREの作業がセマンティックWebの影響を受けているからといって、RDFやRDFS、RDF/XML、OWLなどのセマンティックWeb技術を使って実装しなければならないわけではないことを注意しておく。それどころか、OAI-OREは、より採用しやすく、通常は明示的なセマンティック情報を必要としないアプリケーション(既存のよくあるサーチエンジンやブログなど)でも使用できるもっと軽量な技術を採用すると思われる。このより簡単なフォーマットからもっと複雑なセマンティックアプリケーション用のデータを抽出するには、GRDDL[14]のようなメカニズムを使って変換すればよいだろう。

4.1 複合型オブジェクトの記述にリソースマップを使用する

上で述べたように、Web上で複合型オブジェクトを表現する際の主な問題点は、Webアーキテクチャがリソースの集合体を表現するための標準的な機能を持っていないために、論理的全体と言う概念が消失することである。したがって、OAI-OREは主に、この欠けている論理的な境界情報を機械可読な方法で付け加えることに焦点を絞った。

我々はこの境界情報を表現するためのモデルとして名前付きグラフ[12],[13]の使用を検討している。名前付きグラフとはノード(node)と弧(arc)の集合である。本稿の文脈で言えば、ノードとは、URIで識別されるWebリソースであり、弧とは、そのような2つのリソース間の有向リンクであり、関係の種類を示すURIにより型付けされている。名前付きグラフ自体もURIを使って識別される。このURIによる識別は、名前付きグラフ自体が論理ユニットであり、Web上でアドレス指定可能なリソースであることを意味する。このように名前付きグラフは、複合型オブジェクトをWeb上に公開する際に欠けていた複合型オブジェクトとその構成要素の間の基本的な関係を記述するメカニズムを提供する。さらに、名前付きグラフは、代理URI実体(名前付きグラフのURI)を複合型オブジェクトに関連付ける方法も提供する。最後に、名前付きグラフは、この基本的な境界型情報を表現することに加えて、より豊富なセマンティック情報を表すことが可能である。なぜなら、例えば、ある特定のアプリケーションドメインの要件に適う恣意的に型付けされたリソース(ノード)と関係(弧)を含むことができるからである。

Figure 5


図 5. Webグラフにおける論理的境界を示すためにリソースマップを公開する

ORE相互運用レイヤは、複合型オブジェクトを記述するリソースマップを公開することにより名前付きグラフを活用する予定である。リソースマップとは、ノードに複合型オブジェクトとその構成要素に対応するリソース、およびこれらに関係するリソース(学術論文の引用など)を持つ名前付きグラフである。リソースマップは、その「内部」リソースと「外部」リソースを明確に区別しなければならない。リソースマップの弧は、これらリソース間の型付けされた関係である。我々はコアとなる関係オントロジの作成と各学問分野独自のオントロジでこのコアオントロジを拡張する機能を想定している。実用的な理由により、リソースマップはプロトコルベースのURI(HTTP URIなど)を使って識別する。これにより、コンテンツネゴシエーションにおけるリソースマップの機械可読な表現を得ることができる。その結果、リソースマップは情報リソースのように考えることができる[15]

公開されたリソースマップはWebグラフに重ね合わされ、事実上その一部となる(併合される)。図5にこれを示した。この図で、一番上の面はリソースマップに含まれている情報を持たないWebグラフを示しており、一番下の面はオブジェトの境界と構成要素間の関係がWebグラフにおいてどのように可視化されるかを示している。リソースマップのURI(図5のR)は、複数のリソースとそれらのリソースマップにおける相互関係からなる集合体に対するWebベースのハンドルを提供する。このURIは標準的なWebアプリケーションで参照可能である。

4.2 複合型オブジェクトリソースを参照する

Webリソースの再利用はそれを参照できるか否かにかかっている。既に説明したように、複合型オブジェクトをWebに公開する際には参照の問題が存在する。第1に、図1に示したように複合型オブジェクトの識別子にあたるものがWebには存在しない。第2に、特定のリソースについて、そのリソースを(そのURIにより)単独に参照するだけでなく、ある複合型オブジェクトのコンテキストに即して参照する必要がある。

複合型オブジェクトを全体として参照する

リソースマップのプロトコルベースのURIは、リソース(複合型オブジェクトの構成要素)とそれらの境界型の相互関係の集合体を識別する。このURIは明らかに複合型オブジェクト自体の識別子ではなく、リソースマップとその表現である複合型オブジェクトを構成する全リソースのリストへのアクセスポイントを提供する。実用的にはほとんどの場合、このプロトコルベースのURIは複合型オブジェクトを参照するための手軽なメカニズムになると思われる。なぜなら、Web上の複合型オブジェクトの視認性はリソースマップに強く依存しているからである(OREの言葉で言えば、複合型オブジェクトはそれを記述するリソースマップが存在する時かつその時に限りWebスペース上に存在するからである)。

ただし、複合型オブジェクトを参照するのにリソースマップのURIを使用することには2つの微妙な問題があることに注意が必要である。第1に、そうすることは、Webアーキテクチャ、および1つのURIは1つのリソースを識別するべきであると明確に示しているURIガイドラインに合致しない点である。つまり、厳密に解釈すれば、リソースマップのURIをリソースマップとそれが記述する複合型オブジェクトの両方を識別するために使用することは不正である。第2に、既存の情報システムの中には既に、複合型情報オブジェクトを「全体として」識別する専用のURIを使用しているものがある。たとえば、多くの学術出版社はDOI[16]を使用しており、Fedora[17]とaDORe[18]リポジトリシステムはinfo URIスキームによる識別子を採用している[19]。これらの識別子は明らかにリソースマップのURIとは異なるものである。

図 6


図 6. 複合型オブジェクトを「全体として」示すリソースを持つリソースマップを公開する

これらの問題は、複合型オブジェクトそれ自体の識別子であるもう1つ別のURIをORE仕様の中で表す、そしてその結果としてリソースマップとその表現の中で表すことが可能に違いないことを示唆している。複合型オブジェクトを「全体として」識別するURIが導入されれば、複合型オブジェクトそのものに対応し、要素部品を持つリソース(図6のリソースC)を識別するというリソースマップにおける重要な役割を果たすことになるだろう。

コンテキストに即してリソースを参照する

Web上では、リソースはそのURIにより一義的に参照することができる。その結果、複合型オブジェクトを記述するリソースマップだけでなく、複合型オブジェクトを構成する各要素も参照することができる。先の節で述べたように、複合型オブジェクト「全体」は、専用のURIが与えられていれば参照することができる。しかし、先に細胞画像の例で説明したように、学術コミュニケーションにおいては、リソースをある特定の複合型オブジェクトの構成要素として参照したいというニーズが多い。

図7はリソースUが2つの複合型オブジェクトの部品として使用されているシナリオを示している。上側の複合型オブジェクトに関する境界情報を明らかにするために、リソースマップXが公開されている。同様に下側の複合型オブジェクトの境界情報を示すためにリソースマップYが公開されている。リソースUは両方の複合型オブジェクトの部品であるので、リソースマップXとYは共にリソースUを参照している。リソースUを特定の複合型オブジェクトの部品として参照したいというニーズを満たすために、OAI-OREは、リソース自体の識別子と目的とする複合型オブジェクトに対応するリソースマップの識別子から成る識別子ペアを使用することを提案している。すなわち、リソースUを上側の複合型オブジェクトの部品として参照する場合は(U,X)を、下側の複合型オブジェクトの部品として参照する場合は(U,Y)を使用する。

Figure 7


図 7. 2つの複合型オブジェクトに使用されているリソースU

4.3 Web上で複合型オブジェクトを発見する

リソースマップを使って複合型オブジェクトをWeb上で公開することは解決の一部に過ぎない。なぜなら、リソースマップとそれにより参照されるリソースが実際にWebグラフの一部になるためには発見される必要があるからである。OAI-OREではこれに関して互いに補完しあう2つのアプローチを提案している。

Figure 8


図 8. HTTP Linkヘッダを介してリソースマップを発見するWebクローラ

5. 結論

複合型情報オブジェクトは新しい学術コミュニケーション環境においては例外的なものではなく標準的なものになってきた。その結果、複合型情報オブジェクトを学問分野やアプリケーションの境界を超えて利用、再利用、参照、発見できる相互運用可能なアプローチにより既存のコミュニケーション技術基盤を拡張することが不可欠となっている。国際的プロジェクトであるOAI-OREは、Webアーキテクチャを十全に活用した、複合型オブジェクトを記述するリソースマップの公開、複合型オブジェクトのコンテキストに即したリソースの参照、リソースマップの発見を容易にするメカニズムの開発から成るソルーションに向けて作業を行っている。

2006年9月のプロジェクト開始以来、OAI-OREは概念の定義に関して長足の進歩を遂げたが、次のような重要な疑問にはいまだ答えを出していない。このソルーションはバージョン管理にどのように対応するのか。リソースマップの信頼性はどのように評価できるのか。採用を促すためにOAI-OREはどのような種類の関係型を定義し、どのような種類をコミュニティに委ねるべきなのか。リソースマップを表現するにはどの技術を使用すべきなのか、また、その選択が仕様の採用にどのような影響を与えるのか。これらの疑問のいくつかについては、OAI-OREがパブリックアルファバージョンの仕様のリリース期日として自ら設定した2007年9月末までに、少なくとも予備的な解答が得られると思われる。このリリースを受けて、OAI-OREは様々な学術コミュニティによる実験を奨励し、世界中の関係者から意見を求める予定である。これらの活動から得られた知見は2008年9月に予定されている第1版の仕様に取り入れられることになるだろう。

付録

2007年5月に、ロスアラモス研究所のデジタルライブラリ研究・試作チームは、複合型オブジェクトの境界型情報をWebに公開する方法としてリソースマップの公開を行うというアイデアを検証するための実験を開始した。実験では特に、既存のWebアプリケーションが、それ自体に変更を加えることなく、公開されたリソースマップをうまく利用できるか否かを検証した。時間が経つにつれ、実験は複合型情報オブジェクトのアーカイブに関係するようになった。実験に使用したソフトウェアは、Webクローラを持つInternet ArchiveのHeritrixツールとそのWayback Machineユーザインターフェースである。

実験の楽観的なシナリオでは、リソースマップの公開が極めて当たり前に行われるようになったので、Internet Archiveが積極的にリソースマップの収集を開始したと仮定している。実験では専用のSitemapを介してリソースマップを発見できるようにしている2つの出版社をクローズアップする。Sitemapにリストアップされているリソースマップに変更があると、対応するSitemapのdate-time値が変更される。新しいリソースマップが公開されると、Sitemapに追加される。Internet ArchiveはこれらのSitemapとそれに含まれているdate-time値を、リソースマップとそれが参照しているリソースの収集と保存のトリガーとして使用する。その結果、Wayback Machineでは特定の日付の特定のリソースマップの検索や同一の日に存在したリソースマップで参照されている各リソースのバージョンを直ちにみることが可能となる。リソースマップが複合型オブジェクトの境界を明らかにしていることを理解すると、最終的な結果は事実上、複合型オブジェクトを記述するリソースマップのdate-time値によりバージョン化された、発展を続ける複合型オブジェクトのアーカイブであると考えることができる。

下のスクリーンキャストは、実験に含まれる様々な要素を一通り説明するものであり、いくつかのリソースマップが時間と共に発展する様子を説明している。

Screencast link

謝辞
OAI-OREはアンドリュー・W・メロン財団、CNI(Coalition for Networked Information)、マイクロソフト、全米科学財団(IIS-0430906)の支援を受けています。
ORE技術委員会、連絡調整グループ、諮問委員会によるOAI-ORE活動への貢献に感謝いたします。また、John Erickson(HPラボ)とSandy Payette(コーネル大学情報科学プログラム)の貢献にも感謝いたします。
付録で示したプロトタイプの作業に関して、ロスアラモス研究所デジタルライブラリ・試行チームのLyudmila Balakireva、Ryan Chute、Stephan Dresher、Zhiwu Xieに感謝いたします。
1 Van de Sompel, H., Payette, S., Erickson, J., Lagoze, C., Warner, S. "Rethinking Scholarly Communication: Building the System that Scholars Deserve," D-Lib Magazine, September 2004. http://www.dlib.org/dlib/september04/vandesompel/09vandesompel.html
2 Roosendaal, H. E., Guerts, P. A. T. M. "Forces and functions in scientific communities: an analysis of their interplay," in CRISP 97: Cooperative Research Information Systems in Physics, Oldenburg, Germany, 1997.
3 National Science Foundation Cyberinfrastructure Panel, "Cyberinfrastructure Vision for 21st Century Discovery," National Science Foundation, Washington, D.C. 2007, http://www.nsf.gov/od/oci/CI_Vision_March07.pdf.
4 "ImageWeb server," http://imageweb.zoo.ox.ac.uk/. Accessed June 29, 2007.
5 Crane, G. "What Do you Do with a Million Books?," D-Lib Magazine, Vol. 12, March 2006. http://www.dlib.org/dlib/march06/crane/03crane.html
6 Razum, M. "eSciDoc - A Scholarly Information and Communication Platform in the Age," in Digital Library Goes e-Science (DLSci06), Alicante, Spain, 2006.
7 Dmitriev, P., Lagoze, C., Suchkov, B. "As We May Perceive: Inferring Logical Documents from Hypertext," in HT 2005 - Sixteenth ACM Conference on Hypertext and Hypermedia, Salzburg, Austria, 2005.
8 Lagoze, C., Krafft, D., Cornwell, T., Eckstrom, D., Jesuroga, S., Wilper, C. "Representing Contextualized Information in the NSDL," in ECDL2006, Alicante, Spain, 2006.
9 Berners-Lee, T. "Semantic Web Road Map," W3C, http://www.w3.org/DesignIssues/Semantic.html.
10 Jacobs, I., Walsh, N. "Architecture of the World Wide Web," W3C, Proposed Recommendation April 2004, http://www.w3.org/TR/2004/PR-webarch-20041105/.
11 Berners-Lee, T. "Linked Data," W3C 2006, http://www.w3.org/DesignIssues/LinkedData.html.
12 Carroll, J. J., Bizer, C., Hayes, P., Stickler, P. "Named Graphs, Provenance and Trust," in WWW 2005 Chiba, Japan: ACM, 2005.
13 Carroll, J. J., Bizer, C., Hayes, P., Stickler, P. "Named Graphs," 2005, http://sites.wiwiss.fu-berlin.de/suhl/bizer/pub/NamedGraphs-WebSemanticsJournal.pdf.
14 Davis, I. "GRDDL," W3C October 2006, http://www.w3.org/TR/grddl-primer/.
15 R. Lewis, "Dereferencing HTTP URIs " W3C, http://www.w3.org/2001/tag/doc/httpRange-14/2007-05-31/HttpRange-14.
16 "The Digital Object Identifier System Home Page," International DOI Foundation (IDF), http://www.doi.org/.
17 Lagoze, C., Payette, S., Shin, E., Wilper, C. "Fedora: An Architecture for Complex Objects and their Relationships," International Journal of Digital Libraries, Vol. 6, pp. 124-138, April 2005.
18 Van de Sompel, H., Bekaert, J., Liu, X., Balakireva, L., Schwander, T. "aDORe: a modular, standard-based Digital Object Repository," http://www.arxiv.org/abs/cs.DL/0502028.
19 Van de Sompel, H., Hammond, T., Neylon, E., Weibel, S. "The "info" URI Scheme for Information Assets with Identifiers in Public Namespaces," IETF RFC 4452, 2006, http://www.rfc-editor.org/rfc/rfc4452.txt.

原論文のURL: http://www.ctwatch.org/quarterly/articles/2007/08/interoperability-for-the-discovery-use-and-re-use-of-units-of-scholarly-communication/