Main Articles

グラスゴー大学におけるe-プリント機関アーカイブの展開

William Nixon, e-プリントアーカイブの構築に関するもう一つの実践的観点を提示

Main Contents Page Section Menu Mail Ariadne Search Ariadne

dividing bar

(原文: The evolution of an institutional e-prints archive at the University of Glasgow:
William Nixon. Ariadne, Issue 32, June-July 2002)

はじめに

本稿では、グラスゴー大学においてe-プリントアーカイブを設置した目的について概観し、eprints.orgソフトウェアを使ってe-プリント機関アーカイブを構築した我々の経験を詳述する。本稿は、Ariadne 31号に掲載されたStephen Pinfield、John MacColl、Mike Gardnerの論文 [1] に続くものである。

オープン・アーカイブズ・イニシアティブ [2] やe-プリントサービスに関する議論 [3] については、Ariadneのこれまでの論文や別のところで扱われているので、あらためて紹介する必要はないだろう。本稿では、高等教育機関におけるeprints.orgアーカイブの実装と、アーカイブをベータテストサイトから一般に利用できるサービスにまで展開した際に下した様々な判断について焦点を絞ることにする。

グラスゴー大学におけるe-プリントアーカイブ

グラスゴー大学における情報サービスは、2001年の初めにベータバージョンのeprints.orgソフトウェアをインストールして開始し、同年4月にバージョン1.0に移行した。2001年11月にデモンストレーション用のサービスを開始し、2002年4月から本運用を開始した。なお、我々はまだ、eprints.orgソフトウェアのバージョン2.0xにはアップグレードしていない。

これらのインストールから我々は様々な経験をした。それは、単にサービスをインストールする仕組みに関するものだけでなかった。この機関サービスを機関にとって欠かせないものにし、利用されるようにするために解決しなければならない様々な文化的技術的問題に取り組むための相談役としての経験も含んでいた。

我々は、おおよそ30本の論文、プレプリント、報告書でアーカイブを開始した。さらに、出版された論文やテクニカルレポート、研究報告書や学位論文などを追加コンテンツとして考えられるコレクションとしてリストアップしており、これらをe-プリントサービスに追加する予定である。我々は、多くの部局が研究報告書やテクニカルレポートを利用可能にすることに興味を持っていることを知ることになった。そのようなサービスの優れた例としては、カリフォルニア大学のカリフォルニア・デジタル・ライブラリーで、最近サービスを開始したeScholarshipリポジトリ [4] が挙げられる。このサービスの初期の対象は、カリフォルニア大学における人文社会科学分野の研究報告書である。このサービスは、この分野における国際的な関心を示す優れた見本を与えるとともに、研究成果を効果的に公開する機関アーカイブの潜在能力を示している。

グラスゴー大学におけるe-プリントアーカイブの目的

グラスゴー大学におけるe-プリントアーカイブの目的は、大学の学術成果および研究を公開し、アクセスできるようにする効果的な(さらなる)手段を提供することにある。「学術成果」という言葉を使ったのは、学位論文や本の章、会議発表論文、プロジェクトレポートのような灰色文献とともに、ピアレビューされる雑誌論文も含むことを意図しているからである。

e-プリントアーカイブの中心的目標は以下のとおりである。

成功に導くために

我々のグラスゴーでの経験によれば、オープン・アーカイブズ・サービスの開発と立ち上げを成功に導くためには、次の2つの要素が鍵となる。

実装

eprints.orgアーカイブの実装は、コンピュータサービス部門と大学図書館が共同で行った。アーカイブサービスはコンピュータサービス部門のサーバがホストとなり、コンピュータサービス部門のスタッフがインストールした。図書館は、サービスの「ルック・アンド・フィール」の設計とサービスの管理、宣伝を担当した。この役割の分担はとても成功したと思われる。コンピュータサービス部門が提供した技術的専門知識は、アーカイブの設定・稼動に不可欠のものであった。この技術的専門知識は、Unix Solaris、Perl、MySQL、Apacheに関する知識があげられる。

eprints.orgバージョン2.0のドキュメントでは、次のように述べている。

「アーカイブの設定は簡単な作業ではない。実のところ、一番大きな問題は自分が必要なものは何であるかを決定することである。私は、まずほとんどデフォルトの設定でデモ用バージョンを構築し、何が必要であるかを決定する管理者なり委員会なりにデモ用バージョンを試用してみてもらい、何を付け加え、何を取り除くべきかについて意見を言ってもらうことを提案する」[5]

これはまさに我々がバージョン1.0で経験したことであり、我々のアーカイブに、初期のベータリリースから現在稼動中のバージョンまで数多くのバージョンを使用した理由である。意見をもらうために多くの情報サービススタッフが試験的サービスを利用できるようにした。スタッフには文献をデポジットするためのアカウントを与え、彼らから初期のフィードバックを得た。

eprints.orgを単純なデフォルト設定でインストールすることは簡単であるが、多くのサイトはもっと多くの設定を望んでいる。eprints-techメーリングリスト[6]の最近のトラフィック量がそれを物語っている。

[図1: グラスゴー大学ePrintsサービス]

[図1: グラスゴー大学ePrintsサービス]

eprints.orgソフトウェアのバージョン2.0は2002年3月にリリースされた。このバージョンは全面的に書き直されたものであり、バージョン2.0へのアップグレードパスはなく、eprints.orgではクリーンインストールを推奨している。我々の稼動中のサービスについては、現在、アーカイブをバージョン2.0に移行した場合の影響を調査中であり、移行を利用者にとってできるだけシームレスにしようとしている。利用者情報とコンテンツは新しいeprints.orgアーカイブにインポートし、現在と同じウェブアドレスになるように新アーカイブのURLを切り換える予定である。

メタデータの決定

eprints.orgソフトウェアはOAI準拠であり、サービスプロバイダがハーベスティングするために必要なダブリンコアメタデータを作成する。しかし、文書種別や形式、主題スキーマの決定は個々の実装者の仕事である。

米国議会図書館件名標目表

我々がアーカイブに対して行った最も基本的な変更は、米国議会図書館分類要綱[7]に基づいた主題リストを作成することであった。試験的サービスの主題リストは単に学部や学科に基づいたものであった。これは、学内の利用には非常に便利であると感じたが、将来のアーカイブ横断検索を見越して、アーカイブ間にある程度の一貫性を与える確立された主題体系を採用したいと考えた。我々は既に図書館の目録において米国議会図書館件名標目表(LCSH)を使用しており、また、Classification Plusのような分類ツールも存在するので、LCSHは当然の選択であると思われた。

多くの分野を幅広く収めるという我々のアーカイブの性格により、A 総記からZ 書誌、図書館学、情報資源までのすべての大項目とその中項目までを採用することにした。この決定は、リストが複雑になったり、あまりにも長くなったりしないことを保証するために行った。ただし、たとえば、数学の元に分類されているコンピュータサイエンスのように、様々な学問分野を表現するためにもう少し細かく展開する必要がある例もあった。さらに、大学の学科リストを調べて、必要な件名標目をLCSHから追加したものもある。たとえば、RC1200 スポーツ医学RC0254 腫瘍学で、これらはいずれもRC 内科学の一部となっている。これら細分化した標目の追加は、研究者が文献をセルフアーカイブする際に、適当な主題を簡単に選択できるようにすることを意図している。研究者には追加希望の標目を提案する機会も与えられている。

[図2: 米国議会図書館件名表目標]

[図2: 米国議会図書館件名表目標]

学部と学科

LCSHリストの実装後、デポジットされた文献リストを学部別・学科別に提供することが依然としてきわめて有益であることが明らかになった。部局別に文献をまとめておけば、各学部や学科がデポジットした文献の数を簡単に知らせることができるからである。

eprints.org v.1.0では、主題リストを1つしかサポートしておらず、我々は既にLCSHリストで使用していたので、部局別に文献を配置したウェブページを別に作成した。このページは、各部局がデポジットした文献をリストするようにあらかじめ条件を設定した検索画面へのリンクを持っている。アーカイブにデポジットされる文献はすべてどこかの部局と結びついている必要があるので、部局名のリストボックスを用意して利用者が部局を選択できるようにした。部局フィールドは必須フィールドとし、部局を選択しない限り、文献のデポジットは受付けられないようにした。

[図3: 部局別のePrints]

[図3: 部局別のePrints]

eprints.org v.2.0 では複数のリストをサポートしているので、この索引を管理することははるかに容易になるであろう。

ルック・アンド・フィール

Pinfieldは、「機関アーカイブがどのような形で現れ始めるかを予想することは興味深いことである。(多くの場合、グラフィックやJava-scriptを多用する)機関のデザインポリシーがe-プリント機関サーバの外見に影響を与え、arXivの精神は失われるものと思われる。」と述べている。[8]

機関のデザインポリシーは我々のアーカイブの「ルック・アンド・フィール」に影響を及ぼす。我々は目録のような既存のリソースと同一の一貫したルック・アンド・フィールを保つようにした。ePrintsサービスのホームページはこれを反映しており、図書館の情報ゲートウェイMERLIN[9]のレイアウトと利用できるオプションを踏襲している。ePrintsサービスホームページには、タイトル、著者、キーワードで引ける検索窓を設け、簡単なJava-scriptを使うことでカーソルを自動的に検索窓に表示させ、利用者が直接検索を開始できるようにしている。このようにしているのは、この「ルック・アンド・フィール」が我々の利用者にとてもなじみのあるものであり、利用者が特に意識することなく、また、改めてインターフェースを覚えることなく、コンテンツの検索に向かえるようにするためである。

我々は、目録(Innopac)にある資料のレコードからePrintsアーカイブで利用できるフルテキスト版にリンクするような付加価値サービスも検討している。これは、フルテキストへのリンク、特に目録にすべて入力されている本学の学位論文にフルテキストへのリンクを提供することになるであろう。

[図 4: 図書館目録からePrintsへのリンク]

[図 4: 図書館目録からePrintsへのリンク]

情報フィールドの追加

(ピアレビューされ)出版された資料からプロジェクト報告書や学位論文までの様々なe-プリント資料を提供すると決定したので、表示されるコンテンツの種類や出版状況(出版済み、印刷中、未出版など)を利用者が簡単に判別できる最適の方法を考える必要が生じた。アーカイブは出版状況や文書種別で検索することができるが、この情報はレコード表示画面には表示されなかった。eprints.orgソフトウェアの持つ柔軟性により、これらのフィールドを表示項目に追加することができた。

[図e 5: 出版状況とePrints文書種別フィールドを持つレコード表示]

[図e 5: 出版状況とePrints文書種別フィールドを持つレコード表示]

これらの要素はすべて、eprints.org v.2.0のアーカイブへ移行する対象となっている。

OAIへの登録とOAI準拠

我々のサービスを一般に公開する際に鍵となる要素は、サービスがOAI準拠であることを保証し、OAI準拠のデータプロバイダとして登録することであった。我々は、2001年11月に「glasgow」という名前で登録した。これにより、ARCのような個々のサービスプロバイダにこのOAI登録名を使って次々と登録することができるようになった。

この登録により、アーカイブが持つ現実的なアーカイブ横断検索の可能性を大学の構成員に示すことができ、また、グラスゴー大学内に留まらないより広域的な研究活動のあり方を提示することができた。

利用者の自己登録機能とセルフアーカイブ機能

本稿を書いている時点で、我々のePrintsアーカイブには約30名の登録利用者がおり、そのうちの何人かは資料をセルフアーカイブしており、何人かは電子メール通知サービスを設定している。アーカイブをデモンストレーション用から「本番稼動」に移行する際に鍵となった要素は、利用者が自分で登録できるようにするべきであるということであった。他の高等教育機関同様、グラスゴー大学のように多様化した機関においては、時間の制約や技術的能力など様々な理由により必ずしもすべての利用者が自分の資料をセルフアーカイブしたいと望むわけではない、ということを我々は認識している。しかし、これをオプションとして提供することは不可欠であると感じていた。

初期の利用者(音楽や生命科学、計算機科学などの学問分野であった)は、様々な形式の資料をアーカイブにアップロードするのに何の困難も示さなかった。また、この経験に対し非常に積極的であった。利用者の自己登録機能とセルフアーカイブ機能を持たせることで、我々はアーカイブの管理に関する1つの見識を持つことになった。

試験段階においては、追加されたコンテンツはアーカイブに責任を持つスタッフによる1件だけであり、主に最初に用意したコンテンツを使用していた。現在ではセルフアーカイブが利用できるので、コンテンツが登録バッファにデポジットされていないかどうか1日1度チェックする必要がある(アーカイブの管理者だけがコンテンツを一般に利用できるようにすることができるので)。現在のところ、資料が投稿され査読が必要になっても、電子メールによる通知は行われない。

ePrints管理者は、投稿された論文を査読し、採用・不採用を判断する。さらに、主題標目やキーワード、その他の情報を追加してレコードが適切になるよう修正することもある。

eprints.org v.1.0では、誰でもアーカイブに登録でき、コンテンツを投稿できる。我々はグラスゴー大学の構成員以外からの論文の投稿を1例経験し、丁重にお断りしなければならなかった。eprints.org v.2.0では、アーカイブに論文を投稿できる者を規制する機能が提供されるので、この問題をもっと良い形で管理することができるようになるだろう。

さらに、出版社作成のPDFファイルのデポジットを提案する非常に熱心な同僚が何人かいた。こうした資料は出版社から許可を得るまでは受け付けることはできない。これらはサービスがもっと広く利用されるようになるために解決しなければならない文化的あるいは組織的な課題の一例であろう。

資料をデポジットする目的でサービスを使用したスタッフの意見は非常に肯定的なものであり、彼等の意見により、XMLのような新しい文書形式や、相互リンクする必要がある複数のPDFファイルのデポジットを扱う方法を追加することになった。後者は、索引として機能する仲介的なHTMLファイルを追加することにより実現した。

[図 6: 複数の文書形式]

[図 6: 複数の文書形式]

[HTMLフロントページを持つ複数のPDFファイル]

[図 7: HTMLフロントページを持つ複数のPDFファイル]

図書館の役割

グラスゴー大学では、図書館は、e-プリントアーカイブとオープン・アーカイブズ・サービスを持ち込んで実装する先導者である。このサービスの実装を成功させるために、図書館は技術的な設備と保守管理を提供する以外に、以下のような数多くの役割を担っている。

e-プリントを超えて: FAIR と DAEDALUS

JISCが資金を提供するFAIR(Focus on Access to Institutional Resources)プログラムは2002年1月に、「高等教育(HE)および生涯教育(FE)機関におけるコンテンツへのアクセスおよびコンテンツの共有をサポートする、あるいは、これらのプロセスに関する技術的、組織的、文化的課題に知を集中させる、多くのプロジェクトに資金を提供する」と発表した[11]。FAIRはオープン・アーカイブズ・イニシアティブの構想に触発されたものであり、50機関の参加による14のプロジェクトに資金を提供した[12]

グラスゴー大学はDAEDALUS(Data Providers for Academic E-content and the Disclosure of Assets for Learning, Understanding and Scholarship)と題する3年間のFAIRプロジェクトの資金を獲得した。DAEDALUSは、本稿で述べたe-プリントアーカイブを構築した我々の経験の上に構築するものであり、オープン・アーカイブズ準拠の複数のグラスゴー大学データプロバイダのネットワークを確立するものである。これらのデータプロバイダは大学の学術成果物を開放するために使用され、以下のものを含む。

これらのリポジトリを登録してますます多くのサービスプロバイダが利用できるようにすることに加えて、我々もまた機関サービスプロバイダを設置して大学や広く学術コミュニティの構成員がこれらのリソースを検索できるようにするつもりである。

DAEDALUSではeprints.orgの他にもOAI準拠の様々なソフトウェアパッケージを調べて、それらの実装に関する技術的、文化的、組織的問題を調査する予定である。

結論

Philip HunterはAriadne 31号においてe-プリント革命について述べている[13]。技術上の革命は今起きている。OAIはちょうどオープン・アーカイブズ・イニシアティブ・メタデータ・ハーベスティング・プロトコル(OAI-PMH)のバージョン2.0をリリースしたところである[14]。機関アーカイブを構築するためのソフトウェアは、eprints.org以外にもますます多くの選択肢が存在するようになっている。

結局のところ難しいのは、e-プリントサービスの技術的な実装ではなく、むしろ、e-プリントサービスが機関の活動に組み込まれ当たり前の存在になるために必要な文化の変化である。FAIRのような全国プログラムやブダペスト・オープン・アクセス・イニシアティブ(BOAI)[15]の宣言のような国際的な宣言が、そのような変化を支援するだろう。

グラスゴー大学でのe-プリントサービスの展開は漸進的ではあったが、我々は着実に進歩しており、初期の参加者が示したアーカイブへの熱意に励まされてきた。我々はDAEDALUSを使って、この初期のサービスの上に様々な新サービスを実装していくつもりである。また、さらに重要なことであるが、e-プリントおよびオープンアクセスの文化をこれからも育てていくつもりである。

参考文献

(1) Stephen Pinfield, Mike Gardner and John MacColl, "Setting up an institutional e-print archive". Ariadne, Issue 31.
<http://www.ariadne.ac.uk/issue31/eprint-archives/>
(2) Open Archives Initiative
<http://www.openarchives.org/>
(3) Stevan Harnad, "For whom the gate tolls? How and why to free the refereed research literature online through author/institution self-archiving, now"
<http://www.cogsci.soton.ac.uk/~harnad/Tp/resolution.htm>
(4) California Digital Library eScholarship Repository
<http://repositories.cdlib.org/>
(5) EPrints 2.0.1 Documentation - Introduction
<http://www.eprints.org/docs/php/intro.php>
(6) ePrints-tech mailing list archive
<http://www.eprints.org/tech.php/>
(7) Library of Congress Classification Outline
<http://www.loc.gov/catdir/cpso/lcco/lcco.html>
(8) Stephen Pinfield "How do physicists use an e-print archive? Implications for institutional e-print services". D-Lib Magazine, 7, 12, December 2001.
<http://www.dlib.org/dlib/december01/pinfield/12pinfield.html>
(9) MERLIN - Glasgow University Library's Information Gateway
<http://merlin.lib.gla.ac.uk/>
(10) Create Change: Challenging the Crisis in Scholarly Communication [at Glasgow]
<http://www.gla.ac.uk/createchange>
(11) JISC FAIR Call
<http://www.jisc.ac.uk/pub02/c01_02.html>
(12) Successful FAIR bids
<http://www.jisc.ac.uk/dner/development/programmes/fair.html>
(13) Philip Hunter, "An e-prints revolution?" Editorial, Ariadne Issue 31.
<http://www.ariadne.ac.uk/issue31/editorial/intro.html>
(14) Open Archives Initiative Release Version 2.0 of the Protocol for Metadata Harvesting
<http://www.openarchives.org/news/oaiv2press020614.html>
(15) Budapest Open Access Initiative
<http://www.soros.org/openaccess/read.shtml>

著者紹介

William J Nixon
w.j.nixon@lib.gla.ac.uk
Williamはグラスゴー大学図書館のITサービス部門の副長で、グラスゴー大学ePrintsサービスの管理者である。