Séminaire Papillon 2002

パピヨン会議

7 16 - 18 juillet

 

 

Lieu 場所 venue :

National Institute of Informatics

国立情報学研究所

Hitotsubashi 2-1-2-1412

〒101-8430

Chiyoda-ku

東京都千代田区

〒101-8430 TOKYO

一ツ橋2-1-2-1412

 

 

http://www.nii.ac.jp/help-e.html

http://www.nii.ac.jp/help-j.html

概要: (Version française plus bas) (English version below)

多言語語いデータ・ベースは言葉の全ての利用可能な意味への容易なアクセスを提供し、かつ様々なタイプの語いの情報を使用し、テキスト処理を行う多くのコンピュータ・プログラムの生成を許可する為に構築され、構造化した情報の倉庫です。過去10年以上に渡り、自然言語処理に係る研究所及びインターネット上には語い資源の蓄積があり、この蓄積は、研究者が行う操作及びこれらの資源へのアクセスの組織により解決しようとする問題を提起します。これらのデータ・ベースは言語科学における新たな人間言語技術開発研究の核となるポイントになるでしょう。ゲノムのデータ・ベースのように、この語いデータ・ベースは複雑かつ進化する豊富な注釈を持つ倉庫であり効率的な表現の開発、索引付け及び検索の為、斬新かつ独特な試みを行っています。ワークショップの目的は、多言語語いデータ・ベースの中で既存の研究を生かし、かつ重要な問題を明確にすることであり、より広くワークショップにて、新しいパピヨン「多言語語いデータ・ベースコミュニティー」における研究の論点を定義し、このコミュニティーと他のコミュニティー(辞書編集、翻訳、人間コンピューター相互作用、データ・ベースコミュニティー等)間における進行中の問題及び成果の交換を行います。パピヨンは、出典先(フランス語、英語、日本語、タイ語、ラオス語、ベトナム語)から派生した多言語語いデータ・ベース及び電子辞書のウェブ上の構築及びより協力的な使用法を目指したプロジェクトであり、参加者は、データ・ベース、言語学、計算言語学、注釈及びマークアップを含む一連の領域を提示するでしょう。

より詳細な情報を入手されたい方は、パピヨンウェブサーバ http://www.papillon-dictionary.org を御覧下さい。

マンジョ・マチューにメールを下さい mailto:mangeot@nii.ac.jp

Présentation :

Les bases lexicales multilingues sont des serveurs de données lexicales structurées. Ces données peuvent être utilisées soit par des humains pour définir leur propre dictionnaire soit par des applications de traitement des langues.

Ces dernières années, nous assistons à une accumulation de ressources lexicales dans les laboratoires de traitement automatique de la langue ainsi que sur Internet. les bases lexicales multilingues tentent de résoudre ce problème d'accumulation en organisant la manipulation et l'accès à ces ressources. Ces bases sont un point central de la recherche dans les sciences du langage et dans le développement des technologies de la langue. Comme les bases de données génomiques, les bases lexicales sont complexes, évoluent, constituent des serveur richement annotés et posent de difficiles problèmes scientifiques dans de nombreux domaines.

Les buts de cet atelier sont de rendre compte de la recherche existante dans les bases de données multilingues et d'identifier les problèmes clés. Plus généralement, l'atelier aidera à definir des questions de recherche de la nouvelle "communauté des bases lexicales multilingues" autour de Papillon et initiera les échanges sur les problèmes en cours et les résultats entre cette communauté et les autres communautés (lexicographie, traduction, interfaces hommes-machine, bases de données au sens large, etc.).

Papillon est un projet de construction et d'usage collaboratifs sur la toile d'une base lexicale multilingue et de dictionnaires dérivés en source ouverte (français, anglais, japonais, lao, thai et vietnamien). L'atelier est destiné à des participants de plusieurs specialités incluant les bases de données, la linguistique, la linguistique-informatique, les annotations et XML.

Pour plus d’informations, consultez le serveur du projet à l’adresse suivante : http://www.papillon-dictionary.org

Vous pouvez aussi contacter Mathieu MANGEOT par courriel a l’adresse suivante : mailto:mangeot@nii.ac.jp

Presentation :

Multilingual lexical databases are repositories of structured information built to provide an easy access to all available meanings of words and to allow the creation of a number of computer programs that will process texts using various types of lexical information.

Over the last decade, there has been an accumulation of lexical resources in NLP laboratories and on the Internet. This accumulation poses problems which researchers try to solve by organizing the manipulation and the access to these resources. These databases are a central point of research in the language sciences, and in the development of new human language technologies. Like genomic databases, lexical databases are complex, evolving and richly annotated repositories, and pose interesting challenges for efficient representation, indexing and query.

The goals of the workshop are to take stock of existing research in multilingual lexical databases and to identify the key problems. More broadly, the workshop will help define the research questions of the new Papillon "multilingual lexical database community" and initiate the interchange of relevant ongoing problems and results between this community and other communities (lexicography, translation,

human-computer interactions, database community at large).

Papillon is a project of construction and collaborative usage on the web of a multilingual lexical database and electronic dictionaries derived in open source (French, English, Japanese, Thai, Lao, Vietnamese) Participants will represent a range of domains including databases, linguistics, computational linguistics, annotation and markup.

For more information, please consult the Papillon web server at: http://www.papillon-dictionary.org

You can also contact Mathieu MANGEOT by email at: mailto:mangeot@nii.ac.jp

Programme en bref 小プログラム :

 

Mardi 16日( 火)

Mercredi 17日( 水 )

Jeudi 18日( 木 )

 

Exposés : papillon général

Exposés : projets partenaires

Exposés : interactions

9h45

Ouverture : Kinji ONO

E7 Jim Breen

E14 David THEVENIN

10h10

E1 Emmanuel PLANAS

E8 Ulrich APEL

E15 Valérie BELLYNCK

10h45

Pause café 休憩

Pause café 休憩

Pause café 休憩

11h00

E2 Gilles SÉRASSET

E9 Laurent ROMARY

E16 Emmanuel PLANAS

11h30

E3 Mathieu MANGEOT

E10 Keita TSUJI

E17 Fatiha SADAT

12h

Déjeuner 昼食

Déjeuner 昼食

Déjeuner 昼食

 

Exposés : structure des articles

Exposés : traduction et axies

13h45

E4 Mutsuko TOMOKIYO

E11 Christian BOITET

E18 JM DESPERRIER

14h15

E5 Mathieu MANGEOT

E12 Kyoko KURODA

Table ronde construction
lexicale coopérative

14h45

E6 Michael ZOCK

E13 M. LAFOURCADE

15h15

Posters P1-P5

Discussion libre

Cérémonie de clôture

16h15

Pause café 休憩

Pause café 休憩

Café d’adieu 休憩

16h45

Atelier sur les articles

Atelier sur les articles

Réunion interne Papillon

19h30

 

Dîner à l’institut 会食

 

Programme détaillé プログラムの詳細 :

 

Mardi 16 juillet 2002 年07月16日(火)
14F, salle 1412 号室
09h45 - 10h00
Accueil はじめに
10h00 - 10h15
Cérémonie d’ouverture 開会 :

Prof. Kinji ONO, Executive Director of Research,
National Institute of Informatics

10h15 - 12h00
Exposés 発表 : présentation générale du projet
Président de séance 議長 chairman : Christian BOITET

10h15 - 10h40

Emmanuel PLANAS :
Papillon project : what do we want to achieve, and how.

10h45 - 11h00
Pause café 休憩

11h00 - 11h25

Gilles SÉRASSET :
Current Status of the Papillon Server Development

11h30 - 11h55

Mathieu MANGEOT :
How to Import an Existing XML Dictionary Into the Papillon Plateform

12h00 - 13h45
Pause déjeuner 昼食
13h45 - 15h15
Exposés 発表 : structure des articles et accès
Président de séance 議長 : Gilles SÉRASSET

13h45 - 14h10

Mutsuko TOMOKIYO :
Report on lexical description for monolingual dictionaries in Japanese, French and English in the Papillon lexical data base

14h15 - 14h40

Mathieu MANGEOT :
Proposal for Changes in the Monolingual XML Schema

14h45 - 15h10

Michaël ZOCK :
Electronic dictionaries for men, machines or for both?

15h15 - 16h15
Session spéciale : posters & démos
Président de séance 議長 : Emmanuel PLANAS
 

Vincent BERMENT : Several Technical Issues for Building New Lexical Bases

Lim BENG TAT : Report on Possible Processes involved and information usage in the Papillon Project for WSD

François LAREAU : A Practical Guide for Writing DiCo Entries

Didier SCHWAB : Hardening of Acception Links Throught Vectorized Lexical Functions

Aree TEERAPARBSEREE : A Practical Guide to Lexical Data Acquisition with RECUPDIC

16h15 - 16h45
Pause café 休憩
16h45 - 18h45
Atelier (workshop) sur la rédaction d’articles

 

Mercredi 17 juillet 2002 年07月17 日 (水)
14F, Salle 1412 号室
9h45 - 12h00
Exposés 発表 : projets partenaires
Président de séance 議長 : François BROWN DE COLSTOUN

9h45 - 10h10

Jim BREEN :
Practical Issues and Problems in Building a Multi-Lingual Lexicon

10h15 - 10h40

Ulrich APEL :
WaDokuJT : A Japanese-German Dictionary Database

10h45 - 11h00
Pause café 休憩

11h00 - 11h25

Laurent ROMARY :
An abstract model for the representation of multilingual terminological data: TMF – Terminological Markup Framework

11h30 - 11h55

Keita TSUJI :
Extracting French-Japanese Word Pairs from bilingual Corpora Based on Translation Rules (HOTARU project)

12h00 - 13h45
Pause déjeuner 昼食
13h45 - 15h15
Exposés 発表 : liens interlingues et traduction
Président de séance 議長 : Jim BREEN

13h45 - 14h10

Christian BOITET :
The translation of examples, citations, definitions and glosses in the Papillon project

14h15 - 14h40

Kyoko KURODA :
Divergences de Traduction : cas des structures argumentales du japonais et du français
日仏動詞の項構造のずれについて

14h45 - 15h10

Mathieu LAFOURCADE :
Automatically Populating Acception Lexical Database through Bilingual Dictionaries and Conceptual Vectors

15h15 - 16h15
Discussion libre ディスカッション
16h15 - 16h45
Pause café 休憩
16h45 - 18h45
Atelier (workshop) sur la rédaction d’articles
 
 
19h30
Dîner à l’institut franco-japonais
会食 :日仏学院にて

Les intervenants se verront offrir le repas par l’ambassade de France.
発表者 の会食はフランス大使館より提供されます。

Plan d’accès 地図 http://www.ifjtokyo.or.jp/institut/map.html

   

 

Jeudi 18 juillet 2002 年07月18 日 (木)
14F, Salle 1412 号室
9h45 - 12h00
Exposés 発表 : interactions avec l’extérieur
Président de séance 議長 chairman : Ulrich APEL

9h45 - 10h10

David THEVENIN :
Multi-Access User Interface for Papillon

10h15 - 10h40

Emmanuel PLANAS :
Papillon project and Industrial Businesses: how they could cooperate

10h45 - 11h00
Pause café 休憩

11h00 - 11h25

Valérie BELLYNCK :
Bases lexicales multilingues et objets pédagogiques interactifs
Multilingual Lexical Databases and Web Based Interactive Language Learning Objects

11h30 - 11h55

Fatiha SADAT :
A Combination of Models for Bilingual Lexicon Extraction from Comparable Corpora

12h00 - 13h45
Pause déjeuner 昼食
13h45 - 14h15

Jean-Marc DESPERRIER :
Analyze of the results of a collaborative project for the creation of a Japanese-French dictionary.

14h15 - 16h00
Table ronde :
Construction lexicale coopérative
16h00 - 16h15
Cérémonie de clôture 閉会
16h15 - 16h30
Café d’adieu 休憩
16h30 - 17h15
Réunion interne au projet 内部デイスカッション

structuration du projet (tâches, groupes de travail, comité directeur)

17h15 - 18h15
Réunion interne au projet 内部デイスカッション

programme pour 2002-2003, prochaine réunion, prospective

Liste des auteurs et articles

Ulrich APEL

WaDokuJT - A Japanese-German Dictionary Database. 5 p.

Valérie BELLYNCK

Bases lexicales multilingues et objets pédagogiques interactifs : Sensillon pour Papillon. 13 p.

Multilingual Lexical Databases and Web-based Interactive Language Learning Objects: Sensillon for Papillon.

Lim BENG TAT & Tang ENYA KONG (presented by G. SÉRASSET)

Report on Possible Processes involved and information usage in the Papillon Project for WSD. 3 p.

Vincent BERMENT (presented by Ch. BOITET)

Several Technical Issues for Building New Lexical Bases. 5 p.

Jim BREEN

Practical Issues and Problems in Building a Multi-Lingual Lexicon. 6 p.

Christian BOITET

The translation of examples, citations, definitions and glosses in the Papillon project. 10 p.

Jean-Marc DESPERRIER

Analyze of the results of a collaborative project for the creation of a Japanese-French dictionary. 10 p.

Kyoko KURODA

Divergences de Traduction : cas des structures argumentales du japonais et du français. 17 p.

日仏動詞の項構造のずれについて

Mathieu LAFOURCADE

Automatically Populating Acception Lexical Database through Bilingual Dictionaries and Conceptual Vectors. 16 p.

François LAREAU (Presented by M. MANGEOT)

A Practical Guide for Writing DiCo Entries. 4 p.

Mathieu MANGEOT-LEREBOURS

How to Import an Existing XML Dictionary Into the Papillon Plateform. 10 p.

Proposal Changes for the Monolingual XML Schema. 7 p.

Emmanuel PLANAS

Papillon project : what do we want to achieve, and how. 5 p.

Papillon project and Industrial Businesses: how they could cooperate.

Laurent ROMARY

An abstract model for the representation of multilingual terminological data: TMF – Terminological Markup Framework. 9 p.

Fatiha SADAT

A Combination of Models for Bilingual Lexicon Extraction from Comparable Corpora. 6 p.

Didier SCHWAB & Mathieu LAFOURCADE

Hardening of Acception Links Throught Vectorized Lexical Functions. 17 p.

Gilles SÉRASSET

Current Status of the Papillon Server Development. 7 p.

Aree TEERAPARBSEREE (Presented by G. SÉRASSET & Ch. BOITET)

A Practical Guide to Lexical Data Acquisition with Recupdic. 17 p.

David THEVENIN

Multi-Access User Interface for Papillon. 8 p.

Mutsuko TOMOKIYO

Report on lexical description for monolingual dictionaries in Japanese, French and English in the Papillon lexical data base. 13 p.

Keita TSUJI

Extracting French-Japanese Word Pairs from bilingual Corpora Based on Translation Rules. 4 p.

Michael ZOCK

Electronic dictionaries for men, machines or for both? 6 p.

Formulaire d’inscription

登録用紙

Registration Form

Nom name :

Prénom first name :

Courriel メール email :

Choisissez un mot de passe
パスワードを選んで下さい :
Choose a password

Mardi 16 日(火) Tuesday :

Mercredi 17 日(水) Wednesday :

Jeudi 18 日(木) Thursday :

Dîner de mercredi soir 17 日(水)の会食

 

Si vous ne pouvez vous enregistrer en ligne, retournez l'inscription par courrier ou fax à :

もしオンラインのレジスターは出来ませんなら、登録用紙の返送先(郵送、ファックスにて受け付けます)

If you can't register online, please return the registration form by regular mail or fax to:

Mathieu Mangeot-Lerebours マンジョ・マチュー

National Institute of Informatics

国立情報学研究所

Hitotsubashi 2-1-2-1913

〒101-8430

Chiyoda-ku

東京都千代田区

〒101-8430 TOKYO

一ツ橋2-1-2-1913

Fax: +81-3-3556-1916

mailto:mangeot@nii.ac.jp