National Institute of Informatics |
国立情報学研究所 |
Hitotsubashi 2-1-2-1412 |
〒101-8430 |
Chiyoda-ku |
東京都千代田区 |
〒101-8430 TOKYO |
一ツ橋2-1-2-1412 |
|
|
多言語語いデータ・ベースは言葉の全ての利用可能な意味への容易なアクセスを提供し、かつ様々なタイプの語いの情報を使用し、テキスト処理を行う多くのコンピュータ・プログラムの生成を許可する為に構築され、構造化した情報の倉庫です。過去10年以上に渡り、自然言語処理に係る研究所及びインターネット上には語い資源の蓄積があり、この蓄積は、研究者が行う操作及びこれらの資源へのアクセスの組織により解決しようとする問題を提起します。これらのデータ・ベースは言語科学における新たな人間言語技術開発研究の核となるポイントになるでしょう。ゲノムのデータ・ベースのように、この語いデータ・ベースは複雑かつ進化する豊富な注釈を持つ倉庫であり効率的な表現の開発、索引付け及び検索の為、斬新かつ独特な試みを行っています。ワークショップの目的は、多言語語いデータ・ベースの中で既存の研究を生かし、かつ重要な問題を明確にすることであり、より広くワークショップにて、新しいパピヨン「多言語語いデータ・ベースコミュニティー」における研究の論点を定義し、このコミュニティーと他のコミュニティー(辞書編集、翻訳、人間コンピューター相互作用、データ・ベースコミュニティー等)間における進行中の問題及び成果の交換を行います。パピヨンは、出典先(フランス語、英語、日本語、タイ語、ラオス語、ベトナム語)から派生した多言語語いデータ・ベース及び電子辞書のウェブ上の構築及びより協力的な使用法を目指したプロジェクトであり、参加者は、データ・ベース、言語学、計算言語学、注釈及びマークアップを含む一連の領域を提示するでしょう。
より詳細な情報を入手されたい方は、パピヨンウェブサーバ http://www.papillon-dictionary.org を御覧下さい。
マンジョ・マチューにメールを下さい mailto:mangeot@nii.ac.jp
Les bases lexicales multilingues sont des serveurs de données lexicales structurées. Ces données peuvent être utilisées soit par des humains pour définir leur propre dictionnaire soit par des applications de traitement des langues.
Ces dernières années, nous assistons à une accumulation de ressources lexicales dans les laboratoires de traitement automatique de la langue ainsi que sur Internet. les bases lexicales multilingues tentent de résoudre ce problème d'accumulation en organisant la manipulation et l'accès à ces ressources. Ces bases sont un point central de la recherche dans les sciences du langage et dans le développement des technologies de la langue. Comme les bases de données génomiques, les bases lexicales sont complexes, évoluent, constituent des serveur richement annotés et posent de difficiles problèmes scientifiques dans de nombreux domaines.
Les buts de cet atelier sont de rendre compte de la recherche existante dans les bases de données multilingues et d'identifier les problèmes clés. Plus généralement, l'atelier aidera à definir des questions de recherche de la nouvelle "communauté des bases lexicales multilingues" autour de Papillon et initiera les échanges sur les problèmes en cours et les résultats entre cette communauté et les autres communautés (lexicographie, traduction, interfaces hommes-machine, bases de données au sens large, etc.).
Papillon est un projet de construction et d'usage collaboratifs sur la toile d'une base lexicale multilingue et de dictionnaires dérivés en source ouverte (français, anglais, japonais, lao, thai et vietnamien). L'atelier est destiné à des participants de plusieurs specialités incluant les bases de données, la linguistique, la linguistique-informatique, les annotations et XML.
Pour plus d’informations, consultez le serveur du projet à l’adresse suivante : http://www.papillon-dictionary.org
Vous pouvez aussi contacter Mathieu MANGEOT par courriel a l’adresse suivante : mailto:mangeot@nii.ac.jp
Multilingual lexical databases are repositories of structured information built to provide an easy access to all available meanings of words and to allow the creation of a number of computer programs that will process texts using various types of lexical information.
Over the last decade, there has been an accumulation of lexical resources in NLP laboratories and on the Internet. This accumulation poses problems which researchers try to solve by organizing the manipulation and the access to these resources. These databases are a central point of research in the language sciences, and in the development of new human language technologies. Like genomic databases, lexical databases are complex, evolving and richly annotated repositories, and pose interesting challenges for efficient representation, indexing and query.
The goals of the workshop are to take stock of existing research in multilingual lexical databases and to identify the key problems. More broadly, the workshop will help define the research questions of the new Papillon "multilingual lexical database community" and initiate the interchange of relevant ongoing problems and results between this community and other communities (lexicography, translation,
human-computer interactions, database community at large).
Papillon is a project of construction and collaborative usage on the web of a multilingual lexical database and electronic dictionaries derived in open source (French, English, Japanese, Thai, Lao, Vietnamese) Participants will represent a range of domains including databases, linguistics, computational linguistics, annotation and markup.
For more information, please consult the Papillon web server at: http://www.papillon-dictionary.org
You can also contact Mathieu MANGEOT by email at: mailto:mangeot@nii.ac.jp
|
Mardi 16日( 火) |
Mercredi 17日( 水 ) |
Jeudi 18日( 木 ) |
---|---|---|---|
|
Exposés : papillon général |
Exposés : projets partenaires |
Exposés : interactions |
9h45 |
Ouverture : Kinji ONO |
E7 Jim Breen |
E14 David THEVENIN |
10h10 |
E1 Emmanuel PLANAS |
E8 Ulrich APEL |
E15 Valérie BELLYNCK |
10h45 |
Pause café 休憩 |
Pause café 休憩 |
Pause café 休憩 |
11h00 |
E2 Gilles SÉRASSET |
E9 Laurent ROMARY |
E16 Emmanuel PLANAS |
11h30 |
E3 Mathieu MANGEOT |
E10 Keita TSUJI |
E17 Fatiha SADAT |
12h |
Déjeuner 昼食 |
Déjeuner 昼食 |
Déjeuner 昼食 |
|
Exposés : structure des articles |
Exposés : traduction et axies |
|
13h45 |
E4 Mutsuko TOMOKIYO |
E11 Christian BOITET |
E18 JM DESPERRIER |
14h15 |
E5 Mathieu MANGEOT |
E12 Kyoko KURODA |
Table ronde construction |
14h45 |
E6 Michael ZOCK |
E13 M. LAFOURCADE |
|
15h15 |
Posters P1-P5 |
Discussion libre |
Cérémonie de clôture |
16h15 |
Pause café 休憩 |
Pause café 休憩 |
Café d’adieu 休憩 |
16h45 |
Atelier sur les articles |
Atelier sur les articles |
Réunion interne Papillon |
19h30 |
|
Dîner à l’institut 会食 |
|
|
Mercredi 17 juillet 2002 年07月17 日 (水)
|
---|---|
9h45 - 12h00 |
Exposés 発表 : projets partenairesPrésident de séance 議長 : François BROWN DE COLSTOUN |
9h45 - 10h10 |
Jim BREEN : |
10h15 - 10h40 |
Ulrich APEL : |
10h45 - 11h00 |
Pause café 休憩 |
11h00 - 11h25 |
Laurent ROMARY : |
11h30 - 11h55 |
Keita TSUJI : |
12h00 - 13h45 |
Pause déjeuner 昼食 |
13h45 - 15h15 |
Exposés 発表 : liens interlingues et traductionPrésident de séance 議長 : Jim BREEN |
13h45 - 14h10 |
Christian BOITET : |
14h15 - 14h40 |
Kyoko KURODA : |
14h45 - 15h10 |
Mathieu LAFOURCADE : |
15h15 - 16h15 |
Discussion libre ディスカッション |
16h15 - 16h45 |
Pause café 休憩 |
16h45 - 18h45 |
Atelier (workshop) sur la rédaction d’articles |
|
|
19h30 |
Dîner à l’institut franco-japonais
|
WaDokuJT - A Japanese-German Dictionary Database. 5 p.
Bases lexicales multilingues et objets pédagogiques interactifs : Sensillon pour Papillon. 13 p.
Multilingual Lexical Databases and Web-based Interactive Language Learning Objects: Sensillon for Papillon.
Report on Possible Processes involved and information usage in the Papillon Project for WSD. 3 p.
Several Technical Issues for Building New Lexical Bases. 5 p.
Practical Issues and Problems in Building a Multi-Lingual Lexicon. 6 p.
The translation of examples, citations, definitions and glosses in the Papillon project. 10 p.
Analyze of the results of a collaborative project for the creation of a Japanese-French dictionary. 10 p.
Divergences de Traduction : cas des structures argumentales du japonais et du français. 17 p.
日仏動詞の項構造のずれについて
Automatically Populating Acception Lexical Database through Bilingual Dictionaries and Conceptual Vectors. 16 p.
A Practical Guide for Writing DiCo Entries. 4 p.
How to Import an Existing XML Dictionary Into the Papillon Plateform. 10 p.
Proposal Changes for the Monolingual XML Schema. 7 p.
Papillon project : what do we want to achieve, and how. 5 p.
Papillon project and Industrial Businesses: how they could cooperate.
An abstract model for the representation of multilingual terminological data: TMF – Terminological Markup Framework. 9 p.
A Combination of Models for Bilingual Lexicon Extraction from Comparable Corpora. 6 p.
Hardening of Acception Links Throught Vectorized Lexical Functions. 17 p.
Current Status of the Papillon Server Development. 7 p.
A Practical Guide to Lexical Data Acquisition with Recupdic. 17 p.
Multi-Access User Interface for Papillon. 8 p.
Report on lexical description for monolingual dictionaries in Japanese, French and English in the Papillon lexical data base. 13 p.
Extracting French-Japanese Word Pairs from bilingual Corpora Based on Translation Rules. 4 p.
Electronic dictionaries for men, machines or for both? 6 p.
Si vous ne pouvez vous enregistrer en ligne, retournez l'inscription par courrier ou fax à :
If you can't register online, please return the registration form by regular mail or fax to:
Mathieu Mangeot-Lerebours | マンジョ・マチュー |
National Institute of Informatics |
国立情報学研究所 |
Hitotsubashi 2-1-2-1913 |
〒101-8430 |
Chiyoda-ku |
東京都千代田区 |
〒101-8430 TOKYO |
一ツ橋2-1-2-1913 |
Fax: +81-3-3556-1916