> HOME > データ一覧 > NTCIRテストコレクション > FinNumタスクデータ

NTCIR FinNumタスクデータ利用方法 (研究目的用)

データ概要

Numeral is the crucial part of financial documents. In order to understand the detail of opinions in financial documents, we should not only analyze the text, but also need to assay the numeric information in depth. Because of the informal writing style, analyzing social media data is more challenging than analyzing news and official documents. FinNum is a dataset for fine-grained numeral understanding in financial social media data - to identify the category of a numeral.

データ詳細

データの言語

英語

フォーマット

In provided dataset, participants will get "idx" (the index of the tweet), "id" (the id of the tweet), "target_num" (the target numeral), "category" (annotated result), "subcategory" (annotated result), and should rebuild the data via Stocktwits API. Note that, three categories (Indicator, Quantity, and Product/ Version number) do not have subcategory. Thus, the category and subcategory information are the same for these three categories.

データ例

▼ クリックで展開

ライセンス

クリエイティブ・コモンズ・ライセンス
NTCIR-14 FinNum data は クリエイティブ・コモンズ 表示 - 非営利 - 継承 4.0 国際 ライセンスの下に提供されています。

参考文献

ご利用の際には、以下の論文を参照してください。

Chung-Chi Chen, Hen-Hsen Huang, Yow-Ting Shiue, and Hsin-Hsi Chen. 2018. Numeral Understanding in Financial Tweets for Fine-grained Crowd-based Forecasting. In Proceedings of the 2018 IEEE/WIC/ACM International Conference on Web Intelligence (WI 2018), Santiago, Chile.

ダウンロード

こちらからダウンロードできます。

NTCIRメーリングリストについて

NTCIRプロジェクトからのお知らせ等をメーリングリストで配信しています。ご興味をお持ちの方は「NTCIR Projectメイリングリスト」のページをご覧になり,ご自身で登録して下さい。

問い合わせ窓口(データ内容について)

NTCIR-14 FinNum タスクオーガナイザ

電子メール:
finnum [at] nlg.csie.ntu.edu.tw

問い合わせ窓口(事務局)

〒101-8430
東京都千代田区一ツ橋2-1-2
国立情報学研究所 IDR事務局
電話: 03-4212-2009
電子メール:idr [at] nii.ac.jp
※問い合わせ等はできるだけ電子メールでお願いします。