論文で見つけたNLPのデータセット一覧
JSNLI(自然言語推論)
データセットは TSV フォーマットで、各行がラベル、前提、仮説の三つ組を表します。前提、仮説は JUMAN++ によって形態素分割されています。以下に例をあげます。
ラベル | 前提 | 仮定 |
---|---|---|
contradiction | 家の前の雪の山の前に立っている数人の人と、シャベルを使っている人。 | マイアミの暑い夏の日です。 |
contradiction | 人が2頭の馬の間にひざまずいている。 | 2頭の牛の間に人が立っています。 |
contradiction | 人は森の中の崖に登り、他の人は見ています。 | 人が森の中の木に登る。 |
entailment | 紫のチュチュの女の子が庭で踊ります。 | 女の子は外にいます。 |
entailment | 紫のチュチュの女の子が庭で踊ります。 | 女の子はチュチュを着ています。 |
entailment | 緑のジャージのトップと青いパンツの女の子が、ゴール近くでサッカーボールを蹴る準備をしています。 | 女の子がゴールを決めたい |
entailment | 空のスタンドでボールをキャッチするためにジャンプするフットボール選手。 | ボールはフットボール選手の方向に投げられています。 |
entailment | 空のスタンドでボールをキャッチするためにジャンプするフットボール選手。 | フットボール選手がボールをキャッチします。 |
entailment | 緑のセーターとバックパックを身に着けている小さな犬が雪の中を歩きます。 | 犬が雪の中を歩きます。 |
entailment | 犬がコテージ近くの森を駆け抜けます。 | コテージは犬が走っている場所の近くにあります |
entailment | 男はステレオ機器を使用します。 | 男性がオーディオ機器を使用しています。 |
neutral | バスローブを着た赤ちゃんがシャワーを待っています。 | 赤ちゃんは母親がシャワーを浴びるのを待っています。 |
neutral | 白いベスト、ピンクの袖、花とピンクのニット帽子の少女は、木の花の花を見ています。 | 女の子はパーティーのために服を着ています。 |
neutral | 若い女の子が自動車を洗う。 | 女の子は外にいます。 |
neutral | 若い女の子が自動車を洗う。 | 女の子は赤いバケツの水を持っています。 |
neutral | 花嫁介添人がマイクで乾杯し、他の2人の花嫁介添人と紳士が見ています。 | 花嫁介添人は、花嫁の子供時代についての物語を語っています。 |
neutral | 若い女の子がプールで泳いでいます。 | 女の子は水泳大会のために練習しています。 |
neutral | 青いフードの小さな子供が窓の外を見ています。 | 子供は興奮しています。 |