SSブログ

文章の段落わけ [読書記録・日記]

来週開催される The 28th Annual Conference of the Japanese Neural Network Society (JNNS2018) では文章の意味的な段落分けについての発表をします。これは、人が文章を読むときに意味的に文章を分割しつつ(文章の意味的段落分け)、その段落の単位で一種の要約を構築して読んでいるのではないか、という仮説を提案し簡単な実験を行ったものです。
文章を要約しているというと多少ネガティヴな感じを受ける人もいるかもしれませんが、要約といっても、印象などを含む種々の情報を指します(国語の授業で要約しなさい、と言われるようなものに限らず、ああなんだか暖かい感じのする場面だった、というなものでも良いと思います)。私は要約なんかしていない!、と思われるかもしれませんが、残念ながら多くの人間は全ての単語や文を記憶できないので、おそらくなんらかの情報圧縮(要約)をして記憶しながら読んでいると思われます。では、文章を理解し鑑賞するには、どのような要約が有効なのか/しているのか、を調べようとした研究です。要約するには、要約範囲を決めないといけないので、要約のもっとも基礎的な過程として文章の意味的段落分けを調べています(このあたりは全体の理解と部分の理解の相互依存的な関係性=解釈学的循環があって、面白いところです)。

提案しているシンプルなモデルの基本的な主張は、文章には意図があって、その意図が書き尽くされたと読者が感じた地点で意味的な段落分けが行われる、というものです。一方で、既存のモデルの多くは、文の間の類似性の減少(段落間で類似性が減少する)の認識をもって意味的段落分けしている、とします。
これを調べるために、次の文が読めない条件で、どの程度読者間で一貫した意味的段落分けがなされるか(加えてもとの作者の段落分けとどの程度一致するか)を調べました。結果としては、次の文が読めなくても、読者間で有意に一貫した段落分けが可能でした。よって、読者は少なくとも次の段落との類似性の差異だけを手がかりに意味的段落分けをしているわけではなさそうです。しかし、文末表現など、当該段落内部にも種々の情報があるので、本仮説検証は仮説の洗練とともにさらに進める必要があります。

実際の文学作品では、こんなところで段落分けするのか、ああ美しいなあと思うことがよくあります。こういった予想外の段落分けは、文章理解に段落分けが重要な情報を持つことや、私たちがなんらかの意味的段落予測をして読んでいることを示唆しています。
まだまだ次のような予想外の段落分けをなぜ私たちが美しいと思えるか、その機序は今のモデルではなかなか表現・検証できませんが、少しずつ調べていきたいと思います。


------------
川上弘美『真鶴』、文藝春秋文庫版pp.220~221.からの一段落
「ベンチに座っている礼のからだを、さぐる。腰からわきばらへ、胸からくびへ、顎をつたってくち鼻ひたい、たまらなくなって口づけする、だえきが零れる、むさぼる、背中につよく腕をまわす、しめつける、名をよぶ、こいしい、こうして隣にすわってすきまなく寄っていても、こいしさは薄まらない、かなしくて、かなしくて、からだが消えてしまいそうになる、消えてしまって、きもちだけになる、きもちも散って、そこには何もなくなってしまう、それでもこいしさは消えない、果てがない、鷺が飛んでゆく。」
------------


なお発表予定は以下の通りです。
JNNS2018
Miho Fuyama, Shohei Hidaka., Can readers recognize unit of summarization for reading?: an analysis of text segmentation task. (accepted)



真鶴 (文春文庫)

真鶴 (文春文庫)

  • 作者: 川上 弘美
  • 出版社/メーカー: 文藝春秋
  • 発売日: 2009/10/09
  • メディア: 文庫



nice!(0)  コメント(0) 

nice! 0

コメント 0

コメントを書く

お名前:
URL:
コメント:
画像認証:
下の画像に表示されている文字を入力してください。

※ブログオーナーが承認したコメントのみ表示されます。