【論文紹介-番外編1】日本語クロスワードパズルを解く(2002)

こんにちは。
在野の知的遊戯研究者、ちいたべあです(かっこよく名乗ってみた)

いつもは人狼関係の論文を紹介しているこのブログですが、今回は番外編ということでクロスワードパズルを題材とした論文を紹介します!

今日の論文

情報学広場:情報処理学会電子図書館

抄録

言語資源を利用して、日本語クロスワードパズルを機械的に解く方法について検討した。日本語クロスワードパズルでは、アメリカン・スタイルのクロスワードパズルよりも長いカギが与えられ、カギのなかに特定の種類の連想を示唆するヒントが隠されていることが多い。このヒントを認識して連想の種類を特定し,それに基づき言語資源を探索して答の候補を推定する方法を考案した。実装したシステムの18パズル(総計317単語)に対する単語正解率は44%であった。

内容

日本語のクロスワードパズルを解くシステムを作る研究。英語のクロスワードを解くシステムの研究はほぼ終わっているのですが、英語のクロスワードと日本語のクロスワードはルールが少し違うので、まだまだ研究できるよねってことらしいです。

論文の中ではまず、クロスワードで使われる「カギ(「答えを導出するための設問」)」について分類がなされています。
それによるとカギは、パターンとジャンルによって分類可能だとすぐに気が付きます。

パターンとしては、穴埋め・列挙・指示詞・標準の4種類。
ジャンルとしては、一般常識や社会・理科などなど。

一方で、人間がカギからワードを推定するプロセスとしては、”連想構造”が重要です。
たとえば、「無料のこと」というカギから「タダ」というワードが導かれる場合、「のこと」という文章から答えが「無料」の類義語であることを推定して、指定の文字数のワードを探しているはずです。

あるいは、「レフトの反対」(ライト)というカギの場合は、レフトの対義語を思い浮かべて、その中から3文字のワードを思いつきます。

これらから、「カギは連想構造を持ち、その構造が答えを制約する」と言えます。

感想

論文にはこの後、連想タイプの一覧が載せられており、これらをプログラムで実装していったこと、作ったプログラムの正解率などが書かれています。

問題文の分類として、ジャンルだけでなく、人間が答えを考えるプロセスにヒントを得た文章構造によって分析しているところが情報や言語学ならではの学術的な切り口だと感じました。

昔やっていた競技クイズで自作の問題文を管理する時に、本論文におけるパターンとジャンルでは整理していましたが、連想タイプという概念は考えたこともありませんでした。

以前大学の講義で、競技クイズ用の問題文を自動生成するためのAIについてレポートを書いたことがありましたが、今回読んだ論文の内容もその時に知っておけば、また違う構想になったのかなあと思います。これについては改めて考えてみたいです。

謎解きにも、どのようなプロセスで参加者が問題を解いていくかという視点は重要なので、引き続き勉強していきたいと思います。

この記事もどうぞ

chitabea.hateblo.jp