筆跡鑑定とくずし字解読
崩し字の解読(古文書翻刻)を依頼されて解読していると、筆者の書き癖のある文字で苦労をすることがある。しかし、書き振りの特徴をつかむとだんだん解読のスピードが上がっていく。変体仮名や草書を一文字だけを抜き出して何という文字かと聞かれるとなかなか難しくどちらか判読しにくい文字もある。相当簡略化されると、サンズイも人偏もギョウ人偏も言偏等も同じ一本の縦画になってしまうからである。わずかな筆の動きにより異なる文字になることもあり、その筆先の動きを仔細にとらえる必要がある。したがって筆跡鑑定を志す者は、「くずし字解読(古文書翻刻)」を学んでおくと大変勉強になると考える。
今日、AIが古文書を80~90%解読できるようになった時代である。これからどんどん精度も上がっていくかと考えるが、個々人によって異なる筆癖を解読するには、そのような文字を相当集積しなくてはならないだろう。
現在、AIによるくずし字認識を研究開発するための基礎的なデータセットとして、人文学オープンデータ共同利用センターが「日本古典籍くずし字データセット」を公開しています。ひらがな(変体仮名)・カタカナ・漢字を文字または文字コードで検索できます。ただし、これまでは比較的読みやすいものが中心で、解読がより難しい字形も今後加えていくとのことです。
さらに、くずし字認識ビューアがあり、AIくずし字認識(一文字)機能を備えています。しかし、鮮明な画像でないと判読難しいようです。また、1ページ全体を認識したい場合は、「KuroNetくずし字認識サービス」を活用できるようです。しかしあくまで、日本古典籍データセットにある文字だけにしか対応していませんということです。まだまだこれからに期待したいですね。
.png)