木簡の自動読み取り、開発進む
・朝日新聞 2005/3/4
奈良文化財研究所では木簡の文字を自動的に読み取るシステムの開発を進めている。遺跡から出土する木簡は文字が薄かったり、壊れていたりして古代文書の専門家でも解読に苦労するものである。奈良文化財研究所平城宮跡発掘調査部の渡辺晃宏・史料調査室長らのグループが木簡の文字を自動的に読み取って活字データに変換するOCR(光学的文字自動読取装置)の開発を目指している。過去に解読された文字の画像をもとにコンピュータに蓄積した字形のパターンと読み取りたい木簡の文字とを照合して判読できるようになる。照合に使える文字画像が多ければ、より精度の高い字形パターンを作ることができるので「木簡字典」と名づけたデータベースが製作中であり、整理を終えた4800字分の画像がホームページで公開されている。木簡は文字がきれい見えないこともあり、読み取りには文字の断片を見て、文字を推測、古文書字典などとつき合わせて文字を特定しなければならないこともある。しかし、研究グループの馬場基研究員によると開発するOCRはこうした文字の場合、可能性のある文字がいくつか示されるので、これをヒントに字を特定できると話す。木簡は古代の生活の様子を明らかにしてきた。新システムが本格稼動して木簡解読が進めば、文献ではわからない古代の暮らしの実像が明らかになることは間違いない。しかし、木簡は平城京跡出土のものだけでも17万~18万と膨大で、「人力」だけでは解読が進まず、データの蓄積にも時間がかかるので、システムの完成はまだ先になるが、奈良文化財研究所は今年中に1万点の画像を整理したいとし、各地の研究機関との協力を進めている。