© SINCE 2016

2,000億の言葉の宇宙

 

世界の言語のデジタル辞書作成

 

 TaN氏が開発した画期的なデジタル辞書検索ソフトPDICは、ユニコードを使用しているので、どんな言語でも扱うことができ、この「チェコ語日本語・日本語チェコ語辞典」のような高速・高機能デジタル辞書をどんな言語でも作成することができます。また、反転辞典自動作成機能があるので、「A語B語辞典」を作れば「B語A語辞典」を自動的に作ることができます。

 TaN氏考案の「言語プロセッサ」のシステムを使って既にチェコ語とロシア語の変化形→原形変換システムの構築に成功しましたが、この成功から、他のスラヴ諸語、恐らくは印欧語一般の変化形→原形変換システムの構築が可能だと推測されます(当該言語の文法に通じている者なら可能でしょう)。そしてこれが構築できれば、当該言語による自動辞書引きも可能になります。

 PDICは、1つの辞書に最大20億語まで登録することができ、最大100個の辞書を同時に――つまり、すべての辞書が合体した一つの辞書のように――使うことができます。また、「スラヴ諸語統合大辞典」、「ゲルマン諸語統合大辞典」、「ロマンス諸語統合大辞典」等々といった、一体化した辞書グループを作ることも簡単にできます。 

 テスト用のスロヴァキア語辞典、ポーランド語辞典、ロシア語辞典を、チェコ語辞典と同じ辞書グループ「スラヴ諸語統合辞典」に入れて統合した例。「maly」で検索すると、同一辞書グループのすべての辞書で同時に検索し、何語の辞書かも示すことができる。

 世界の様々な言語のデジタル辞書をパソコンやスマートフォンやタブレットに入れて、何語かを気にせずに、いつでも気軽にさっと辞書を引くことのできる時代が来るでしょう。人は、頭の中に宇宙を入れることができないように、何億もの言葉を覚えることはできません。しかし、PDICがあれば、20億の言葉の星から成る星雲が100個集まった2,000億の言葉の宇宙からでも、一つ一つ色の違う星の光をさっと呼び寄せて手元を照らすように、言葉の意味を知ることができるのです。この「PDICデジタル チェコ語日本語・日本語チェコ語辞典」は、そんな宇宙の中のユニークな一星雲です。

 

(PDICで既に使える各国語辞書についての情報は、こちらにあります。)

  

 自分でデジタル辞典を作成したい方は、「PDICデジタル辞典作成マニュアルおよびツール」のタブをご覧ください。