マック人と人をでつなぐ〜知識に繋ぐ〜

デジタル的知識の姿形、それはデータベース

パソコンが理解できる知識とは何か?

 人間がアナログ的に知識を記録していく場合、その知識にはビジュアル的なレイアウトが必要になる。レイアウトさえしっかりしていれば、本を開いたときにどれがタイトルでどこからが本文でといったことがひと目で分かる。

 人間はページ中にある要素を経験的に識別できる能力を持っているが、残念ながらコンピュータにはそれがない。ワープロソフトの「Microsoft WORD」を使って文章を書いたしよう。その文章ファイルを他人に手渡した際、もし相手がWORDを持っていなかったら開くことはできない。その場合、手渡す人はファイルをテキスト形式に変換すればよいが、元のレイアウトに関する情報はすべて失われる。フォントやスタイルといった情報も含まない、プレーンなテキストになってしまうのだ。
 人間なら、そんなテキストファイルからでも内容を把握して、レイアウトを組み直すことが可能だ(もちろんオリジナルとは異なるが)。これに対しコンピュータの場合は、いったんテキスト化されたファイルを見て、タイトル、見出し、本文などを自動的に配置し直すということはできない。コンピュータにとって、タイトルも見出しも同じものにしか映らないからだ。つまり、コンピュータ同士でデータの互換性を保つには、元のすべての情報を含むWORD形式でなければならない。

 最大の問題となるのは、WORDというソフトが将来消えてしまったときだ。いまはベストセラーの製品かもしれないが、はたして10年後、20年後はどうか? 
 せっかく書いた文章を、開いて読む方法が存在しない可能性がないともいえない。紙に記録された情報と大きく違う点がここにある。世界中のワープロソフトが同一のファイル形式を扱うことができればそんなトラブルはなくなるが、現実的にはそれは不可能なことだ。
 ということは、デジタルな知識はメディアそのものの耐久性以外に、長期間にわたって保存することができないということか? そこで注目されているのが、SGML(Standardized Generalized Markup Language)だ。詳細は専門書に譲るが、SGMLは元々、アメリカ国防省が大量の軍事文書を扱うために生まれた世界的な標準形式。誕生してから約12年が経つが、構造上の変化が一切なく、今後も不変のフォーマットとして存在し続けていくという。
なぜ、そんなことが可能なのか?実はSGMLは、データベースの一種なのだ。

 コンピュータにとってデータベースは最も理解しやすいファイル構造で、しかも管理しやすく検索が速いといった利点が ある。人間は、レイアウトによって情報をオーガナイズすると述べたが、SGMLはレイアウト情報を一切含まず、あくまでも文書構造のみを規定している。その意味では非人間的だが、HTML同様、樹形構造をしたページの記述にも最適な、マルチメディア文書向きのフォーマットとして普及すると期待されている。

トップに戻る I 前のページへ I 次のページへ