> ホーム > 知恵と勇気道具 > 文書交換の作法

文書交換の作法

情報交換のためのフォーマットとなるとちょっと意味が広いのでここでは「文書」に限定して話を進めます。他の情報のモード(静止画、動画、音声など)に関しては端折りますのであらかじめご容赦を。(初出不明)

割と大幅に加筆しました。ver.3 くらい?(2001.12.)

文書交換の考え方

ネットワーク時代のコンピューティングに大切なことは、より汎用性の高いフォーマットを用いることだと思います。いかに特定のアプリケーションの性能が高く多機能でも、それで作られた情報(文書でも画像でも音でも)が他の人にとって意味のあるものになるかどうかは、まず、そのファイルを開けるか(読めるか見れるか聞けるか)に掛かってきます。そのためには適切なフォーマットを選ぶことが重要になります。

早い話、「開けないファイルには用はない」のです。誰だ、断りもなしに Word のファイルを送ってくるやつわ!

他の人の作ったファイルを自分が開く場合、あるいは逆に自分の作ったファイルを他の人が開く場合は、お互いに自由に開けるように工夫する必要があります。具体的には

などの方法があります。

しかしその前にどうしても避けて通ることのできない大問題があります。それは機種依存文字フォントです。

[ ↑ content ↑ ]

機種依存文字

よく言われていたのはワープロ専用機時代は各社で絵文字のレパートリが異なるということであり、パソコン通信時代には PC-98(国民機)と PC/AT互換機(いわゆる DOS/V マシン)と Mac で一部の記号が異なるというものです。これはもうほんとに口は酸っぱいは耳にタコができるは、そりゃもう大変な問題なのでした。

こういう問題を避けるために、○つきの数字は ( ) つきの数字に、ローマ数字はアルファベットの I や V, X を代わりに使うようにします。

機種依存文字については詳しいサイトがいくつもあるので探してみてください。

フォント

文字の形も重要です。同じ文字でも違うデザインのフォントはたくさんあり、そのフォントの違いが意味の違いやニュアンスの違いに繋がることもあります。まして厳密なレイアウトにおいてはフォントの違いは致命的です。

しかしフォントというのは、基本的に使っているシステムに固有のものです。(最近はフォントを埋め込んで送ることができるようになってきていますが。)要するに相手が同じフォントを持っていないと同じようには見えないってことです。

これは、コンピュータ上のデータってのはそういうものなのです。諦めたくない場合は勉強しましょう。決して、自分の使っているのと同じ環境を使っていないからといって相手をなじってはいけません。

個人的には Word, Excel 依存体質の方には「処方箋」を用意させていただきますが :)

[ ↑ content ↑ ]

テキストファイルを使う

ほぼ完全にプラットフォームを選ばず、文字データ”だけ”を共有するのであればこの方法が最も確実でコストも掛かりません。ただし、レイアウト情報は一切含まれません。当然、表もだめ。(工夫次第でそれらしく見せることはできますが、フォントの設定一つでダメになります。)

ただ気をつけなければいけないのは改行コードと文字コードの問題で、プラットフォームが異なると使える文字の種類や改行の約束が異なります。もっとも最近ではテキストエディタと呼ばれる、テキストファイルを専門に扱うソフトがこのプラットフォームの違いをかなり吸収してくれるようになりましたが、それでもすでに触れたように「ない文字」は表示できない。いわゆる機種依存文字というものがあるのも事実です。例えば Windows の世界で馴染みの深い@という丸つきの数字、これは Mac では○1という風に表示されません。

文字コードといえば Unicode の問題がいっとき賑やかでしたが、残念ながらわたしゃその方面には詳しくありません(^^;(そのうち勉強しよう、と言っているうちに Unicode の方のバージョンが上がっていく…。)

固定幅で使う

古いプログラミング言語なんかでよく使われていた手法です。ここからここまでの桁はこのデータ、ここからここまでの桁はこのデータ、という風に区切ってデータを格納していきます。伝統的にはコンピュータの世界はデザインやコミュニケーションの世界ではなく、計算の世界です。その当時は今みたいに色とりどりのフォントがあったわけではなく、すべて等幅フォントでしたので、こういう発想はかなり自然でした。

COBOL は経験ないから分からないけど、FORTRAN 77 とか、完全に桁数に依存してるもんね。

この方法は見た目でデータのかたまりを読みやすいのですが、現在では機械はともかく、人間は先に挙げたようにフォントの設定ひとつで正しくデータを解釈できなくなります。また、あるデータに使える幅が決まっているので、データ構造について柔軟性に欠けます。

でも手軽です。

CSV を使う

ルールつきのテキストファイルというものがあります。その一つが CSV。Camma Separated Values の頭文字で具体的にはこんな感じ。

1,2,3,4
2,3,4,5
"こんな","感じ","なのよね","いやほんと"

上のもので4列3行の表を表します。文字をダブルクォーテイション(")で囲む、全部ダブルクォーテイションで囲む、など、多少の違いはありますが、だいたい同じです。

これはテキストファイルで表を安定して表現するための工夫です。ほとんどすべての表計算ソフト、データベースソフトで扱えます。

HTML を使う

HTML は基本的にはホームページ用ですが、共通のデータ形式としても利用できます。何しろ「ワールドワイド」っちゅーくらいですから、かなり多くの人にある程度のレイアウト情報を持たせてデータを渡すことができます。

最近のワープロはだいたいどれも HTML へ書き出す機能を備えているので、それを利用すれば自分と相手の使っているワープロが食い違っていてもレイアウト済みのデータを相手に渡すことができます。厳密なレイアウトを実現するのはソフトによってはかなり難しいですが、スタイルシートや TABLE などの技を組み合わせれば十分に実用的な精度が確保できると思います。

[ ↑ content ↑ ]

まったく同じアプリを使うよう取り決める

アプリケーション依存のデータのやりとりの様子

同じ会社の中、あるいは学校の中ではこういう取り決めで運用することができるでしょう。これがレイアウト情報を含む場合は最も簡単で確実であることは間違いありません。

ただ、完全に同じものを再現するのは意外に難しく、使っているフォントが違うと簡単にレイアウトは狂ってしまいます。

また、まったく関係のない組織に所属していたり、たまたまそのときだけのつきあいの場合、相手に同じソフトを使うように強要することはできません。確かに Word や一太郎はメジャーですが、全員が使っているわけではないのです。

この方法はウチワでのみ行うのが正解でしょう。アウトソーシングやオープン化が言われる今日ではこの方法が通用しない場面も多くなると思います。特に海外とのつきあいができたら一太郎では全滅でしょうし…。私のように Windows 使いのくせしてクラリスワークスが好きっていう人もいるでしょうし、OASYS が最高とか言う人たちには一太郎だろうが Word だろうが強制されるのはまっぴらごめんなわけです。

ただ、やっぱり「業界標準」というのは存在します。印刷の世界で PostScript がそうであるように、やはり Word が常識な世界も存在するでしょうし、一太郎が常識の業界もあります。問題は相手がその常識の中にいる人なのかそうでないのか、ちゃんと考えてねってとこなんです。

え、なに。一般的には Word が常識だろ? うぉーっ。

[ ↑ content ↑ ]

変換ソフト(あるいは万能ビュワーソフト)を使う

リッチテキストコンバータコンバートスターなどの変換ソフトを使うと、現在世の中に出回っているワープロ文書のうちの大部分は読み書きが可能になります。もちろん変換を行うわけですからまったく同じにはなりませんけど、それでもこれ一つあればたいていの場面でオッケーと言えるでしょう。読むだけなら自在眼(変換結果を保存はできないビュワーソフト)などの選択肢もあります。プレインストールで様々なソフトのついてくるパソコンを買った人は、けっこうお世話になってるんじゃないかな?

リッチテキストコンバータ

ただし、このソフトをワープロソフトの他にも持っているとなるとそれ相応の出費ですし、持っている人しかこの恩恵にあずかることはできません。これでは同じアプリを使うようにするのとほとんど変わりありません。そのうえ手間が増えています。やはりこの方法は緊急避難的なもので、常用するものではないでしょう。

また、いろんな人に「文書を配布する」ことが目的の場合は不適当です。読む側が書く側に合わせないといけないわけですから。これじゃ「立体メガネを掛けないと見ることのできない映画をテレビで流すようなもん」です。テレビやパソコン、メールのできる環境は結構普及していると思いますが、変換ソフトの普及率はこれに比べればずいぶん低いはずですからね。

しかも、困ったことに Mac ではマネできない方法なんですよね(^^; Mac で動くこの手のソフトは聞いたことがありません。

[ ↑ content ↑ ]

電子ブック形式を使う

電子ブックと言ってもザウルスでエロ小説を読むとかそういうことではなくて、ExpandBookT-TimeCyberBook などのことです。

本というのは文書の配布・閲覧の最たる形ですからね。コンピュータがネットワーク化し始めた最初の頃から、こうした電子ブックというのは考えられてきていたのです。Word のマクロウィルスがメールで世界中に広がる何年も前から、こうしたことは考えられてきていたのです。

その知見を利用しようというのが電子ブック形式を使う、ということの意味です。この方法のメリットは、ビュワーソフトがたいていフリーソフトである、ということです。また、Web ブラウザ用のプラグインが用意されていることも多いので、Web での文書の配信に向いています。

なのですが、いかんせん「電子ブック」という「もの」を作ることに開発の主眼があったため、一般的な文書作成の道具としてこれを採用するにはさすがに無理があります。A4 で、とか B5 で、といった印刷に利用するのにもちょっと無理があります。また、この電子ブックを作成するソフトは一般のワープロとは操作性も異なり、普段の文書作成にはちょっと使いにくいものです

近年(2001.12.現在)、ついに Adobe が PDF の技術を基本にした eBook というものが流通し始めました。電子ブックを作るソフトを選ばず、精度の高いレイアウト、画像を含むことができるこの電子ブックはいよいよ本命?

[ ↑ content ↑ ]

Acrobat PDF / DocuWorks / KacisBook などを使う

印刷にも使いたいし、レイアウトは保持したい。でもワープロは普段使っているものがいい? なんてわがままな…。

この要求を解決するいちばん手っ取り早い方法は Adobe PDF でしょう。文書そのものは自分の好きなワープロで作り、これを Adobe Acrobat というソフトで PDF 形式に変換します。この PDF を読むためのソフトは Adobe が無料で公開していますし、Windows / MacOS 以外のプラットフォームでも有志のフリーソフトが対応しています。つまり、

などのメリットがあります。最近はカタログを PDF で載せるメーカーがずいぶん増えてきましたね。

Acrobat PDF

ファイルサイズは、文字のレイアウトだけの場合は非常に小さくなります。Word や一太郎のファイルよりも小さいんじゃないでしょうか。ですから転送の負担は非常に小さくなります。ただし、きれいな図や絵を入れようとするとそれなりに大きくなります。まーこれは解像度の問題が絡んできますのでなかなか難しいところです。

ただし、この方法はワープロなどの文書を作成するソフトのほかに、Acrobat PDF に変換するソフトが必要です。ワープロなどの文書作成ソフトのほかに変換ソフトが必要だという意味では上の方法と同じく、出費が増えます。ただ、読む側が負担するのか、書く側が負担するのかが違う、ということです。

もうひとつ、DocuWorks という選択肢もあります。これは Xerox の開発したもので、業務で使っているところもなかなか多いようです。

これは作成ソフトが DocuWorks(Windowsのみ)に限定されるという問題はありますが、Reader については Windows / MacOS 両プラットフォームに対応していて、フリーで手に入ります。

これに最近 KacisBook が加わりました。Kacis は Kacis Publisher, Kacis Writer, Kacis Writer Free の3種類のソフトによって成り立つシステムですべて Windows / MacOS 両対応です。

基本は Kacis Writer でしょうか。これは普通のワープロとして使えます。ドローツールや数式ツールも搭載していて、高機能な部類に入るでしょう。この文書を閲覧することができ、高度なツールが付属していないものが Kacis Writer Free です。(Reader じゃないんですね。)

Kacis Publisher は Kacis Writer の機能にさらに電子ブック用のセキュリティなどの機能を付加したものです。これで「出版」したものには Acrobat のように細かい制限を掛けることが可能です。

要するにワープロ + Acrobat を1本のパッケージにまとめたようなものです。

[ ↑ content ↑ ]

番外編

SVG, Flash などを使う

要するにフォントとレイアウトの情報を埋め込むことができ、ビュワーがフリーで手に入るもの、という意味です。そういう意味では PDF などと同じようなものなのですが、文書という意味ではかなり無理があるのは事実です(^^; うまくサイズを設定すれば紙ベースの印刷原稿に使えなくもないっちゅーことで。なお、SVG の場合は XML ベースなのでその内容はテキストファイルになります。

まぁ、文書にもいろいろなタイプがあるので…。

TeX を使う

書式情報をきっちりつけたままネットワーク上での配布に使え、読む側の金銭的コストが低いものにもうひとつ TeX があります。何しろ TeX はシステム全体が基本的にフリーソフトなので、一見 Acrobat を使うよりもコストを抑えられます。

しかし、いかんせん HTML よりも難しいマークアップ言語とアプリケーションなので、全体のコストは高いと言えます。ただし、レイアウト情報の精度は高く、非常に高品質の仕上がりを期待できます。プロの印刷屋の世界でも十分に有名です。

PostScript を使う

PDF が定着する以前はこれを配布することがありました(^^; ま、この頃はまだ個人がダイアルアップでインターネットに繋いでいるなんてあまりなかった頃ですけど。

これはものすごく巨大なファイルになるので、ネットワーク配信にはそれほど向いているわけではないのですが、PostScript 対応のプリンタ、ビュワーで正確にレイアウト情報を維持した文書を印刷、表示することが可能です。

[ ↑ content ↑ ]