戻る

Microsoft Office 2000で作成したhtmlの浄化作戦

WordやExcelで作成したhtmlは汚すぎる!Office固有のマークアップが書き込ま れ,しかもソース内に名前まで埋め込むや んけ.しかも,重い!どうすりゃ不要なマークアップ/ファイルを消せるの? できればofficeは使いたくないが,次の場合はやはり便利.
  1. Excelで作った名簿等をhtmlに変換する場合
  2. はじめての人に,htmlの知識なしでwebページを作成してもらう場合
というわけで,はじめはタグを消すためにPerlを書いていたが,何か可笑しい. そんなものとっくに誰かつくってそうやん. あ,やっぱあった. できるだけ労力を払わない方法をメモっておこう.

IE5.0独自のタグを出力させない

[ツール]->[オプション]->[全般]->[Web オプション]->[以下のブラウザで表示できない機能を無効にする]にチェックし"IE4.0とNN4.0"を選ぶ

Office固有のタグを出力させない

Office HTML Filterを用いる. ただし,ラウンドトリップ(office形式での再編集)は出来なくなります.
  1. マイクロソフトのサイト よりOffice HTML Filterをダウンロードしインストールする.
  2. Wordならば次の使い方ができる(1,2はWord内で,3番目はWordを開かずに適用できる)
    文章全体をhtmlとして保存する
    文章作成後に,[ファイル]->[エクスポート]->[コンパクトなHTML]を選ぶ
    選択範囲をhtmlとしてクリップボードへコピーする
    [編集]->[HTMLとしてコピー]を選ぶ
    すでに保存されたファイルを浄化する(一度に複数のファイルに適用できる)
    [スタート]メニュー->[プログラム]->[Microsoft Officeツール] >[Microsoft Office HTML Filter x.x]
    Excelならば3番目の方法のみ可能.いったんファイルに保存し,フィルタを適用 する.

Filter適用後に「/(スラッシュ)」が「\(バックスラッシュ)」になってしまう問題

  1. [ツール]->[オプション]->[互換性]->[対象となるアプリケーション] で「ユーザ設定」を選択
  2. 「バックスラッシュを円記号(¥)に変換する」のチェックをはずす
  3. [既定値として設定]をクリックする

リンク

Word2000によるホームページ作成講座
▲このページのトップへ

戻る
Created 2001/12/22 川嶋 宏彰 Hiroaki KAWASHIMA ( blind)
Last Modified 2001/12/22
Copyright 2001 Hiroaki KAWASHIMA. All rights reserved.