Lynxの特徴は、大きく言えば、
1.文字ブラウザである
2.キーボードによる操作
3.フレーム、テーブル、スタイルシート及び各種スクリプト・アプレット等に未対応
となっており、Internet ExplorerやNetscape等のグラフィカルブラウザとは異なる特徴を持ちます。そして、Lynxが持つ特徴は、音声ブラウザにもほとんど当てはまります。
アクセシビリティ確保の面で重要なものですので、もう少し詳しく解説します。
HTMLをplain textに変換するために様々な専用のプログラムも公開されていますが、ここでは、University of Kansasで開発されたLynx[5 ]というwebブラウザを利用する方法を紹介します。Lynxは、DOSやunixはもちろん、AMIGA、X68000[6]などに至るまで様々な環境で利用されています。テキスト・ブラウザですので制約はありますが、HTML 3.0のエレメントに対応しており、最近の版は日本語にも対応しています。
これをdump modeで利用することにより、任意のwebページを標準出力にplain textとして出力できます。
例1) URLを指定して、そのwebページをテキスト・ファイルとしてセーブする
lynx -dump -nolist http://server.domain/path/file.html > plain.txt
例2) Local fileのHTMLを、テキスト・ファイルとしてセーブする
lynx -dump -nolist file://localhost/path/file.html > plain.txt
-nolistを指定しなければ、そのページからリンクされているURLの一覧表がテキストの最後に添付されます