名前

ahref - html reference filter

コマンドラインの書式

ahref [ -lu | -ld ] [ -p PARAMETER ] [-?] [-h] [ file ]...

概要

HTML 形式のファイルの中から HREF=xxx, IMG=xxxx などの HTML タグパラメータ 部分を抜き出すツールです。デフォルトでは HREF= 部分を抜き出します。

オプションの説明

-lu
出力の改行を UNIX スタイル 0x0a にします。
-ld
出力の改行を DOS スタイル 0x0d 0x0a にします(default)。
-p PARAMETER
入力テキストから抜き出す PARAMETER=... シーケンスを指定します (default = -p HREF)。
例えば -p HREF を指定すると HREF="http://hostname.organization.country/" と言う 文字の並びから http://hostname.organization.country/ を抜き出します。抜き出しの対象に なる文字の並びはつぎの通りです。抜き出した結果はすべて http://hostname.organization.country/ です。
HreF="http://hostname.organization.country/"  大文字小文字は同一に扱います。
HREF='http://hostname.organization.country/'  一重引用符も二重引用符と同一に扱います。
HREF=http://hostname.organization.country/    引用符がなくても抜き出し対象にします。
1 行のうちに複数の並びがあってもそれぞれを抜き出しの対象にします。入力ファイルの 改行形式と 1 行の長さに制限はありません。
file
抜き出し対象にするテキストファイルを指定します。複数指定可能です。
省略した場合は stdin からの入力になります。パイプラインで使わない場合は キーボード入力待ちになります。
-?, -h
このヘルプを表示します。

終了コードの説明

0 成功しました。
1 コマンドライン引き数または、GUI で設定した内容が不備なため失敗しました。
2 ファイルアクセスに問題が発生しました。

関連ファイル

ahref.htm このヘルプファイルです。

問題点

文字の並びが HTML タグの外にあっても抜き出し対象にします。例えば、プログラムソースコード の様に < html-tag > の外にある VarName=Value の様な並びが多くある場合、誤認する可能性があります。

History

DateComment
2000.8.22テストバージョン。
限定配布版です。
2000.9.12 正式リリース版です。
2003.6.23バグ修正公開版
Delphi 7 でコンパイル
1 重引用符 ' の扱いがおかしく正しく処理できない問題を修正した。
メールアドレス変更。

Copyright

html reference filter ver 1.0 copyright (C) [2000/9],[2003/8] by A.Furuta.
Mail:

README へ移る