m4 - マクロプロセッサ

m4

m4コマンドを利用するためにファイルにマクロの定義とテキスト等の内容を記述します。そして、m4コマンドでそのファイルを指定することで、テキストは定義したマクロに置き換えられていき、その置き換えたテキストを結果として出力するコマンドになります。

m4はUNIXの汎用的なマクロプロセッサで、makeのconfigureスクリプトを生成するautoconfで利用されています。m4コマンドはあまり知られていないコマンドですが、様々な用途に利用できます。

スポンサーリンク

m4の簡単な例

m4は組み込みのマクロdefineを用いて、マクロを定義することができます。

実際の例は以下のようになります。

コマンド例

test.m4

実行結果

m4は基本的に入力された文字列をそのまま出力しますが、組み込みマクロやm4での特殊な文字、定義したマクロの文字列をトークン(token)として認識するとその文字列を別の文字列に置き換えられます。上の例ではdefineのマクロは出力されず、その部分は空行になっています。

これはdefineのマクロ'define(foo', hello world')'まではm4のマクロなので、取り除かれましたがそのあとの改行コードまでは取り除かれないので、defineの部分は空行になったためです。

空行を表示させたくない場合はdnlという組み込みのマクロを用います。dnlは'Discard to Next Line'の略で改行まで、(改行コードを含めて)出力を行わないマクロになります。

コマンド例

test2.m4

実行結果

test2.m4で一行目を引用符で囲んでいるのは、囲まない場合、dnlの文字列がトークンとしてm4によって解釈されるためです。

m4のマクロの展開

m4はマクロを展開した後に、さらにマクロを展開していきます。そのため、マクロを定義する場合、無限ループが起こらないようにマクロを定義しなければなりません。

コマンド例

test3.m4

実行結果

m4の引用符について

m4のデフォルトの引用符はバッククォートとシングルクォートのペアになっています。引用符を用いると、m4が文字列を解釈するときに、引用符のペアを一つ取り除いた文字列として、文字列を扱います。このときに、マクロの展開を行いません。

コマンド例

test4.m4

実行結果

m4がdefineのマクロを呼び出したときに、引用符のペアが一つ取り除かれます。

マクロを呼び出したときに、定義後の引用符のペアが1つだけの場合、引用符のない文字列として呼び出した後で、さらにその引用符のない文字列に対して、m4はマクロの展開を行います。

定義後の引用符のペアが2つの場合、defineのマクロを呼び出した後に引用符のペアが1つ残ります。マクロを呼び出したときに、引用符のある文字列として呼び出され、引用符のある文字列をさらに展開して、引用符のペアを取り除いて、そのままの文字列として出力することができます。

また、m4では引用符はchangequoteという組み込みのマクロで変更可能になります。autoconfでのconfigure作成のためのファイルでは、`'の引用符はシェルスクリプト作成の選択として悪い選択なので、別の引用符として[]に変更されています。

このように使用するテキストによって引用符を変更して、m4を使用すると使いやすくなります。

コマンド例

test5.m4

実行結果

スポンサーリンク

m4のコメント

m4のコメントとして#が利用できます。しかし、このコメントは#以降の文字列を改行までそのまま出力するという意味になります。

プログラミング言語での表示をしない意味でのコメントを用いる場合は、dnlや組み込みマクロのdivertが利用できます。

コマンド例

test6.m4

実行結果

組み込みマクロのdivertは数字を指定して出力を切り替えるマクロです。最初に数字を指定したdivertを用いて出力を切り替え、出力切り替えの終わりにもう一度divertを呼び出して、出力を元に戻します。そして、最後にm4が終了するときにdivertを呼び出した数字の順番通りにテキストを出力していきます。

負の数字を指定して利用するとそのテキストは何も出力されません。ただし、divert内のテキストは解釈されているため、負の数字を指定して、マクロを定義する手法はよく使用されます。

負の数字を指定したdivertの中で、#でのコメントは活用するとその行はマクロの展開が行われず、出力もされないため、プログラミング言語でのコメントのように利用できます。

m4のマクロの引数

マクロの引数はシェルの引数と同じように$1,$2,$3のような$記号と数字の組み合わせで参照することができます。

コマンド例

test7.m4

実行結果

また、特殊な引数として$#,$*,[email protected]も存在します。

$#は引数の数を、$*は引用符なしで全ての引数の展開を、[email protected]は引用符ありとしてすべての引数の展開をします。

コマンド例

test8.m4

実行結果

m4のマクロの再帰処理

m4のマクロは展開された後、再びマクロが存在するかどうかを確認して、存在する場合には、さらにマクロを展開します。この特徴を利用することで、m4はマクロの再帰処理を行うことができます。

ここで、マクロの再帰処理で用いる組み込みのマクロはifelseとshiftになります。

ifelseの構文は3つあり、マクロの再帰的展開では主に3つ目の構文を利用します。

ifelse (comment)
ifelse (string-1, string-2, equal, [not-equal])
ifelse (string-1, string-2, equal-1, string-3, string-4, equal-2, …, [not-equal])

1つ目は何も出力しないため、コメントとして利用できます。
2つ目は引数の文字列が等しいかどうかで処理を変更できます。
3つ目はstring-1とstring-2が等しい場合はequal-1の処理を、string-3とstring-4が等しい場合はequal-2の処理を、のように続き、最後にどれにも条件が合わない場合の時にnot-equalの処理が行われます。

次に、shiftのマクロは最初の引数を取り除いて、それ以外の引数を出力するマクロになります。

shift(aaa,bbb,ccc)

bbb,ccc

のように出力されます。

elseifとshiftを用いると、マクロの引数に対して再帰処理を行うことができます。以下の例はその再帰処理の例になります。処理は単純で、引数にあるものを-(ハイフン)で結合しています。

コマンド例

test9.m4

実行結果

上の例は、ifelseでマクロで呼び出されたの引数の数を確認して、残りの引数の数が1以外なら一つ目の引数を展開してからshiftで引数を減らして再帰処理、残りの引数の数が1、つまり、最後のひとつならば最後の引数を展開して処理を終了します。また、引数が0の場合は何も出力しません。

再帰処理はとても強力な機能で、再帰処理という考え方はとても応用ができるので覚えておいて損はありません。

m4の高速読み込みのためのフローズンファイル(.m4f)について

m4コマンドは複数のファイルを引数に取ることができ、最初に定義ファイルを読み込み、その後にその定義ファイルの定義を利用したファイルを使用することができます。

コマンド例

common.m4

content.m4

実行結果

ただし、定義が記述された共通ファイルが巨大になっていく場合、共通ファイルの読み取りに時間がかかる場合があります。共通ファイルの読み取りはファイルをフローズン状態(froze state)にすることで高速化できます。また、フローズンファイルの拡張子として'.m4f'が利用されます。

フローズンファイル(frozen files)の作成はm4コマンドの-Fオプションで出力ファイル(フローズンファイル)を指定し、引数にフローズンファイルにするファイルを指定します。

コマンド例

フローズンファイルの読み取りは-Rオプションを利用することで読み取ることができます。

コマンド例と実行結果

$m4 -R common.m4f content.m4
hello world
HELLO WORLD

HTMLのテーブルをm4で作成

m4を用いる例として、HTMLのテーブルを作成してみます。

HTMLのテーブルにする表

time(hour)walk(km)bicycle(km)car(km)
0.00000.00000.00000.0000
0.25001.25003.750010.0000
0.50002.50007.500020.0000
0.75003.750011.250030.0000
1.00005.000015.000040.0000
1.25006.250018.750050.0000
1.50007.500022.500060.0000
1.75008.750026.250070.0000
2.000010.000030.000080.0000
2.250011.250033.750090.0000
2.500012.500037.5000100.0000
2.750013.750041.2500110.0000
3.000015.000045.0000120.0000
3.250016.250048.7500130.0000
3.500017.500052.5000140.0000
3.750018.750056.2500150.0000
4.000020.000060.0000160.0000
4.250021.250063.7500170.0000
4.500022.500067.5000180.0000
4.750023.750071.2500190.0000
5.000025.000075.0000200.0000

まず、作成するhtmlのテーブルの構造は以下のような形式になります。

<table>
<tr>
<th>time(hour)</th>
<th>walk(km)</th>
<th>bicycle(km)</th>
<th>car(km)</th>
</tr>
<tr>
<td>0.0000</td>
<td>0.0000</td>
<td>0.0000</td>
<td>0.0000</td>
</tr>
<tr>
<td>0.2500</td>
<td>1.2500</td>
<td>3.7500</td>
<td>10.0000</td>
</tr>
...
</table>

tableの構造はtableタグの中に最初にヘッダー行があり、その後にデータ行が続くような形式になります。

それでは、m4の定義を考えていきます。m4の定義は、再帰処理を用いると単純になります。 また、下の例では、入力のしやすさを考えて、引用符も変更しています。

html_define_table.m4

ここでは、簡単にユーザが利用するものは、TABLE_BEGIN、TABLE_HEADER、TABLE_ROW、TABLE_ENDのマクロと考えています。また、内部の処理を行うマクロとして、最初にアンダーバーをつけて、_TABLE_HROW、_TABLE_DROWも定義しています。

これで、実際に利用してみます。上の表を作成するためのファイルは、以下のようになります。

table_content.m4

最後の結果は長いため、折りたたんでいます。興味がある方は表示をクリックして確認してください。  ▼表示

参考

GNU M4 - GNU macro processor

スポンサーリンク