こんにちは。田原です。
無茶苦茶暑い日が続いています。更に逆走台風まで来ています。私も夏バテでついダラダラしてしまいます。
さて、C++を使っていてC言語を懐かしむことってありませんか? 私は書式付き出力したい時にprintfのお手軽さが懐かしいです。ただ、書式指定を間違っても取り敢えず出力してくれるstd::coutの魅力も大きいです。そこで今回は、boost::formatを使ってこの両者を満たすお手軽printf関数を作ってみましたのでご紹介します。
1.何故にC++版printf関数をわざわざ作る?
std::cout(std::ostreamすべて同じです)も、実は書式付き出力をサポートしています。<ios>
で導入される hex、boolalpha、<iomanip>
で導入される setw、setfill、setprecisionなどが良く使われると思います。
しかし、あまり頻繁に使う機能ではないので、いつもマニピュレータ名を忘れてしまって面倒な思いをします。その点、C言語のprintfはキーワードではなく記述場所で指定するので一度理解したら後はそうそう忘れることはありません。
上記の点でprintfは優れているのですが、残念なことに型チェックが凄く甘いです。
最近のコンパイラはprintf等の標準ライブラリについては書式と引数の型が一致していない時、警告してくれるため困ることはかなり減っているのですが、自作関数の書式指定の不一致警告はサポートされていないため、デバッグ・ログ出力で書式指定する独自関数を作った時に辛い思いをします。(やっと不具合を再現できてログをみていると、書式指定ミスでちゃんと読めないとか、お馬鹿なことを結構やりました。)
こんな時はboost::formatの出番です。これを使うと、printf()ライクな書式指定で変数の値をよしなに出力してくれます。更に書式指定を間違ってもそれなりに出力されるのでデバッグ・ログのような用途では本当に有り難いです。ただ、問題が1点ありboost:formatが開発された時はまだ、可変長引数テンプレートがありませんでした。そのため、複数の変数を出力する時は%演算子で区切ります。(これにどうしても慣れません。せめて <<
にしていればよいのにとか思ってしまいます。)
std::cout << boost::format("%10s:%5.2f\n") % "dummy" % 123.456;
更に、デバッグ・ログ用にマクロでラップしたくても容易にはできません。printf()なら簡単なのですが。
#ifdef DEBUG #define DEBUG_LOG(...) #else #define DEBUG_LOG(...) do { printf("%s(%d) : ", __FILE__, __LINE__); printf(__VA_ARGS__); } while(0) #endif
この2つのジレンマを解決するため、(時々アナウンスしていましたが)既にTheolizer®では対応しています。しかし、もっとお手軽に導入できればと思うことが幾度かありましたので作ってみました。
2.まずはboostの準備
2-1.Windowsの場合
特に面倒なことはないです。boost::formatはヘッダ・オンリ(boostをビルドしなくても使える)ですので、ダウンロードして解凍すればOKです。
このページから、お使いのOS用の最新版をダウンロードし、適切なところへ解凍して下さい。
2-2.ubuntuの場合
もっと簡単です。以下のコマンドでインストールされます。
sudo apt-get install libboost-all-dev
3.そして可変長引数テンプレートでC++版printf関数を実装
意外に簡単ですので、いきなりソースを示します。C++版printfの関数名は xprintf としてみました。
展開に使ったテクニックは、第14回 結構便利な可変長引数テンプレート(Variadic templates)の「2-2.よくある使い方」にて解説したものそのままですので見比べて見て下さい。
#include <boost/format.hpp> inline std::string xprintf_impl(boost::format& iFormat) { return iFormat.str(); } template<typename tFirst, typename... tParams> inline std::string xprintf_impl(boost::format& iFormat, tFirst iFirst, tParams... iParams) { return xprintf_impl(iFormat % iFirst, iParams...); } template<typename... tParams> inline std::string xprintf(std::string const& iFormat, tParams... iParams) { boost::format aFormat(iFormat); return xprintf_impl(aFormat, iParams...); }
ローカル環境でビルドする時は、インクルード・パスとして、boostを解凍したフォルダを指定して下さい。
WindowsでC:\boost_1_67_0
以下へ解凍された場合は、cl.exe /IC:\boost_1_67_0 main.cpp
です。
なお、ubuntuでapt-getでインストールした場合は/usr/include/boost
以下へインストールされますので、デフォルトで/usr/include
が指定されるため、別途インクルード・パスを指定する必要はないようです。ubuntuでは-std=c++11オプションをお忘れなく。
4.boostはコンパイルが遅いので、明示的実体化で対処
boostのヘッダ・オンリなライブラリは、#includeするだけで使えるのでお手軽なのですが、1つ欠点があります。
コンパイル時間が booooooooost!! することです。いやマジで結構伸びます。小さなプロジェクト(コンパイル単位が少ない)で使う場合にはそれほど気になりませんが、大きなプロジェクトで使う時は結構困ります。
そこで、boost::formatをインクルードするコンパイル単位を1つにしてしまいたいです。
そのためには、以下の3つの機能を実装側(cpp)で記述すればよいです。
No. | 呼び出し側 | boost::format機能 |
---|---|---|
1. | xprintf() | boost::formatのコンストラクタ |
2. | xprintf_impl(iParams有り) | iFormat % iFirst |
3. | xprintf_impl(iParams無し) | iFormat.str() |
boost:formatは実体化されたクラス・テンプレートですので1.と3.は 実装側だけでマシン語へ落とせますので問題ありません。
問題は 2. です。iFirstは呼び出し側で指定しますので、その型を実装側は知らないため、マシン語へ落とせません。
このような使い方の場合、出力したい変数の多くは数値型(arithmetic)ですので、基本型すべてを明示的実体化することが可能です。
さて、ユーザ定義側はどうしましょう? 実は、boost::formatはユーザ定義型にも対応しています。
そのユーザ定義型を出力できるoperator<<があれば使えます。
Wandboxで確認する。
そこで、ユーザ定義型をクラス・テンプレートで受けて、プライマリー・テンプレートでユーザ定義型、数値型について部分特殊化して数値型のboost::format呼び出しすればboost::formatと同程度の機能に対応できます。
更に、デバッグ用として考えると Scoped Enum型もお手軽に出力したいものです。これはenum型について部分特殊化し、それをstatic_castしてboost::formatを呼び出せば良いです。
以上を纏めると次のようになります。
xprintf.h
xprintf.cpp
main.cpp
CMakeLists.txt
CMakeList.txtを使ってプロジェクトを生成する時は、-DBOOST_ROOT=<boostを解凍したフォルダのパス>を指定して下さい。
例えば、WindowsでC:\boost_1_67_0
以下へ解凍された場合は、-DBOOST_ROOT=C:\boost_1_67_0
です。
ubuntuでapt-getを使ってインストールした場合は、これを指定しなくてもfind_packageがうまいこと見つけてくれるようです。
> mkdir msvc > cd msvc > cmake -G "Visual Studio 15 2017" .. "-DBOOST_ROOT=C:\boost_1_67_0" > cmake --build .
> mkdir gcc > cd gcc > cmake .. > make
当ソフトウェアはご自由に使って下さい。(ただし、 私からの保証はありません ので、ご自身の責任でお願いします。)
5.最後に速度について
残念ながら、boost::formatは速度がちょっと遅いです。書式指定の順序と出力する値の順序を一致させないでも良いという国際化対応時に非常に有り難い機能をサポートしているからです。(日本語と英語では単語の並び順が異なりますが、例えば、書式文字列を日本語→英語に変えた時、出力する値の順序を変更しないで済めば文字列だけ変えれば国際化できるのです。gettextという非常にメジャーな国際化対応方式で積極的に使われている仕組みです。)
速度については、A Note about performance に記載があるので、速度が気になる場合には確認されて下さい。
6.まとめ
夏バテでなかなか集中できず、今回はちょっと駆け足になってしまいました。内容的には既に解説したことの比較的簡単な応用ですので、ご容赦下さい。
それでは、台風の被害が大きくならないことを祈りつつ、今日はこのへんで終わりにいたします。お疲れ様でした。
親近感わきます。
なんか似たようなことしてますね。
https://wandbox.org/permlink/krSMIx0FSbXxr2kl
あは。ログを取るのはプログラマの永遠の課題ですもんね。
C++17の fold expression を使えばテンプレート・パラメータ・パックを一発で展開できるんですね。これは便利。
3章のソースですが、使用上、引数を必ず必要とするFormatの仕様から終了条件は引数boost::format iFormatでなく、引数boost::format iFormat, tParams lastで良いと思うのですが?
%指定なしは、formatを通さずに率直に文字列として扱えば良いと思ったので?
トモノリさん、コメントありがとうございます。
調べてみたのですが、boost::formatは引数の数に制限なさそうです。
https://www.boost.org/doc/libs/1_66_0/libs/format/doc/format.html#rationale
「accept an unlimited number of arguments.」
また、終了関数の引数を(boost::format iFormat, tParams last)とすると、「フォーマット文字列だけf」に対応できなくなります。(xprintf(“abc”);がエラーになる)避けけるものなら避けた方が好ましい制限かなと思います。
書式文字列のみはちょっと怖い印象もありますが、boost::formatの仕様(書式内で必要とする引数の数と実際の引数の数が一致すること)ならば書式文字列攻撃もできませんので問題ないと思います。
私の最後の表現があいまいでした、可変引数なしは、単なる文字列で扱う特殊化の方が良いのかな?でした。
xprintf(string iformat) { return iformat: }
書式文字列のみも実行時エラーなく動作しますし
xprintf(”%s=%f”);
トモノリさん
う~ん、私が勘違いしているかもしれないのですが、それではエラーになるようです。
https://wandbox.org/permlink/KpYRQpg2ChrBQysO
boost::formatクラスは、std::stringへのキャスト演算子を定義していないのだろうと思います。
全てcppに記述したお試しコードなのですがCygwin-Clang環境で動きました
以前からWandBoxとCygwin-Clangは挙動が違うと感じているので動かないかも?
#include
#include
template
std::string xprintf_impl(boost::format& iFormat, tParams iLast)
{
return (iFormat % iLast).str();
}
template
std::string xprintf_impl(boost::format& iFormat,
tFirst iFirst, tParams… iParams)
{
return xprintf_impl(iFormat % iFirst, iParams…);
}
template
std::string xprintf(const std::string& iFormat, tParams… iParams)
{
boost::format aFormat(iFormat);
return xprintf_impl(aFormat, iParams…);
}
std::string xprintf(const std::string& iFormat) {
return iFormat;
}
int main() {
std::cout << xprintf("%10s=%6.2f\n", "result", 2345.678);
std::cout << xprintf("%d.%02d\n");
}