Still like 'pnmscale'

/* * Still like 'pnmscale' * やっぱり pnmscale が好き * by uratan! 2024.2.4 */

はじめに

Netpbm の画像リサイズツールである pnmscale、長らくお世話になって来ましたが最近のバージョンでは PAM 対応版である pamscale にその役目が引き継がれて pnmscale 自体はディスコンになってしまいました。
pamscale を評価してみたところ、当然ながら大枠では pnmscale と同等(*1)なのですが、これまた当然ながら厳密に同じ画像バイナリにはなりません。

(*1) pamscale では標準で輝度のガンマ補正が加わるので、単純に pnmscale を置き換える場合には -linear オプションが必要です。

今回家庭内サーバーのバージョンアップをもくろみ、その結果 Netpbm 一式も新しいバージョンとなり pnmscale がない環境にならざるを得なくなりそうなんですが、指に馴染んだこの pnmscale、同じ画像バイナリを吐くものをなんとか用意できないか？
ソースも公開されているし簡単に持って行けるだろうと簡単に考えていたのですが、そうは問屋が卸さなかったのでその顛末をここに記録しておきます。

(画像の一致・不一致は基本目視確認するしかないので、過去の画像処理を再現確認する際に md5 sum の一致で済ませられるととても楽になるのです)

以下、まずは FreeBSD 10.2-RELEASE(i386) 内で閉じた内容になります。古くてすいません。
% uname -a
FreeBSD silver 10.2-RELEASE FreeBSD 10.2-RELEASE #1:
 Sun Mar 12 09:07:49 JST 2017
  uratan@silver:/usr/src/sys/i386/compile/OXYGEN  i386

% cc --version
FreeBSD clang version 3.4.1 (tags/RELEASE_34/dot1-final 208032) 20140512
Target: i386-unknown-freebsd10.2
Thread model: posix
再現したい package版 pnmscale の手がかりは以下の通り。
% pkg info | fgrep netpbm
netpbm-10.35.97      Toolkit for conversion of images between different formats

% /usr/local/bin/pnmscale --version
pnmscale: Using libnetpbm from Netpbm Version: Netpbm 10.35.97
pnmscale: Compiled Thu Jan  7 01:23:27 UTC 2016 by user "root"
pnmscale: BSD defined
pnmscale: RGB_ENV='RGBDEF'
pnmscale: RGBENV= 'RGBDEF' (env vbl is unset)

% file /usr/local/bin/pnmscale
/usr/local/bin/pnmscale: ELF 32-bit LSB executable, Intel 80386,
 version 1 (FreeBSD), dynamically linked, interpreter /libexec/ld-elf.so.1,
  for FreeBSD 10.1, stripped

% ls -l /usr/local/bin/pnmscale
-r-xr-xr-x  1 root  wheel  14624 Jan  7  2016 /usr/local/bin/pnmscale*
Netpbm-10.35.97 の pnmscale.c のソースがこちら→ pnmscale.c-10.35.97.txt

(... スタイルはアレですがこれなかなか凄いコードと思います)

package版 pnmscaleが再現できない！

「ports で make すればそれでおしまいやろ？」

... FreeBSD 10.2R install image の ports は netpbm-10.35.96.tgz ベースで version が異なります。 10.3R install image では netpbm-10.35.97.tgz ベースになってますが現家庭内サーバーをセットアップした頃の途中状況は今では分かりません。
そもそも上記 file コマンドの出力の通り、package版 pnmscale は FreeBSD 10.1 で make されてるようです…？？？。 (実際にはいろいろ確認したのですがここでは省略)

「Netpbm の 10.35.97 拾ってきて ./configure; make で問題ないんちゃう？」

... やってみましたが以下の通り同じ画像バイナリ出力にはなりませんでした。そもそも pnmscale のサイズが明らかに違いますし、 -verbose 出力を見る感じ、少なくとも演算精度の違いはありそうです。
% tar xzf /..../netpbm-10.35.97.tgz
% cd netpbm-10.35.97/
% ./configure                <-- 選択は すべて default で [ENTER] 連打で
% cd editor/
% gmake pnmscale

% setenv LD_LIBRARY_PATH "$PWD/../lib"

% ./pnmscale --version
pnmscale: Using libnetpbm from Netpbm Version: Netpbm 10.35.97
pnmscale: Compiled Sun Feb  4 19:32:59 JST 2024 by user "uratan"
pnmscale: BSD defined
pnmscale: RGB_ENV='RGBDEF'
pnmscale: RGBENV= 'RGBDEF' (env vbl is unset)

% djpeg some.jpg | /usr/local/bin/pnmscale -v -h 1600 | md5
pnmscale: Scaling by 0.833084 horizontally to 1113 columns.
pnmscale: Scaling by 0.833333 vertically to 1600 rows.
pnmscale: 0.000000 of right column stretched due to arithmetic imprecision
5077595b1fea606689f109a53735bce8

% djpeg some.jpg | ./pnmscale -v -h 1600 | md5
pnmscale: Scaling by 0.833084 horizontally to 1113 columns.
pnmscale: Scaling by 0.833333 vertically to 1600 rows.
pnmscale: 0.000032 of right column stretched due to arithmetic imprecision
pnmscale: 0.000038 of bottom row stretched due to arithmetic imprecision
d96baec7bd5027b79a1be7237e1a9fd8

% file ./pnmscale
./pnmscale: ELF 32-bit LSB executable, Intel 80386,
 version 1 (FreeBSD), dynamically linked, interpreter /libexec/ld-elf.so.1,
  for FreeBSD 10.2, not stripped

% strip ./pnmscale
% ls -l ./pnmscale /usr/local/bin/pnmscale
-rwxr-xr-x  1 uratan  nobody  21252 Feb  4 19:35 ./pnmscale*
-r-xr-xr-x  1 root    wheel   14624 Jan  7  2016 /usr/local/bin/pnmscale*

最適化オプションが欠けてます！

package版 pnmscale のコードサイズが明らかに小さいことからなんらかの最適化がかけられていると考え、追いかけたところ -O2 がかかっているような感触です。
% echo "CFLAGS=-O2" >> ../Makefile.config

% rm pnmscale.o
% gmake pnmscale

% strip ./pnmscale
% ls -l ./pnmscale /usr/local/bin/pnmscale
-rwxr-xr-x  1 uratan  nobody  14624 Feb  4 19:37 ./pnmscale*
-r-xr-xr-x  1 root    wheel   14624 Jan  7  2016 /usr/local/bin/pnmscale*
(../lib/ 側が -O0 のままになりますが共有ライブラリ方式で pnmscale 側には含まれませんので問題ないでしょう)

あらら、同じ画像バイナリを生成する状況には意外とあっさり至りました。

(しかし最適化有り無しで浮動少数演算の結果が違うっていいのか？)
% djpeg some.jpg | /usr/local/bin/pnmscale -v -h 1600 | md5
pnmscale: Scaling by 0.833084 horizontally to 1113 columns.
pnmscale: Scaling by 0.833333 vertically to 1600 rows.
pnmscale: 0.000000 of right column stretched due to arithmetic imprecision
5077595b1fea606689f109a53735bce8

% djpeg some.jpg | ./pnmscale -v -h 1600 | md5
pnmscale: Scaling by 0.833084 horizontally to 1113 columns.
pnmscale: Scaling by 0.833333 vertically to 1600 rows.
pnmscale: 0.000000 of right column stretched due to arithmetic imprecision
5077595b1fea606689f109a53735bce8
実行ファイルのコードも完全一致！までは行きませんでしたが、 function は再現できていると考えていいでしょう。
% objdump -d /usr/local/bin/pnmscale > wod0
% objdump -d ./pnmscale > wod1

% diff wod0 wod1 | wc -l
      32

% diff wod0 wod1 | more      <-- 一部メモリ割り付けがちょっと違うだけみたい
ちなみに、FreeBSD 10.2R installe image の ports にも 10.3R の ports にも -O2 を付加する記述は見当たりません。 ports に含まれる files/patch-* のファイル自体の timestamp はリリース日近傍ですが、中に記録されている差分元ファイルの timestamp がやけに古いので、 package版は ports とは独立に作成されたように思われます。 (patch しなくても make できてるし)

float が勝手に double に昇格されてます！

package版 pnmscale の処理自体は再現できましたが、ただこれではコンパイラが変わったらまた変わる可能性があり、コンパイラ任せである状況は変わりません。

-O2 でいったい何が起きているのか？

というわけで…、objdump も出ちゃったことだし、そう、読みましたよ、アセンブラコードを。まあ元 C ソースがあるところで読むだけだからパズルみたいなもんでしたけど…。

というところで、これ↓で package版 pnmscale の処理が C レベルで再現記述できたはずです。
patch-pnmscale.c.txt
最適化なし -O0 でも同じ画像バイナリになります。
% patch < patch-pnmscale.c.txt
% echo "CFLAGS=-O0" >> ../Makefile.config
% rm pnmscale.o
% gmake pnmscale

% strip ./pnmscale
% ls -l ./pnmscale /usr/local/bin/pnmscale
-rwxr-xr-x  1 uratan  nobody  21972 Feb  4 19:43 ./pnmscale*
-r-xr-xr-x  1 root    wheel   14624 Jan  7  2016 /usr/local/bin/pnmscale*

% djpeg some.jpg | /usr/local/bin/pnmscale -v -h 1600 | md5
pnmscale: Scaling by 0.833084 horizontally to 1113 columns.
pnmscale: Scaling by 0.833333 vertically to 1600 rows.
pnmscale: 0.000000 of right column stretched due to arithmetic imprecision
5077595b1fea606689f109a53735bce8

% djpeg some.jpg | ./pnmscale -v -h 1600 | md5
pnmscale: Scaling by 0.833084 horizontally to 1113 columns.
pnmscale: Scaling by 0.833333 vertically to 1600 rows.
pnmscale: 0.000000 of right column stretched due to arithmetic imprecision
5077595b1fea606689f109a53735bce8
結論的には、pnmscale.c 内で float 宣言されている変数(*2)を、勝手に double/倍精度と扱ってましたね。これは i386 の FPU が倍精度なので、最適化により変数をレジスタ割り付けすると自動的にそうなってしまうのはまあ許そう。

(*2) pnmscale.c では変数は基本 float です。(double も一部あり)

ただ関数がすべてその場展開されてて関数の引数もローカル変数に成り下がり関数の引数まで double に昇格している形になっているのは なんだかなぁ？ でしたね。

あとそうやって倍精度扱いしておきながら、レジスタ割り付けした変数をどうしてもメモリに退避しなければいけない場合に float/単精度で済ませている(*3)部分が 2ヶ所ありまして、まあ元指定が float ですし所詮コンパイラの最適化だからしょうがなくはあるのですが、なんか中途半端な印象です。 (r,g,b セットのうち b だけ、つーあたりがなんとも…)
(*3) メモリ上でもちゃんと double になってる変数もあります、 fracrowtofill とか
  持ち上げといて落としてるのが この 2ヶ所 (patch-pnmscale.c.txt より抜粋)

***************
*** 342,347 ****
--- 343,349 ----
                  r += fraccolleft * PPM_GETR(inputxelrow[col]);
                  g += fraccolleft * PPM_GETG(inputxelrow[col]);
                  b += fraccolleft * PPM_GETB(inputxelrow[col]);
+ b = (float)b;
                  break;
                      
              default:
***************
*** 593,598 ****
--- 595,601 ----
                      fracrowtofill = 0.0;
                  }
              }
+ rowsleft = (float)rowsleft;
              makeRow(vertScaledRow, rs, gs, bs, cols, newmaxval, format);
              zeroAccum(cols, format, rs, gs, bs);
              fracrowtofill = 1.0;
***************

ホントに記述できてるかな？

処理が過不足無く C レベルで記述できているか？、を次世代家庭内サーバーの候補として評価中の FreeBSD 14.0R amd64 環境に持っていって確認します。実行ファイルの長さがやや大きいですがそんなもんなのでしょう。

% uname -a
FreeBSD oxygen 14.0-RELEASE FreeBSD 14.0-RELEASE #0 releng/14.0-n265380-f9716eee8ab4:
 Fri Nov 10 05:57:23 UTC 2023
  root@releng1.nyi.freebsd.org:/usr/obj/usr/src/amd64.amd64/sys/GENERIC amd64

% cc --version
FreeBSD clang version 16.0.6 (https://github.com/llvm/llvm-project.git
 llvmorg-16.0.6-0-g7cbf1a259152)
Target: x86_64-unknown-freebsd14.0
Thread model: posix
InstalledDir: /usr/bin

% tar xzf /..../netpbm-10.35.97.tgz
% cd netpbm-10.35.97/
% ./configure                <-- 選択は すべて default で [ENTER] 連打で

% cd editor/
% patch < patch-pnmscale.c.txt
% echo "CFLAGS=-O2" >> ../Makefile.config
% gmake pnmscale

% file ./pnmscale
./pnmscale: ELF 64-bit LSB executable, x86-64,
 version 1 (FreeBSD), dynamically linked, interpreter /libexec/ld-elf.so.1,
  for FreeBSD 14.0 (1400097), FreeBSD-style, with debug_info, not stripped

% strip ./pnmscale
% ls -l ./pnmscale
-rwxr-xr-x  1 uratan nobody 15856 Feb  4 19:55 ./pnmscale*

% setenv LD_LIBRARY_PATH "$PWD/../lib"

% ./pnmscale --version
pnmscale: Using libnetpbm from Netpbm Version: Netpbm 10.35.97
pnmscale: Compiled Sun Feb  4 19:54:09 JST 2024 by user "uratan"
pnmscale: BSD defined
pnmscale: RGB_ENV='RGBDEF'
pnmscale: RGBENV= 'RGBDEF' (env vbl is unset)

% djpeg some.jpg | ./pnmscale -v -h 1600 | md5
pnmscale: Scaling by 0.833084 horizontally to 1113 columns.
pnmscale: Scaling by 0.833333 vertically to 1600 rows.
pnmscale: 0.000000 of right column stretched due to arithmetic imprecision
5077595b1fea606689f109a53735bce8

% echo "CFLAGS=-O0" >> ../Makefile.config
% rm pnmscale.o
% gmake pnmscale

% strip ./pnmscale
% ls -l ./pnmscale
-rwxr-xr-x  1 uratan nobody 18296 Feb  4 19:58 ./pnmscale*

% djpeg some.jpg | ./pnmscale -v -h 1600 | md5
pnmscale: Scaling by 0.833084 horizontally to 1113 columns.
pnmscale: Scaling by 0.833333 vertically to 1600 rows.
pnmscale: 0.000000 of right column stretched due to arithmetic imprecision
5077595b1fea606689f109a53735bce8

-O2 でも -O0 でも同じ画像バイナリになりました。これでめでたしめでたしのはず…。

最後に

アセンブラの読み下しパズルに興味のある方のために…

pnmscale.S.a18.txt (cc -S -O2 で出力した asm ソースに mark-up)

##-NNN が元 C ソースの NNN行目です。
行末コメントは
| #hs# が horizontal_scale() 部分、
| # が scaleWithMixing() 部分、
| #xM# が scaleWithoutMixing() 部分、
| #ii# はそれ以外の共有部分です。

FPU の Control Word を毎回バックアップ→設定→リストアしているあたりや、 unsigned int を FPU に読ませるため mint64 に拡張するのに high 側に毎回 $0 を書いているあたり、 FPU の register STACK 数に余裕があるはずなのでそこらあたりも有効活用できそうなあたり、にまだ高速化の余地がありそう。

10.2R の package版 pnmscale のバイナリは 14.0R amd64 下でも /etc/libmap32.conf を設定すればそのまま動くので、素直に持ち込んでそのまま使うのが真っ当ではありますがどうしようかなぁ…。

(高速化云々以前に amd64 で make した pnmscale が 4倍ぐらい早いことに気付いてしまった、悩みは尽きまじ…)

あっ -nomix側確認してないや…、まぁこっちはいいか基本使ってないし…。

- * - * -

P.S.1

patch しない元ソースを 14.0R amd64 にて評価して見ましたが -O0 でも -O2 でも同じ画像バイナリを出力しますね、勝手に double 化はしていない感触。 (でも 10.2R の -O0 とは丸め誤差的な違いが…)

P.S.2

amd64 環境って、awk も 64bit になるのね…
% cat v
BEGIN {
    printf("%04x\n", -123);
    for(i=29; i<34; i++) {
        printf("%3d: %10d\n", i, 2^i);
    }
}
                                  ..............................
% awk -f v                        :  ちなみに i386(32bit) では
ffffffffffffff85                  :ffffff85
 29:  536870912                   : 29:  536870912
 30: 1073741824                   : 30: 1073741824
 31: 2147483648                   : 31: -2147483648
 32: 4294967296                   : 32: -2147483648
 33: 8589934592                   : 33: -2147483648

uratan@miomio.jp

upward