[yosihiro.jpg]

このページは、 お使いのPC画面を32ビット(1600万色)表示モードにしている場合に、 ページ中の画像が正しく表示されます。 それ以外のモードでは、画像については正しく表示されない場合がありますので、 予めご承知おきください。

スキャンした電子文書の見読性について

紙面を改変する様子と、それをスキャンした画像を使って、 改変の有無を確認するのに必要な技術要件についてを説明する。

●文字情報の判読の可否

改変の様子を紹介する前に、 スキャンした画像からもとの情報を判読可能かについての例を示す。

紙面に「¥123,456−」と手書きしたものを、 e文書法検討報告書が例示している技術要件でスキャンした画像を以下に示す。
実際の紙面には、1文字を約1cm角の大きさで手書きしてある。

e文書法検討報告書が例示しているスキャン要件の例
色数(階調) 解像度 幅約6.3cmx高さ約1.7cmの大きさの手書き紙面をスキャンした画像
モノクロ2値 200dpi
モノクロ中間調 150dpi
カラー24bit 150dpi

手書きした文字の大きさが比較的大きいということもあるが、 以下の例のように、文字を読むだけであれば、 報告書が例示している要件よりも低い解像度でも判読可能であることがわかる。

報告書よりも低い解像度の例
色数(階調) 解像度
75dpi 50dpi 25dpi
モノクロ2値
モノクロ中間調
カラー24bit

これだけを見ると、文字の大きさが1cmくらいで記載された紙面であれば、 モノクロ2値の50dpiでも十分なように思うかもしれない。 仮に5mmの文字でも、100dpiでよいことになる。
それが正しいかを以下で考察してみることにする。

●改ざん痕の有無の判定

実は、記載されている文字情報の判読の他にスキャン時の技術要件を決める際に検討すべき観点がある。
それは、紙面に改変がないかを判定するという場合である。

ここでは、 「¥123,456−」を 「¥428,496−」に改変する事例を実際の画像を用いて紹介する。

改変の例
改変前 ¥123,456−
改変後 ¥428,496−

上図の改変では、以下のような3つの文字の改変をしてある。

  • 「1」に「<」のような書き加えをして「4」に改変。
  • 「3」に「ε」のような書き加えをして「8」に改変。
  • 「5」を修正液で消した上に文字を新しく書いて「9」に改変。
上図の画像では、なんとなく改変していることを認識できるだろう。
改変を視認しやすくするために、薄黄色の用紙を使って、 改変前のペンの色(黒)と、書き加えのペンの色(濃紺)を変えてある。

このような改変の有無を、 スキャンした画像から判定できるかについて確認するために、 改変した紙面のスキャン要件を様々に変更した様子を以下に示す。

改変した紙面のスキャン画像の例
色数(階調) 解像度
150dpi
モノクロ2値
モノクロ中間調
カラー24bit
色数(階調) 解像度
75dpi 50dpi 25dpi
モノクロ2値
モノクロ中間調
カラー24bit

上の例を見ると、判読のときには重要ではない階調が、 改ざん痕の有無の判定には重要であることがわかる。
このことは以下のように、 モノクロ2値で解像度を高くしたものと、 解像度の低いカラー画像を比較してみるとよくわかる。

改変した紙面のスキャン画像の例
色数(階調) 解像度
300dpi
モノクロ2値
※画像の右側部分は本稿の表示幅の都合で切り捨てた

改変した紙面のスキャン画像の例
色数(階調) 解像度
50dpi でスキャンした画像を4倍に拡大表示
カラー24bit

上図のカラー画像の例では、解像度が低くても、 数字の9の修正液の痕だけではなく、 数字の1が4に改変されている部分でわずかに色の違いも見て取ることができる。

●画像保存時のファイル形式

これまでは、紙面をスキャンする際の色数(階調)と解像度について説明した。
実際にこれらを電子文書としてファイルに保存するには、 ファイル形式についても注意が必要だ。
画像ファイルを保存するには、圧縮して保存するのが現実的だが、 圧縮の方式には、圧縮前の情報を損失しない方式と、損失する方式の2種類がある。

    圧縮方式の種類
    報告書の呼称
    (別の呼称)
    特徴 ファイル形式
    の代表例※
    可逆圧縮
    (情報非損失圧縮)
  • 圧縮前のデータの損失が全く起こらない
    →画質が良い
  • 圧縮率は低い
    →ファイルが大きくなる
  • TIFF
    GIF(モノクロ)
    非可逆圧縮
    (情報損失圧縮)
  • 圧縮前のデータを完全には復元できない
    →画質が悪い
  • 圧縮率は高い
    →ファイルを小さくできる
  • JPEG
    GIF(カラー)
    ※ファイル形式については実際はそれぞれ圧縮方式を選択することができるので、
    一概には分類できないものであるが、一般的な初期設定での目安を示した。
スキャンした電子文書を保存したものについて、 後から判読や判定をするためには、可逆圧縮方式がよいことは当然であるが、 それでは保存のためのファイルサイズが大きくなる。
たとえば、デジタルカメラなどで、200万画素の画像を保管する場合、 もとの画像のデータ量は、
・200万画素xカラー(赤青緑、各256階調=3バイト)=約6Mバイト
であるが、デジタルカメラの一般的な保存形式である JPEG ファイル形式では、
・200〜300KB
であることからも、非可逆圧縮を有効に使う方がファイル容量の節約になることは間違いない。

ちなみに、A4用紙1枚を150dpiでスキャンした場合の画素数は、
・横210mm(210/25.4*150=1240画素)x縦297mm(297/25.4*150=1753画素)=約2万画素
である。

以下の例では、スキャン時の色数(階調)と解像度の同じ画像を、 保存時に JPEG による非可逆圧縮した場合の、 圧縮レベルの設定を変えた場合の画質の変化を示す。

圧縮率による再現画質の違い
圧縮レベル 色数(階調)
カラー
解像度
75dpi(187x50=9350画素)
ファイル
サイズ
保存されている画像を2倍に拡大表示
10 圧縮率:最低
画質:最高
8.77KB
圧縮率:低
画質:高
7.71KB
圧縮率:中
画質:中
7.02KB
圧縮率:高
画質:低
6.69KB
圧縮率:最高
画質:最低
6.28KB

上図で改変の有無の判定に必要な要件を知るには、
・「4」を見ながら「左の改変された4と右の改変のない4との違い」
 及び
・「8」を見ながら「3を8に改変した痕跡」
をどの圧縮レベルまでならば確認できるかを確認してみるとよい。
レベル8までは区別できるが、レベル5はぎりぎりとなることがわかる。
レベル3では、区別できるとは言い切れなくなる。
さらに、レベル1では、 修正液による9の改変も言われなければ見過ごしてしまうかもしれない。

しかし、文字情報の判読に必要な要件だけであれば、レベル1でも問題ないということになる。

●「文字情報の判読」と「改変の有無の判定」に必要な要件は異なる

以上の例から、 記載された文字情報の判読に必要な技術要件と、 改変の有無を判定するのに必要な技術要件が異なることがわかる。
後者は前者よりも非常に厳しい要件が求められる。
前者についてであれば、 紙面に記載される文字の大きさなどが定まっていれば、 十分条件を定めることは不可能ではない。
しかし、後者の改変の有無の判定についての十分条件を定めることは簡単ではない。

ここで紹介した事例だけを見ると、上の例で使用したソフトでファイルを保存する場合には、

    文字の大きさが1cmくらいの紙面であれば、 カラー150dpiでスキャンしてから、 JPEGでの圧縮レベルは5ないしは6以上で保存すること。
と考えることができるのだが、
    ただし、改変に別のインク色のペンを使われたり、 用紙と異なる色の修正液で文字の消去が行なわれたりした場合を想定した。 それ以外の場合を想定するときは、より厳しい要件が必要である。
ということを忘れてはならない。 なぜなら、ここでは、改変を見やすくするために、 あえてペンの色を変えたり、用紙の色と異なる修正液を使っているからである。 改変しようとする者が、こんなわかりやすいことをしてくれる訳がない。
仮に、同色のペン色を使い同色の修正液を使った場合を想像してみるとよい。
その場合の改変の有無を判定するには、非常に厳しい要件となることがわかる。

改変の有無を判定する者が、 どの程度の技術要件でスキャンすれば十分と思うのかを推定することが簡単ではないことがわかったはずだ。

●報告書がふれていない問題:デジタル加工

最後に参考までに、報告書がふれていない問題についても紹介しておく。

以下の例は、紙面を改変するのではなく、 もとの紙面をスキャンした画像ファイルをソフトウェアで加工した例である。
ソフトウェアを使用して、 数字の「1」と「6」を交換することで改変してある。

改変の例
改変前 ¥123,456−
改変後 ¥623,451−

この場合では、紙面としての改ざん痕そのものが存在しない上に、 「1」と「6」両方ともがもとの筆跡であり特徴の偽りもない。 これをデジタル画像だけで改変について判定することは不可能に近い。

このことは、紙面をスキャンした画像による電子文書について、 改ざんがないことを当該の文書だけで証明することの難しさを示唆している。
これらのことも考えながら、 紙面のスキャンによる電子化の運用方法について決めるのがよい。

紙面について振り返ってみれば、公証人役場が用いる方法では、 硯(すずり)で墨をすり毛筆で和紙にしたためる。 この方法では、墨の成分と濃さは毎回異なり、 それが和紙の繊維に絡み付いて定着する。 いざとなれば顕微鏡を使って改ざん痕を判定することもできる。 これに相当することを電子文書単独で実現することがいかに大変なことかわかる。

結局、いくら高い技術要件でスキャンしたとしても、 完全な保証が得られないのであれば、 それについてはどこかで割り切って、 当該文書だけに頼らない方法についてを見極める必要があるのではないだろうか。

[このページの先頭へ]


このページを引用する場合には、以下のいずれかの記載をお願いします。

出典「スキャンした電子文書の見読性について(http://yosihiro.com/key/tamper-document)」,佐藤慶浩

出典 http://yosihiro.com/ 佐藤慶浩

注意事項については、こちらをご覧ください。


Copyright 2006 Yoshihiro Satoh, 佐藤慶浩