書写書道教育学会誌『書写書道教育研究』第10号

左右の部分形から構成される漢字の字形に関する研究(1)

−縦方向の大きさに関する感覚と要素−

金沢大学教育学部  押木 秀樹
信州大学工学部 岡本 正行


1.はじめに

 字形を整える際のさまざまな要素*1の中でも、部分形の整え方は、漢字における重要な要素といえよう。漢字は、ひらがなやアルファベットにくらべ、一字において複雑な構成を持つためである。部分形の整え方について、古くは「間架結構法」*2として「相譲」、あるいは「譲左」「譲右」の例を見ることができる。もちろん、現代の国語科書写においても、欠くことのできない内容*3である。しかし、経験則としての著述の豊富さに比べ、実証的な研究はきわめて少ない。

 部分形から構成される漢字は、平形*4のように、

と分類できる。また、本稿では、その整え方について、
と、3要素から考えることとする。このうち、「左右」から構成される漢字、「大きさ(縦方向)の関係」に着目すると、図1のとおり、そのバランスは外接矩形のサイズのみでは説明できない。これは、既に平形によって指摘されている。さらに平形は、
の4点を、左右の部分形から構成される漢字の整え方の原理としている。

 本研究は、「左右」の部分形から構成される漢字について、その部分形の大きさ(縦方向)に限定し、「字座(ポテンシャル場)」に類する特徴量の定義を試み、計量的手法により、平形説を検討したものである。部分形から構成される漢字の字形感覚を明らかにするとともに、同字形のコンピュータによる自動(客観)評価および書写CAIの可能性を示すことを目的とする。

 具体的には、まず左右から構成される漢字18字種を選び、左右の高さを10%ずつ変化させたサンプルを作成した。つぎに、70名の大学生を対象に、作成サンプルのバランスの適不適についての主観評価の調査をおこなった。さらに部分形の大きさが表現されるであろう特徴量を定義し、サンプルについて、コンピュータによる特徴抽出をおこなった。これらの主観調査とコンピュータによる結果との統計的比較により、左右から構成される漢字の高さに関する感覚とその要素について明らかにした。(図2参照)





2.調査用サンプルの作成について

 主観調査および特徴量の抽出に用いる調査用文字(字形)サンプルの作成について概説する。


2−1 字種の選択

 平形は左右の部分形から構成される漢字を、部分形相互の縦方向の大きさ・位置関係によって、9つに分類している。本研究においては、この9分類を参考として、各2字種を任意に選び、表1に示す18字種を対象とした。



2−2 縦方向の大きさの変化

 サンプルの作成にあたっては、上記の9分類18字種について、書写教育担当者の立場から押木が自然筆記した文字を用いた。この左右部それぞれを、コンピュータによって、縦方向のみ110%から150%に拡大した。なお、対照用として、明朝体・ゴシック体・教科書体*5の字形もサンプルとした。結果として、図3のように、1字種あたり11サンプルを作成し、3種の写植書体を加え、18字種252サンプルとした。




3.主観調査の方法と結果

 主観調査は以下のようにおこなった。また、その結果について概観しておく。


3−1 期日及び対象者

 次の期日において、調査をおこなった。

3−2 方法

 上記70名を2分し、2種類の方法で主観調査をおこなった。その尺度はいずれの調査も、図4のとおり、−6から+6までの13段階とした。2種類の方法をとったのは、次の理由による。サンプルを評価する際に、同字種で複数のサンプルを比較しながら答える場合と、比較せずに直感的に答える場合とでは、評価値が異なると考えたためである。前者を主観調査B、後者を主観調査Aとしておく。


 まず、主観調査Aとして、252サンプルを無作為に並べ、1サンプルごとに評価値をチェックする図5の方法をとった。その際、調査用紙1枚に同一字種で2サンプルとならないようにした。評価者は、サンプルの文字を見て、右部のスケール中をチェックすることで評価を行う。  次に、主観調査Bとして、252サンプルを1字種ごとに(11サンプル)並べ、評価値を記入する図6の方法をとった。評価者は、並んだ11サンプルを見て、上のスケールを参考に評価値を記入する。




3−3 調査用サンプルの性質

 まず主観調査の結果を概観するために、作成サンプルの拡大率と評価結果との関係について触れておく。拡大率に対する主観評価結果の相関は、表2のとおり、主観評価Aで0.88、Bで0.95となった。各サイズごとの評価値の平均をグラフ化したものが、図7(左)である。グラフの−5から+5の数値は、横軸が図3における150:100から100:150に、縦軸が図4の評価値に対応している。

 このグラフより、主観評価Aの場合、拡大率100:100から100:120まで、すなわち基準を110%に置き換えたとき、左右部それぞれ10%程度の拡大に対しては、反応が鈍いことが読みとれる。この程度の左右部の大小差については、一般人にとって許容範囲になっていることが理解できる。 なお、字種別にみると、図7(右)のとおり、「持」のようにおおよそ平均値のグラフと近い形状を示すものが多いが、「和」「唱」の「口」など一部の部分形の場合は、拡大率による反応が鈍いことも留意しておきたい。


3−4 調査Aと調査Bの関係

 図7(上)ですでに確認したとおり、主観評価Aと主観評価Bで評価値に差が見られる。人間の感覚としてどちらを採用すべきであろうか。

 表2より主観評価Bの方が、サイズとの相関において 0.07ほど高い数値となっている。また図7(上)のグラフは、主観評価Bの方が、拡大率に対する反応が大きいことを示している。しかし、主観評価Bは、各サイズの文字が並んだものを見つつ評価をおこなっており、先入観を持ちやすく、より自然な評価はAともいえよう。

 本研究においては、主観評価A:Bの相関係数が0.96と極めて高いことから、主観評価A・Bを平均として用いることとする。(ちなみに、回帰式は、主観評価B=主観評価A× 1.14 + 0.006 となる。)



3−5 9分類の有効性

 今回の調査字種は平形の9分類を参考にした。この9分類の有効性を、主観調査結果から確認しておく。各拡大率別の評価値を用いて、各字種のクラスター分析をおこなった結果が、図8のグラフである。同一の分類の字種がきわめて近い数字となったのは、「陸」と「陛」のみである。グラフ全体としては、左部が大きい傾向の字種と右部が大きい傾向の文字とで分かれ、さらに<てへん・きへん><ひへん・めへん><はらいのある右部>など、類似した構造をもつ部分形が近い数値となってあらわれた。9分類よりも、部分形の構造の方が、主観調査の結果に大きく影響を与えているといえよう。


3−6 客観評価の基準

 次章以下、計算機により抽出された特徴量について考察をおこなうわけだが、その際の基準について考えておく。主観評価の場合、評価する者によって感じ方が異なり、評価に幅が生じる。今回の調査者70人の評価値について、各字種・各サイズごとの標準偏差を求め、それを平均すると、表3の通り、1.02から1.06となる。これは、ある評価者が「ちょうどよい」と答えているのに対し、別の評価者は「やや大きい」と答えることが、かなりの確率であるということになる。またその最大値は約2程度となっており、字種・サイズによっては、ある評価者が「ちょうどよい」と答えているのに対し、別の評価者は「かなり大きい」と答えることもあり得るわけである。

 次章以下の分析においては、主観評価A:B間の相関係数0.96標準誤差0.72を最高値と仮定し、サイズ:主観評価Aの相関係数0.88、主観評価Bの標準偏差1.06を一つの基準として、考察する。




4.特徴量抽出の方法

 左右の部分形から構成される漢字のバランスが、それぞれの部分形の外接矩形のサイズのみで説明できないことは、先に述べたとおりである。では、どういった要素で説明できるのか。ここで、平形の説から推測できる要素を中心として、コンピュータで抽出するための方法について考察しておく。


4−1 パターンの取り扱い

 まず、人間は左右の部分形のバランスを感じる際、決して左部・右部それぞれを見て、バランスを捉えているとは考えにくい。おそらく、一字を一つのまとまりとして捉えていると推測できる。しかし、コンピュータで計算する場合には、図9の<パターンの取り扱い>で示したように、[全体として取り扱う]場合と、[部分形に分けて取り扱う]場合とが考えられる。もちろん、処理過程からすると、全体として取り扱った方が、部分形のセグメンテーションの必要がない点で有利ではある。なお、[全体として取り扱う場合]における左右の基準点については、種々の方法で実験をおこなったが、本稿では外接矩形の中心を用いている。

 また、コンピュータで取り扱う必要上、各パターンはデジタル化し、128*128に収まるパターンとして扱う。


4−2 パターンの変換

 部分形の大きさのバランスについて平形は、字座という概念によって、横瀬*6の心理的ポテンシャル場を引いて説明している。本研究では、特徴量の抽出の際に、そのままの[文字パターン]と、心理的ポテンシャル場近似の[ポテンシャルパターン]、そして比較対象として、いわゆる概形に相当する[多角形近似パターン]、の3種を用いることとする。それぞれのパターンは、図9<パターンの変換>を参照して欲しい。なお、ポテンシャルパターンは、横瀬を参考とした岡本ら*7のプログラムに押木が手を加えたものを用いた。このプログラムによって横瀬のサンプルを計算した結果が図10である。この図形と、横瀬の文献とを比較することによって、横瀬の定義ときわめて近い値が得られていることが確認できる。同様に、図1の「相」を計算したパターンが図11である。平形の文献と比較することで、平形のイメージに近い図形が形成されていることが確認できる。




4−3 特徴量の抽出

 上記の各パターンから、数値として特徴量を取り出すために、図9<特徴量の抽出方法>に示す3種類の方法で、特徴を数値化する。このうち、[広がり量]は先に押木*8が用いた方法である。外接矩形および広がり量については、その高さと面積について求める。したがって、抽出方法は、5通りとなる。


4−4 有効性の確認方法

 以上から、パターンの取り扱いで2種、同変換で3種、そして抽出方法で5種、これらをそれぞれ組み合わせて特徴量を抽出し、その中から特徴的なもの、良い結果を示すものを以下に紹介する。

 その際、有効性の立証は、主観評価と抽出した特徴量との相関係数、および回帰分析をおこなった際の標準誤差によって確認する。回帰分析の結果は、そのまま自動(客観)評価の可能性を示すものとなる。



5.実験結果および考察

5−1 主観調査と特徴量との関係

 コンピュータによる計算結果の有効性について、相関係数と回帰分析による標準誤差から見ていく。表4に代表的な特徴量の数値を載せた。まず、基準として、<外接矩形の高さ>は、0.76/1.37となった。基本的にこれ以下の数値を示した特徴量は、意味をなさないといって良かろう。多角形近似したパターン、すなわち文字の概形のみでは、左右のバランスは説明できないということになる。

 さて、比較的良い結果を示した特徴量としては、<部分別の文字パターンからの広がり量(高さ)>が0.83/1.19、そして<全体のポテンシャルパターン>が0.84/1.17という値を示している。さきに基準としてあげた、<サイズ:主観評価A>の相関0.88、<主観評価B>の標準偏差1.06と比較しても、かなり良い結果を示しているといえよう。しかし、図12のグラフによって<主観評価A:主観評価B>の相関および残差の平均と比べると、まだ良い数値とは言えないことがわかる。これらの結果を、「招」を例に示したものが、図13である。この図では上段で左部が徐々に大きくなり、下段で右部が徐々に大きくなるよう配置してある。これに対して、主観評価も−0.1から−4.1、0.3から2.8まで変化している。コンピュータによる計算結果は、上段では、三者とも多少の誤差はあるものの、ほぼ主観評価同様に変化している。それに対して、下段では、<広がり量(高さ)>と<ポテンシャル>の数値はかなりの増加が見られるのに対し、<外接矩形の高さ>は、バランスが「ちょうどよい」の数値のまま、ほとんど変化を見せていない。この例などは、当初の「相」の場合と同様に考えられる。

 心理的ポテンシャル場の有効性という意味からは、どうだろうか。確かに<文字パターンからの広がり量>より<ポテンシャルパターン>が多少良い数値となってはいる。しかし、ポテンシャルパターンからの特徴量抽出にあたっては、広がりによって数値を引き出しており、一概に心理的ポテンシャル場が有効だということはできない。




5−2 平形の第一次構成字座に関する考察

 字座および心理的ポテンシャル場についての考察を進める。平形は、字座を「第一次構成字座」と「第二次構成字座」の二つに分けて説明している。前者は、「文字の点画間の位置や、部分と部分の位置に直接関係」するもので、部分形の関係について影響するものとされている。また、後者は「文字の存在を場として設定するための必要最小限の空間」であり、「枠内に文字をおさめる場合や、字間・行間を適切にあける場合に働く」ものとされている。

 筆者は、字座の概念が何らかの形で存在すると仮定した場合、それは段階的に存在するものでなく、漸次的な、すなわち点画から離れるにしたがって徐々にその文字の字座が弱くなるという概念としてイメージしたい。また、この方が横瀬の心理的ポテンシャルのイメージと重ねやすい。そして、ある字座の強さ、もしくはポテンシャルのある値において、左右の部分形等のバランスに影響し、またある強さ・値において、枠や罫線に対する字の大きさに影響を与えるとイメージしたい。

 このようにイメージした場合、左右の部分形のバランスを示すのに適切なポテンシャル値の強さがあるのではないかと想像される。これを検討するために、ポテンシャル値の強さと、主観評価との相関の関係を示したグラフが、図14である。このグラフから、左右の部分形のバランスを示すには、ポテンシャル場の強さにして、0.10から0.15が適切であることがわかる。図11の「相」、図13の「招」では、外側から2番目の境界線が0.1、3番目が0.2を示す。このことは、視覚的にも確認できるであろう。

 今回の調査では、平形のいう「第一次構成字座」に該当するポテンシャル値を確認することができたわけだが、これが一般的な理論となり得るかどうかは、さらなる検証が必要である。なお、罫線や枠に対する字座の強さ・ポテンシャル値については本稿の範囲を越えるため、機会を改めて考察したい。



5−3 分位感覚もしくは部分形固有構造について

 コンピュータによって計算された数値と主観評価との差について、字種別に見ると、図15のグラフのようになる。

 <外接矩形の高さ>のグラフと<ポテンシャル>のグラフとでは、全体的にポテンシャルの方が残差が少ないが、全体的にはほぼ同様の形状をなしていることがわかる。その中で、特に<ポテンシャル>のグラフでは、「口」「日」「目」の部分形を含む文字(和・眼・暖・唱)のみが、1.0を越えている。

 平形は、左右の部分形から構成される漢字のバランスを取る要因として、字座の他、「書写角」「分位感覚」「部分形固有の構造」をあげている。特に、部分形固有の構造については、「一般に、開放的構造より閉鎖的構造をもつ文字の方を小さく書くと相互に大きさの調和が保たれる」「閉鎖形はその周囲にほぼ一回り大きな字座が形成されるためにやや小さく書かなければならないが、開放形における字座はほぼ突出部を結んだ範囲にとどまることから、そのままの状態で視覚調整をしなくてもよいことになる」として、この問題も字座もしくは心理的ポテンシャル場によってある程度説明できるとしている。ただし、「口」「日」を例にあげた上で、「固有結構が字座の均等化のための変形に限界がある場合には、当然字座の原理が適用されないことになり・・・」としている。今回誤差の多かった部分形は、まさにこの平形の予測と一致している。

 また平形は、他の要因である「分位感覚」について、「枠内に分割される空間をできるだけ等分にあけようとする分位感覚も強く左右する」としている。筆者は、「口」「日」などの部分形固有構造とされるものも、平形の分位感覚と関係しているのではないかと仮定した。そして、「口」「日」「目」という閉構造のみで構成される部分形に対して、簡易的な補正(補正値=被補正値×(ループ数+0.5)/ループ数)を試みた。その結果が、図15のグラフ中の補正1である。この補正により、閉構造の部分形をもつ「和」「眼」「暖」「唱」のみでなく、全体的に誤差が低下していることがわかる。また、この補正対象から写植サンプルのゴシック体・明朝体をのぞき、手書きと教科書体のみに補正した場合が、補正2のグラフである。補正2による相関係数は0.93、標準偏差は0.81ときわめて良い値を示している。この補正前後の数値について、サンプル「和」「植」を例として、図16に示す。

 なお、現在のところ、文字パターンの広がり量(高さ)の数値には、補正をおこなうのに適切な要素を見いだすことが出来なかったことを付記しておく。


5−4 心理的ポテンシャル場の有効性

 このように見てくると、心理的ポテンシャル場の理論が、自動評価に有効であり、さらには、同理論が人間の感覚を表現しているかのように思える。しかし、前者はともかく、人間の感覚を理論化しているというのは早計である。

 現在のポテンシャル値の計算は、かなりの時間を要すため、比較的高速に計算される類似量をいくつか定義した。そのうちの一つ(本稿末尾参照)によるパターンの例を図17に示す。この類似パターンによる結果を示したのが、表5である。これにより、類似パターンでもほぼおなじ、場合によっては高い相関を示すことがわかる。


 このことからも、心理的ポテンシャル場の理論が、左右の部分形から構成される漢字字形に対する人間の感覚を、理論化しているとは言い切れない。現状では、何らかの関係がある、もしくは、説明するのに適する理論であるといえる程度である。この点を明らかにするためには更に高精度の実験を重ねる必要がある。



6.まとめ

 主観評価に対して、コンピュータで抽出した特徴量のうち、文字パターンの広がり量(高さ)と、ポテンシャルパターンによるものとが、相関係数0.8以上の数値を示した。さらに、後者について、部分形固有構造もしくは分位感覚による補正をおこなった場合、0.93という相関を示し、これは主観評価Aと同Bとの相関係数0.96にかなり近いものと言える。

 コンピュータによる自動(客観)評価、書写CAIの可能性という面からは、補正値の標準誤差が0.81であり、主観評価Bの標準偏差1.06を下回っているという点で、かなり実用性あるものといえるだろう。対象とした字種から、相関における最高値を示した「陸」と最低値を示した「研」について、主観評価とコンピュータによる評価とを、評語で示したものが図18である。コンピュータによる評価の適不適について、確認できよう。今回の実験結果より、字種ごとの(規範とされる字の)データベースなしでの自動評価について、かなりの可能性を示し得たと考える。

 ただし、心理的ポテンシャル場の理論が、人間の感覚を理論化しているかどうかの問題について、今回の実験からは何とも言えない。また、今回の結果は、平形の説にほぼ当てはまる結果となった。これについては、字種選択の方法、同一筆記者の文字をサンプルとしていること、評価者が限られた選択であることからくる主観評価の妥当性の問題など、特殊条件下における検証であることに注意したい。対象字種・字形サンプルの多様化、主観評価値の妥当性の確認などにより、平形説および本研究結果が一般的理論となる得るかの検討をおこなう必要がある。

最後に、主観評価を担当してくれた金沢大学教育学部および金沢学院大学文学部の皆様に心より感謝いたします。


参考: ポテンシャル値 類似パターンの定義



*1 全国大学書写書道教育学会編『書写指導<小学校編>』/萱原書房,p.30
*2 「歐陽率更三十六法」「李淳大字結構八十四法」、P武編『書法正傳』/上海書画出版社,1985
*3 平成元年度版小学校学習指導要領 国語科、3−6年、2.内容、言語事項、(2)書写に関する事項、参照
*4 平形精一「字形要素による学習漢字の分類<i>/『書写書道教育研究』第4号,p.64-74,1990
  平形精一「字形要素による学習漢字の分類<j>/『書写書道教育研究』第5号,p.34-43,1991
*5 阿保直彦編『現代書写字典』/木耳社,1986 の 字形を用いた。
*6 横瀬善正『形の心理学』/名古屋大学出版会,1986
*7 池田達治「手書き文字評価に関する研究」/信州大学大学院修士論文(指導教官 岡本正行)
*8 押木秀樹「書写教育研究における字形分析の利用について」/『書写書道教育研究』第2号,p.56-65,1988