TUT-CODEの入力速度について
TUTコードでは出現頻度の高い文字に合理的なキーの割り当てがなされています。ここで語句の出現頻度とTUT-CODEについて考察してみます。 データとしては『現代日本語書き言葉均衡コーパス』短単位語彙表の中納言データ(BCCJ_frequencylist_suw_ver1_1.tsv)を例にします。この字源は、1億以上(104,612,418)の語句を様々なジャンルから抽出したBCCJ全体の出現頻度順位(1番から152,442番)を公開しています。
この中納言データを横軸に頻度順位、縱軸に語句全体のデータに対する割合をグラフを以下に示します。このグラフより、頻度順位1から1000番までで、全体の75%程度を占めることが分かります。
このデータの頻度順位の語句、品詞、それに対応するTUT-CODEと、さらに同じ漢字直接入力で有名なT-CODEを順位1番~18番まで表にまとめてみました。各コードについては、QWERTYキーボード上の英子文と記号で表記しています。
頻度順位 |
語句 |
品詞 |
TUT-CODE |
T-CODE |
1 |
の |
(格)助詞 |
fj |
kd |
2 |
に |
(格)助詞 |
fi |
kg |
3 |
て |
(接続)助詞 |
dh |
la |
4 |
は |
(係)助詞 |
tk |
jg |
5 |
だ |
助動詞 |
dlk |
hc |
6 |
を |
(格)助詞 |
aj |
;g |
7 |
た |
助動詞 |
dk |
ks |
8 |
為る |
(非自立可)動詞 |
tgygu |
|
9 |
が |
(格)助詞 |
elk |
;s |
10 |
と |
(格)助詞 |
dj |
ja |
11 |
で |
(格)助詞 |
dlh |
ha |
12 |
も |
(格)助詞 |
wj |
ia |
13 |
居る |
(非自立可)動詞 |
/ogu |
vw;a |
14 |
ます |
助動詞 |
wksu |
md,f |
15 |
の |
(準体)助詞 |
fj |
kd |
16 |
有る |
(非自立可)動詞 |
sdgu |
|
17 |
です |
助動詞 |
dlhsu |
hg,f |
18 |
言う |
(一般)動詞 |
b,ru |
gl;a |
頻度順位1番と15番は平仮名「の」です。また、1番~4番の「の」、「に」、「て」、「は」などは、TUT-CODE、T-CODE共に左右の手の2ストローク交互打ちとなっていて、このように頻度の高い語句には、手指の運動能力の高い(速く動作できる)コードが割り付けられています。 また、頻度の高い漢字の「為」や「有」であっても、T-CODEでは割り付けがされていませんが、割り付け可能な1600文字のうち、1300文字が割り付けられているだけですので、頻度の高い漢字文字は漢字直接入力できるようにした方が良いと思われます。 ちなみに、ローマ字入力では、「の」、「に」、「て」などは片手の2ストローク打ちです。
TUT-CODEの本領発揮は、漢字直接入力というその名のごとく、ローマ字仮名漢字変換のような変換、選択というった煩わしさがなく、漢字を入力できることです。 頻度順位19番~に出現する漢字に対するTUT-CODEの2ストロークで打鍵する手の順番について以下に示します。(品詞による分類は考えません。また、頻度の高い順に一度だけ表示しています)
頻度順位19番~100番で出現する2ストローク漢字
手の動き (個数) |
2ストローク漢字 |
交互手左右 (15) |
成、的、来、思、見、行、者、私、人、本、達、考、方、場、持 |
交互手右左 (16) |
事、二、三、十、年、五、四、時、六、月、八、第、日、中、千、分 |
片手左左 (6) |
無、御、何、自、仕、今 |
片手右右 (4) |
様、物、良、所 |
頻度順位101番~200番で出現する2ストローク漢字
手の動き (個数) |
2ストローク漢字 |
交互手左右 (22) |
出、取、性、必、要、対、使、会、置、入、気、多、目、上、社、話、手、点、受、生、法、書 |
交互手右左 (17) |
前、円、万、九、百、問、知、後、一、作、市、業、内、七、付、次、同 |
片手左左 (5) |
関、座、世、他、活 |
片手右右 (12) |
彼、等、下、然、題、化、聞、係、及、以、歳、界 |
頻度順位201番~300番で出現する2ストローク漢字
手の動き (個数) |
2ストローク漢字 |
交互手左右 (22) |
得、男、情、意、味、女、委、員、代、当、声、家、別、張、食、通、違、先、調、査、過、相 |
交互手右左 (18) |
条、高、研、地、大、葉、国、県、学、企、不、経、教、共、動、環、部、電 |
片手左左 (9) |
報、利、少、全、現、未、始、結、変 |
片手右右 (12) |
究、顔、回、図、校、間、用、在、済、心、度、果 |
頻度順位301番~400番で出現する2ストローク漢字
手の動き (個数) |
2ストローク漢字 |
交互手左右 (23) |
感、強、買、術、続、特、写、真、館、政、府、長、好、開、発、切、規、定、説、明、読、実、重 |
交互手右左 (11) |
昭、和、労、制、頭、水、立、新、理、機、小 |
片手左左 (16) |
計、直、悪、約、保、態、示、平、早、返、基、質、施、管、費、参 |
片手右右 (21) |
状、況、力、育、画、技、容、険、号、車、般、例、働、体、氏、省、故、表、設、番、加 |
頻度順位401番~500番で出現する2ストローク漢字
手の動き (個数) |
2ストローク漢字 |
交互手左右 (15) |
語、求、権、若、備、初、主、義、風、価、認、答、解、策、談 |
交互手右左 (10) |
口、億、与、文、屋、金、産、外、山、都 |
片手左左 (16) |
最、形、程、整、各、額、待、従、評、率、乗、族、効、響、母、数 |
片手右右 (13) |
型、件、民、論、々、際、由、普、終、側、含、量、能 |
頻度順位501番~600番で出現する2ストローク漢字
手の動き (個数) |
2ストローク漢字 |
交互手左右 (14) |
応、期、治、向、確、指、導、身、店、死、決、組、協、消 |
交互手右左 (14) |
区、歩、料、午、安、町、可、元、名、営、面、商、務、駅 |
片手左左 (10) |
健、運、非、品、花、深、推、残、史、病 |
片手右右 (11) |
個、夜、害、常、式、色、局、歴、課、院、告 |
頻度順位601番~700番で出現する2ストローク漢字
手の動き (個数) |
2ストローク漢字 |
交互手左右 (12) |
選、合、任、進、足、線、戦、争、起、判、交、予 |
交互手右左 (13) |
道、格、神、精、室、土、木、映、宅、造、朝、越、川 |
片手左左 (13) |
増、医、介、団、送、渡、資、注、福、税、住、単、役 |
片手右右 (9) |
護、験、字、親、断、銀、準、構、比 |
頻度順位701番~800番で出現する2ストローク漢字
手の動き (個数) |
2ストローク漢字 |
交互手左右 (10) |
検、売、再、投、引、打、配、美、官、党 |
交互手右左 (13) |
近、原、支、軍、村、友、門、台、階、士、科、建、央 |
片手左左 (10) |
庭、討、警、専、類、守、白、昨、具、毎 |
片手右右 (11) |
販、庁、楽、裁、種、難、止、位、辺、連、路 |
頻度順位801番~900番で出現する2ストローク漢字
手の動き (個数) |
2ストローク漢字 |
交互手左右 (9) |
議、負、申、込、提、総、子、放、限 |
交互手右左 (5) |
光、融、齢、海、沢 |
片手左左 (6) |
伝、信、音、積、広、右 |
片手右右 (6) |
担、低、夫、値、段、即 |
頻度順位901番~1000番で出現する2ストローク漢字
交互手左右(6) |
録、算、記、展、反、落 |
交互手右左(3) |
半、農、振 |
片手左左(5) |
登、監、公、改、遊 |
片手右右(8) |
完、隊、督、転、首、善、園、割 |
また、頻度順位1~1000番に対するTUT-CODEの3ストロークで打鍵する漢字について以下に示します。(品詞による分類は考えません。また、頻度の高い順に一度だけ表示しています)
頻度順位 (個数) |
出現する3ストローク漢字 |
1~100 (7) |
為、其、此、因、又、零、舞 |
101~200 (9) |
遣、於、訳、呉、処、貴、僕、皆、貰 |
201~300 (9) |
掛、域、誰、頂、矢、頃、境、俺、寸 |
301~400 (10) |
呼、或、筈、象、存、致、項、殆、緒、易 |
401~500 (16) |
勿、余、欲、飲、詰、願、姿、笑、我、従、既、更、率、箇、戻、影 |
501~600 (11) |
康、系、障、臣、識、婚、唯、父、律、君、織 |
601~700 (15) |
旨、客、責、療、凄、昔、紹、走、忘、枚、述、娘、祉、簡、契 |
701~800 (14) |
紀、描、択、援、察、己、駄、嫌、猶、該、奴、絡、絶、患 |
801~900 (27) |
頑、較、否、夢、但、奇、麗、模、勧、供、被、奥、幾、逆、異、覚、嬉、妻、伴、措、降、購、章、探、危、寝、摘 |
901~1000 (16) |
曲、至、撮、努、益、催、離、症、照、拡、暫、革、胸、標、夏、去 |
頻度順位1番から1000番までで、平仮名、カタカナ、TUT-CODE漢字以外にない文字(記号を含む)は「侭迚.■謂」の5個でした。
さらに、頻度順位1~1000番に対するカタカナ語句を以下に示します。
頻度順位 (個数) |
出現するカタカナ語句 |
101~200 (1) |
パーセント |
201~300 (1) |
トウキョウ |
301~400 (2) |
アメリカ、ページ |
401~500 (1) |
センター |
501~600 (5) |
サービス、システム、メートル、テレビ、メール |
601~700 (1) |
データ |
801~900 (4) |
オオサカ、フランス、ポイント、ホーム |
901~1000 (6) |
ホテル、ブログ、クリック、グループ、エネルギー、タイプ |
現在では日本語入力技能についての客観的な認証を行う団体がいくつかあるようですが、私個人的にはその中の一つの団体から「10分間に700文字以上は打てます」というお墨付をいただいてはおります。(実際に私が受けた検定試験のとき、ワープロの下欄に表示される行数、けた数を覚えておりましたので、その数字から後で計算してみると900文字以上は入力できておりました。しかし、誤字1文字につき、5字分減らされますので、実際の正文字入力数は分かりませんが、仮に総打鍵数を900文字として、合格点700文字ぎりぎりの場合、最大許容誤字数が40文字ですから、10分間に860文字以上は正確に入力できていたという計算になります)
仮に一生懸命、最高に頑張って入力したときに700文字/10分間の入力速度であったとすれば、長時間入力の場合にはその大体半分ぐらいの350文字/10分間と計算して、50分間で1,750文字入力できます。1時間のVDT作業を考える場合、50分間作業、10分間休憩ですから(現在では45分作業、15分休憩も多いようです)、普通に長時間の入力作業を行って、実質1時間で1,750文字は実績値/保証値として入力できるのではないかということになります。
以上のことから、すべてのTUT-CODEを利用(練習)している人が、考えられないような超人的な入力速度を出せるというわけではないと考えておりますが、毎日少しずつ練習して、漢字直接入力方式に慣れた人であれば、日本語ワープロ検定を受けても、上級と認められるぐらいの入力速度は出せるものとみております。ただし全くの初心者(と言っても最低限、手元を見ないで10本の指でキーボードが打てるぐらいの人)が漢字直接入力に慣れるためには、無理なく練習しても大体1年ぐらいの習得期間は考えておいた方が良いと思いますので、気長にやった方が良いでしょう。