总计超过120亿字。
这还是粗略估算。
这些日本文字应当分为若干范畴,关于这一点,众人的意见是一致的。汉字、汉汉字、汉汉汉字、平假名、平平假名、片假名、平片假名、片平假名,这些类别的存在大致都被认可。但是关于平平平假名的存在,还处于争论中,平汉字、片汉字分类的必要性也不时被提出。
解读作业基本上没有任何进展。
发现的文本,大部分都是十万到百万字的大块文章。而给解读带来障碍的是,那些大块文字中,基本上没有重复的文字。这些文章被称为日本文书,其中出现的重复文字非常少,就连重复度最高的“ぴ”字,也只出现了7000次。而且有人坚持认为,并不是“ぴ”出现了7000次,而是“ひ。”和“ぴ”等异体字构成的文字族。
在解读未知文字时,常用的有效手段是识别数词符号,然而就连这个也还没有确定。“一”“二”“三”大约是数字,这一点可以从它们的形态上识别出来,但“三”以后的数词应该是什么符号,则众说纷纭。有人认为“口”“木”等符号应该被视为“四”,但举不出强有力的旁证。
一般认为,运算符比数词的解读准确度更高,然而这依然没有超出推测阶段。“十”可能是加号,“二”可能是等号。“廿”“土”“王”有的说是数词,有的说是运算符,总之意见都不一致。
文书中频繁出现计算内容,这一点谁都能看出来,但对解读并没有什么帮助。不知为什么,在这种计算式的写法中,似乎并不存在进位。因为如果存在进位,那么不管采取哪种进制,总会重复出现同样的符号。所以大致可以推测采用的是无限进制。但即便如此,重复的符号也太少了,所以有人认为在这种写法中,符号每次出现的时候可能都会变换形态。也就是说,第一次出现的1,和第二次出现的1,会用不同符号加以表示。这个假说似乎解释了什么,然而又似乎什么都没解释。
文章是自上而下纵向从右往左,或是从左往右横向自上而下书写的。这一点可以从笔法和书记的痕迹中辨别出来。然而即便是在这一点上,日本文书也有特殊之处,表现在相邻的行或列之间存在着可以称之为相互作用的标记。在纵向书写中,时常会有某些文字的横线水平贯穿若干列。那线并不是在重合的文字上新画的,而是极其自然地构成其他文字的一部分。横向书写的时候当然也会出现纵向贯穿若干行的线条。大体而言,纵向与横向的纵横写法看起来没有显著差异。至少,似乎不管纵向书写还是横向书写,都不会影响含义。虽然也有见解认为纵向与横向的意义不同