Next Previous Contents

2. 希伯来文的字元标准

2.1 ASCII

首先, 我要认真地申明一件事: 没有所谓 8-bit ASCII 这种东西. ASCII 只有 7 个 bit. 任何是 8 个 bit 的字元码都不可能是 ASCII, 但可以是另一种字元标准. ISO-8859-8 是一种字元标准, 但不是 ASCII. 请弄清楚这一点!

2.2 DOS 希伯来文

希伯来文字元从 Aleph 中十进位的 128 开始. 因此, 字码需要 8 个 bit. 在你的影像卡 EPROM 里有著所有 DOS-based 的希伯来文编辑器 (Qtext, HED, 等) 所使用的硬件字型表.

2.3 ISO 希伯来文

希伯来文字元从 Aleph 中十进位的 224 开始. 这个标准适用于网际网路, 国际字元标准, 以及微软视窗作业系统及 Macintosh (Dagesh 等).

2.4 旧 PC 的希伯来文

这是一个使用 7 个 bit 且已被淘汰的字元标准. 它所使用的字码范围和 ASCII 中英文小写字母相同, 因此不建议你使用它. 然而, 当某些无知的 Unix 邮件程序将你的 ISO 希伯来文字元中的最高 bit 去掉时 (这时你就会在信件中希伯来文的部份看到一堆混杂著奇怪英文字母的东西), 你就会得到像这样一个 7-bit 的玩意儿; 这时, 你得把它转换成 PC 或 ISO. 如果在希伯来文中夹杂了英文, 悲剧便于焉诞生 - 你如果不是会看到希伯来文加上乱码, 就是乱码加英文...

2.5 字元标准转换

以下是一些做字元标准转换的简单命令稿 (scripts):

DOS - ISO:      tr '\200-\232' '\340-\372' < {dos_file} > {iso_file}
ISO - DOS:      tr '\340-\372' '\200-\232' < {iso_file} > {dos_file}
OLD - DOS:      tr -z '\200-\232' < {old_Hebrew_file} > {dos_file}

注意: tr 使用的数字是八进位的!


Next Previous Contents