KS X 1001 KS X 1001
KS X 1001是韩国用于书写的谚文和汉字的字符编码规格。以前称作KS C 5601,现在则称作这名称较多。也有只称作KS编码的。
类似于JIS X 0208的94×94文本集合,包含谚文2350字、汉字4888字、英文本母、数字和假名合计8226字。谚文设计成一文本为由字母组合成一音节的并非所有可能的组成符号都有,存在许多无法表现的音节,因此有许多批评声音。百事可乐的韩国法人因 KS X 1001 不含「?」,1992年改为 KS X 1001 中存在的谚文表示「?」。
汉字则是照读音顺序来配置的。韩国语原则上一字一音,但也有破音字的存在。这个规格的一大特征是对这样的汉字的每个读音位置都重复编码。
虽然也有不一样的,使用头音法则,即转成最先遇到的那个读音,但如「卢」和「李」如此常用的字也有别的读音和重复编码。最多的是有4个重复编码的「乐」。这个方式的好处是、字的读音利于机械的判定,但却也遭受批评违反字符编码的大原则。此外,这样重复编码的汉字在统一码和通用字符集中因互换性的关系,中日韩统一表意文本只收录一个、其它的则收录于中日韩兼容汉字。
KS X 1001在EUC的编码称作韩国语EUC(EUC-KR)。实际上,KS X 1001 是完全没有被用于其它编码方法(ISO-2022-KR完全没有被使用),单独的 KS C 5601 通常意味 EUC-KR 。
一些电脑系统对此标准编了许多版本。但他们并非都使用同样方法,如将典型放在 0x5C 的反斜线改成韩圆(?)。有些系统则使用非常规方法来扩充此标准。KS X 1001 可编码成 EUC-KR、Windows-949(EUC-KR 的超集)、ISO-2022-KR 和「双字节合型符号」(Johab)。但后二个很少使用。
朝鲜则使用另一规格KPS 9566。