用户:Xyb/转换Unihan资料
< User:Xyb
经 Shizhao 提议,编写了一个转换 Unihan 资料的脚本。
http://xie.freezope.org/upload/Files/unihan-0.1.py
现在程序已经可以解析指定字符的所有信息。对这些信息的更深入使用正在探索中。下一步准备:
- 读音转换为 yā 的样式
- 把词组按照正序、逆序、其它分类
执行效果:
$ ./unihan.py 4e2b 字: 丫 ==编码== *十进制:20011 *UTF-8: E4 B8 AB *UTF-16: 4E2B *UTF-32: 00004E2B ==读音== *[[普通话]]: YA1 *[[粤语]]: A1 *Tang: *Japanese On: A *Japanese Kun: HUTAMATA AGEMAKI *Sino-Korean: A [[小丫钷]], xiao3yatou5, a little girl (expressing contempt or endearment); a young housemaid [[丫]], ya1, slave girl [[丫钷 丫鬟 丫鬟兒]], yatou5 yahuan5 yahuar5, (in old China) a slave girl; a bought maid; a maid; (丫钷 in; modern usage) a small girl, especially one's own daughter [[丫枝]], yazhi, a forked branch
程序还在编写中,请提出您的宝贵意见。
该脚本可在 Windows 下直接使用(需要从[1]安装Python程序)。