FONTAINE  1.0
Kokuji.h
Go to the documentation of this file.
00001 //
00002 // The Fontaine Font Analysis Project 
00003 // 
00004 // Copyright (c) 2009 by Edward H. Trager
00005 // All Rights Reserved
00006 // 
00007 // Released under the GNU GPL version 2.0 or later.
00008 //     
00009 
00010 
00011 //
00012 // Kokuji.h
00013 //
00014 
00015 #ifndef ORTHOGRAPHY_DATA
00016 #include "../OrthographyData.h"
00017 #endif
00018 
00019 #ifndef KOKUJI
00020 #define KOKUJI
00021 
00022 namespace Kokuji{
00023 
00024 //
00025 //  国字 Unicode values
00026 // 
00027 // Based on a partial list presented at
00028 // http://www.sljfaq.org/afaq/kokuji-list.html
00029 // Updated 2011.04.19.ET.
00030 // This list should still be quite helpful in identifying
00031 // a truly Japanese font from a Chinese font ... maybe!
00032 //
00033 UINT32 values[]={
00034                 // UTF8         JIS VALUE
00035         0x4FE3, // 俣  4B73 
00036         0x4FE4, // 俤  505F 
00037         0x4FE5, // 俥  5060 
00038         0x50CD, // 働  462F 
00039         0x51E7, // 凧  427C 
00040         0x51E9, // 凩  515E 
00041         0x51EA, // 凪  4664 
00042         0x5301, // 匁  4C68 
00043         0x5302, // 匂  4677 
00044         0x53FA, // 叺  525D 
00045         0x54D8, // 哘  5326 
00046         0x55B0, // 喰  3674 
00047         0x5678, // 噸  4655 
00048         0x567A, // 噺  4838 
00049         0x5737, // 圷  542A 
00050         0x5738, // 圸  542B 
00051         0x5788, // 垈  5432 
00052         0x5840, // 塀  4A3D 
00053         0x5870, // 塰  544B 
00054         0x5B36, // 嬶  554E 
00055         0x5CE0, // 峠  463D 
00056         0x603A, // 怺  576A 
00057         0x6762, // 杢  4C5D 
00058         0x6763, // 杣  5B3C 
00059         0x67A0, // 枠  4F48 
00060         0x67A1, // 枡  5B46 
00061         0x67FE, // 柾  4B6F 
00062         0x6802, // 栂  444E 
00063         0x6803, // 栃  464A 
00064         0x691A, // 椚  5C2F 
00065         0x6923, // 椣  5C30 
00066         0x698A, // 榊  3A67 
00067         0x6A2B, // 樫  335F 
00068         0x6BDF, // 毟  5D5B 
00069         0x6C62, // 汢  5D69 
00070         0x71F5, // 燵  5F7D 
00071         0x74E7, // 瓧  6123 
00072         0x74E9, // 瓩  6124 
00073         0x74F0, // 瓰  6127 
00074         0x74F1, // 瓱  6128 
00075         0x74F8, // 瓸  6129 
00076         0x7505, // 甅  612D 
00077         0x7551, // 畑  482A 
00078         0x7560, // 畠  482B 
00079         0x766A, // 癪  617B 
00080         0x7ACD, // 竍  6367 
00081         0x7ACF, // 竏  6368 
00082         0x7AD3, // 竓  636A 
00083         0x7AD5, // 竕  6369 
00084         0x7AE1, // 竡  636E 
00085         0x7AF0, // 竰  6372 
00086         0x7C13, // 簓  6449 
00087         0x7C75, // 籵  6462 
00088         0x7C7E, // 籾  4C62 
00089         0x7C81, // 粁  364E 
00090         0x7C8D, // 粍  4C30 
00091         0x7CA8, // 粨  646A 
00092         0x7CCE, // 糎  4138 
00093         0x7E05, // 縅  654F 
00094         0x8062, // 聢  665E 
00095         0x81A4, // 膤  6733 
00096         0x84D9, // 蓙  6868 
00097         0x88C3, // 裃  6A61 
00098         0x88C4, // 裄  6A62 
00099         0x8904, // 褄  6A6D 
00100         0x8977, // 襷  6B27 
00101         0x8ADA, // 諚  6B5C 
00102         0x8EBE, // 躾  6D3F 
00103         0x8EC8, // 軈  6D41 
00104         0x8FB7, // 辷  6D68 
00105         0x8FBB, // 辻  4454 
00106         0x8FBC, // 込  397E 
00107         0x8FDA, // 迚  6D69 
00108         0x92F2, // 鋲  4946 
00109         0x933A, // 錺  6F25 
00110         0x933B, // 錻  6F27 
00111         0x93B9, // 鎹  6F31 
00112         0x9453, // 鑓  4C7A 
00113         0x958A, // 閊  6F5B 
00114         0x9596, // 閖  6F5D 
00115         0x9786, // 鞆  705D 
00116         0x98AA, // 颪  7124 
00117         0x9942, // 饂  713B 
00118         0x9B96, // 鮖  723B 
00119         0x9B97, // 鮗  723C 
00120         0x9BA0, // 鮠  723E 
00121         0x9BCF, // 鯏  7245 
00122         0x9BD1, // 鯑  7246 
00123         0x9BD2, // 鯒  7247 
00124         0x9BF0, // 鯰  7250 
00125         0x9BF1, // 鯱  724F 
00126         0x9C2F, // 鰯  3073 
00127         0x9C30, // 鰰  7260 
00128         0x9C48, // 鱈  432D 
00129         0x9C5A, // 鱚  7265 
00130         0x9D2B, // 鴫  3C32 
00131         0x9EBF, // 麿  4B7B 
00132         END_OF_DATA
00133 };
00134 
00135 //
00136 // Sample sentences
00137 // 
00138 const char *sentences[]={
00139         "碓氷峠(うすいとうげ)は群馬県安中市松井田町と長野県北佐久郡軽井沢町との境にある日本の峠である。",
00140         END_OF_DATA
00141 };
00142 
00143 
00144 //
00145 // 
00146 //
00147 OrthographyData data={
00148         "Japanese Kokuji",
00149         "日本国字",
00150         0x5ce0, // Mountain pass, 峠 
00151         values,
00152         "峠栂込榊鴫辻畑柾梻毟",
00153         sentences
00154 };
00155 
00156 const OrthographyData *pData = &data;
00157 
00158 }; // end of namespace
00159 
00160 #endif