documentation was wrong
[sdlhildon] / sdlhim / src / unicode.c
1 /* This file is part of SDL_him - SDL Hildon Input Method addon
2  * Copyright (C) 2010 Javier S. Pedro
3  * Copyright (C) 2005-2010 Nokia Corporation and/or its subsidiary(-ies).
4  * Copyright (C) 1997-2000 GTK+ Team and others
5  * Copyright (C) 1995-1997 Peter Mattis, Spencer Kimball and Josh MacDonald
6  *
7  * This library is free software; you can redistribute it and/or
8  * modify it under the terms of the GNU Lesser General Public
9  * License as published by the Free Software Foundation; either
10  * version 3 of the License, or (at your option) any later version.
11  *
12  * This library is distributed in the hope that it will be useful,
13  * but WITHOUT ANY WARRANTY; without even the implied warranty of
14  * MERCHANTABILITY or FITNESS FOR A PARTICULAR PURPOSE.  See the GNU
15  * Lesser General Public License for more details.
16  *
17  * You should have received a copy of the GNU Lesser General Public
18  * License along with this library; if not, write to the
19  * Free Software Foundation, Inc., 59 Temple Place - Suite 330,
20  * Boston, MA 02111-1307, USA or see <http://www.gnu.org/licenses/>.
21  */
22
23 #include <SDL.h>
24 #include <X11/Xlib.h>
25 #include <X11/Xutil.h>
26
27 #include "unicode.h"
28
29 #define countof(x) ( sizeof(x) / sizeof((x)[0]) )
30
31 Uint32 dead_key_to_unicode_combining_character(KeySym keysym)
32 {
33         Uint32 combining;
34
35         switch (keysym)
36         {
37                 case XK_dead_grave:            combining = 0x0300; break;
38                 case XK_dead_acute:            combining = 0x0301; break;
39                 case XK_dead_circumflex:       combining = 0x0302; break;
40                 case XK_dead_tilde:            combining = 0x0303; break;
41                 case XK_dead_macron:           combining = 0x0304; break;
42                 case XK_dead_breve:            combining = 0x032e; break;
43                 case XK_dead_abovedot:         combining = 0x0307; break;
44                 case XK_dead_diaeresis:        combining = 0x0308; break;
45                 case XK_dead_abovering:        combining = 0x030a; break;
46                 case XK_dead_doubleacute:      combining = 0x030b; break;
47                 case XK_dead_caron:            combining = 0x030c; break;
48                 case XK_dead_cedilla:          combining = 0x0327; break;
49                 case XK_dead_ogonek:           combining = 0x0328; break;
50                 case XK_dead_iota:             combining = 0; break; /* Cannot be combined */
51                 case XK_dead_voiced_sound:     combining = 0; break; /* Cannot be combined */
52                 case XK_dead_semivoiced_sound: combining = 0; break; /* Cannot be combined */
53                 case XK_dead_belowdot:         combining = 0x0323; break;
54                 case XK_dead_hook:             combining = 0x0309; break;
55                 case XK_dead_horn:             combining = 0x031b; break;
56                 default: combining = 0; break; /* Unknown dead key */
57         }
58
59         return combining;
60 }
61
62 Uint32 combining_character_to_unicode(Uint32 combining)
63 {
64         Uint32 unicode;
65
66         switch (combining)
67         {
68                 case 0x0300: unicode = 0x0060; break;
69                 case 0x0301: unicode = 0x00b4; break;
70                 case 0x0302: unicode = 0x005e; break;
71                 case 0x0303: unicode = 0x007e; break;
72                 case 0x0304: unicode = 0x00af; break;    
73                 case 0x0307: unicode = 0x02d9; break;
74                 case 0x0308: unicode = 0x00a8; break;
75                 case 0x0309: unicode = 0x0294; break;
76                 case 0x030a: unicode = 0x00b0; break;
77                 case 0x030b: unicode = 0x0022; break;
78                 case 0x030c: unicode = 0x02c7; break;
79                 case 0x031b: unicode = 0x031b; break;
80                 case 0x0323: unicode = 0x02d4; break;
81                 case 0x0327: unicode = 0x00b8; break;
82                 case 0x0328: unicode = 0x02db; break;            
83                 case 0x032e: unicode = 0x032e; break;
84                 default: unicode = 0; break; /* Unknown combining char */
85         }
86
87         return unicode;
88 }
89
90 int unicode_to_utf8(Uint32 unichar, char * buf)
91 {
92         /* TODO: Something more ... complete. */
93         int i = 0;
94         
95         if (unichar >= 2048) {
96                 buf[i++] = 0xE0 | ((unichar & 0xF000) >> 12);
97         }
98
99         if (unichar >= 128) {
100                 if (unichar < 2048) {
101                         buf[i++] = 0xC0 | ((unichar & 0x700) >> 6) | ((unichar & 0xC0) >> 6);
102                 } else {
103                         buf[i++] = 0x80 | ((unichar & 0xF00) >> 6) | ((unichar & 0xC0) >> 6);
104                 }
105         }
106         
107         if (unichar < 128) {
108                 buf[i++] = unichar;
109         } else {
110                 buf[i++] = 0x80 | (unichar & 0x3F);
111         }
112         
113         buf[i] = '\0';
114
115         return i;
116 }
117
118 #include "composite_tables.inc"
119
120 static Uint32 compose_unicode_with_table
121 (Uint32 first, const struct item * table, int size)
122 {
123         /* Search within the second table */
124         int min = 0;
125         int max = size - 1;
126         int mid;
127
128         /* Binary search in table */
129         while (max >= min) {
130                 mid = (min + max) / 2;
131                 if (table[mid].first < first) {
132                         min = mid + 1;
133                 } else if (table[mid].first > first) {
134                         max = mid - 1;
135                 } else {
136                         /* found it */
137                         return table[mid].result;
138                 }
139         }
140
141         return NOT_COMPOSITE;
142 }
143
144 /* @return Unicode NFC normalization of first concatenated with second. */
145 Uint32  compose_unicode_characters(Uint32 first, Uint32 second)
146 {
147         /* A simple implementation that does not use hash tables but binary search. */
148         /* The data set is smallish so I guess it doesn't matter. */
149
150         /* Filter some invalid characters */
151         if (first > 0x10FFFF || second > 0x10FFFF) {
152                 return NOT_COMPOSITE;
153         }
154
155         /* Search for the appropiate second table */
156         int min = 0;
157         int max = countof(composite_table) - 1;
158         int mid;
159
160         /* Binary search in table */
161         while (max >= min) {
162                 mid = (min + max) / 2;
163                 if (composite_table[mid].second < second) {
164                         min = mid + 1;
165                 } else if (composite_table[mid].second > second) {
166                         max = mid - 1;
167                 } else {
168                         /* found it */
169                         return compose_unicode_with_table(first,
170                                 composite_table[mid].data, composite_table[mid].data_size);
171                 }
172         }
173
174         return NOT_COMPOSITE;
175 }
176
177 /* Thanks to Markus G. Kuhn <mkuhn@acm.org> for the ksysym<->Unicode
178  * mapping functions, from the xterm sources.
179  */
180
181 /* These tables could be compressed by contiguous ranges, but the benefit of doing so
182  * is smallish. It would save about ~1000 bytes total.
183  */
184
185 static const struct {
186   unsigned short keysym;
187   unsigned short ucs;
188 } keysym_to_unicode_tab[] = {
189   { 0x01a1, 0x0104 }, /*                     Aogonek Ą LATIN CAPITAL LETTER A WITH OGONEK */
190   { 0x01a2, 0x02d8 }, /*                       breve ˘ BREVE */
191   { 0x01a3, 0x0141 }, /*                     Lstroke Ł LATIN CAPITAL LETTER L WITH STROKE */
192   { 0x01a5, 0x013d }, /*                      Lcaron Ľ LATIN CAPITAL LETTER L WITH CARON */
193   { 0x01a6, 0x015a }, /*                      Sacute Ś LATIN CAPITAL LETTER S WITH ACUTE */
194   { 0x01a9, 0x0160 }, /*                      Scaron Š LATIN CAPITAL LETTER S WITH CARON */
195   { 0x01aa, 0x015e }, /*                    Scedilla Ş LATIN CAPITAL LETTER S WITH CEDILLA */
196   { 0x01ab, 0x0164 }, /*                      Tcaron Ť LATIN CAPITAL LETTER T WITH CARON */
197   { 0x01ac, 0x0179 }, /*                      Zacute Ź LATIN CAPITAL LETTER Z WITH ACUTE */
198   { 0x01ae, 0x017d }, /*                      Zcaron Ž LATIN CAPITAL LETTER Z WITH CARON */
199   { 0x01af, 0x017b }, /*                   Zabovedot Ż LATIN CAPITAL LETTER Z WITH DOT ABOVE */
200   { 0x01b1, 0x0105 }, /*                     aogonek ą LATIN SMALL LETTER A WITH OGONEK */
201   { 0x01b2, 0x02db }, /*                      ogonek ˛ OGONEK */
202   { 0x01b3, 0x0142 }, /*                     lstroke ł LATIN SMALL LETTER L WITH STROKE */
203   { 0x01b5, 0x013e }, /*                      lcaron ľ LATIN SMALL LETTER L WITH CARON */
204   { 0x01b6, 0x015b }, /*                      sacute ś LATIN SMALL LETTER S WITH ACUTE */
205   { 0x01b7, 0x02c7 }, /*                       caron ˇ CARON */
206   { 0x01b9, 0x0161 }, /*                      scaron š LATIN SMALL LETTER S WITH CARON */
207   { 0x01ba, 0x015f }, /*                    scedilla ş LATIN SMALL LETTER S WITH CEDILLA */
208   { 0x01bb, 0x0165 }, /*                      tcaron ť LATIN SMALL LETTER T WITH CARON */
209   { 0x01bc, 0x017a }, /*                      zacute ź LATIN SMALL LETTER Z WITH ACUTE */
210   { 0x01bd, 0x02dd }, /*                 doubleacute ˝ DOUBLE ACUTE ACCENT */
211   { 0x01be, 0x017e }, /*                      zcaron ž LATIN SMALL LETTER Z WITH CARON */
212   { 0x01bf, 0x017c }, /*                   zabovedot ż LATIN SMALL LETTER Z WITH DOT ABOVE */
213   { 0x01c0, 0x0154 }, /*                      Racute Ŕ LATIN CAPITAL LETTER R WITH ACUTE */
214   { 0x01c3, 0x0102 }, /*                      Abreve Ă LATIN CAPITAL LETTER A WITH BREVE */
215   { 0x01c5, 0x0139 }, /*                      Lacute Ĺ LATIN CAPITAL LETTER L WITH ACUTE */
216   { 0x01c6, 0x0106 }, /*                      Cacute Ć LATIN CAPITAL LETTER C WITH ACUTE */
217   { 0x01c8, 0x010c }, /*                      Ccaron Č LATIN CAPITAL LETTER C WITH CARON */
218   { 0x01ca, 0x0118 }, /*                     Eogonek Ę LATIN CAPITAL LETTER E WITH OGONEK */
219   { 0x01cc, 0x011a }, /*                      Ecaron Ě LATIN CAPITAL LETTER E WITH CARON */
220   { 0x01cf, 0x010e }, /*                      Dcaron Ď LATIN CAPITAL LETTER D WITH CARON */
221   { 0x01d0, 0x0110 }, /*                     Dstroke Đ LATIN CAPITAL LETTER D WITH STROKE */
222   { 0x01d1, 0x0143 }, /*                      Nacute Ń LATIN CAPITAL LETTER N WITH ACUTE */
223   { 0x01d2, 0x0147 }, /*                      Ncaron Ň LATIN CAPITAL LETTER N WITH CARON */
224   { 0x01d5, 0x0150 }, /*                Odoubleacute Ő LATIN CAPITAL LETTER O WITH DOUBLE ACUTE */
225   { 0x01d8, 0x0158 }, /*                      Rcaron Ř LATIN CAPITAL LETTER R WITH CARON */
226   { 0x01d9, 0x016e }, /*                       Uring Ů LATIN CAPITAL LETTER U WITH RING ABOVE */
227   { 0x01db, 0x0170 }, /*                Udoubleacute Ű LATIN CAPITAL LETTER U WITH DOUBLE ACUTE */
228   { 0x01de, 0x0162 }, /*                    Tcedilla Ţ LATIN CAPITAL LETTER T WITH CEDILLA */
229   { 0x01e0, 0x0155 }, /*                      racute ŕ LATIN SMALL LETTER R WITH ACUTE */
230   { 0x01e3, 0x0103 }, /*                      abreve ă LATIN SMALL LETTER A WITH BREVE */
231   { 0x01e5, 0x013a }, /*                      lacute ĺ LATIN SMALL LETTER L WITH ACUTE */
232   { 0x01e6, 0x0107 }, /*                      cacute ć LATIN SMALL LETTER C WITH ACUTE */
233   { 0x01e8, 0x010d }, /*                      ccaron č LATIN SMALL LETTER C WITH CARON */
234   { 0x01ea, 0x0119 }, /*                     eogonek ę LATIN SMALL LETTER E WITH OGONEK */
235   { 0x01ec, 0x011b }, /*                      ecaron ě LATIN SMALL LETTER E WITH CARON */
236   { 0x01ef, 0x010f }, /*                      dcaron ď LATIN SMALL LETTER D WITH CARON */
237   { 0x01f0, 0x0111 }, /*                     dstroke đ LATIN SMALL LETTER D WITH STROKE */
238   { 0x01f1, 0x0144 }, /*                      nacute ń LATIN SMALL LETTER N WITH ACUTE */
239   { 0x01f2, 0x0148 }, /*                      ncaron ň LATIN SMALL LETTER N WITH CARON */
240   { 0x01f5, 0x0151 }, /*                odoubleacute ő LATIN SMALL LETTER O WITH DOUBLE ACUTE */
241   { 0x01f8, 0x0159 }, /*                      rcaron ř LATIN SMALL LETTER R WITH CARON */
242   { 0x01f9, 0x016f }, /*                       uring ů LATIN SMALL LETTER U WITH RING ABOVE */
243   { 0x01fb, 0x0171 }, /*                udoubleacute ű LATIN SMALL LETTER U WITH DOUBLE ACUTE */
244   { 0x01fe, 0x0163 }, /*                    tcedilla ţ LATIN SMALL LETTER T WITH CEDILLA */
245   { 0x01ff, 0x02d9 }, /*                    abovedot ˙ DOT ABOVE */
246   { 0x02a1, 0x0126 }, /*                     Hstroke Ħ LATIN CAPITAL LETTER H WITH STROKE */
247   { 0x02a6, 0x0124 }, /*                 Hcircumflex Ĥ LATIN CAPITAL LETTER H WITH CIRCUMFLEX */
248   { 0x02a9, 0x0130 }, /*                   Iabovedot İ LATIN CAPITAL LETTER I WITH DOT ABOVE */
249   { 0x02ab, 0x011e }, /*                      Gbreve Ğ LATIN CAPITAL LETTER G WITH BREVE */
250   { 0x02ac, 0x0134 }, /*                 Jcircumflex Ĵ LATIN CAPITAL LETTER J WITH CIRCUMFLEX */
251   { 0x02b1, 0x0127 }, /*                     hstroke ħ LATIN SMALL LETTER H WITH STROKE */
252   { 0x02b6, 0x0125 }, /*                 hcircumflex ĥ LATIN SMALL LETTER H WITH CIRCUMFLEX */
253   { 0x02b9, 0x0131 }, /*                    idotless ı LATIN SMALL LETTER DOTLESS I */
254   { 0x02bb, 0x011f }, /*                      gbreve ğ LATIN SMALL LETTER G WITH BREVE */
255   { 0x02bc, 0x0135 }, /*                 jcircumflex ĵ LATIN SMALL LETTER J WITH CIRCUMFLEX */
256   { 0x02c5, 0x010a }, /*                   Cabovedot Ċ LATIN CAPITAL LETTER C WITH DOT ABOVE */
257   { 0x02c6, 0x0108 }, /*                 Ccircumflex Ĉ LATIN CAPITAL LETTER C WITH CIRCUMFLEX */
258   { 0x02d5, 0x0120 }, /*                   Gabovedot Ġ LATIN CAPITAL LETTER G WITH DOT ABOVE */
259   { 0x02d8, 0x011c }, /*                 Gcircumflex Ĝ LATIN CAPITAL LETTER G WITH CIRCUMFLEX */
260   { 0x02dd, 0x016c }, /*                      Ubreve Ŭ LATIN CAPITAL LETTER U WITH BREVE */
261   { 0x02de, 0x015c }, /*                 Scircumflex Ŝ LATIN CAPITAL LETTER S WITH CIRCUMFLEX */
262   { 0x02e5, 0x010b }, /*                   cabovedot ċ LATIN SMALL LETTER C WITH DOT ABOVE */
263   { 0x02e6, 0x0109 }, /*                 ccircumflex ĉ LATIN SMALL LETTER C WITH CIRCUMFLEX */
264   { 0x02f5, 0x0121 }, /*                   gabovedot ġ LATIN SMALL LETTER G WITH DOT ABOVE */
265   { 0x02f8, 0x011d }, /*                 gcircumflex ĝ LATIN SMALL LETTER G WITH CIRCUMFLEX */
266   { 0x02fd, 0x016d }, /*                      ubreve ŭ LATIN SMALL LETTER U WITH BREVE */
267   { 0x02fe, 0x015d }, /*                 scircumflex ŝ LATIN SMALL LETTER S WITH CIRCUMFLEX */
268   { 0x03a2, 0x0138 }, /*                         kra ĸ LATIN SMALL LETTER KRA */
269   { 0x03a3, 0x0156 }, /*                    Rcedilla Ŗ LATIN CAPITAL LETTER R WITH CEDILLA */
270   { 0x03a5, 0x0128 }, /*                      Itilde Ĩ LATIN CAPITAL LETTER I WITH TILDE */
271   { 0x03a6, 0x013b }, /*                    Lcedilla Ļ LATIN CAPITAL LETTER L WITH CEDILLA */
272   { 0x03aa, 0x0112 }, /*                     Emacron Ē LATIN CAPITAL LETTER E WITH MACRON */
273   { 0x03ab, 0x0122 }, /*                    Gcedilla Ģ LATIN CAPITAL LETTER G WITH CEDILLA */
274   { 0x03ac, 0x0166 }, /*                      Tslash Ŧ LATIN CAPITAL LETTER T WITH STROKE */
275   { 0x03b3, 0x0157 }, /*                    rcedilla ŗ LATIN SMALL LETTER R WITH CEDILLA */
276   { 0x03b5, 0x0129 }, /*                      itilde ĩ LATIN SMALL LETTER I WITH TILDE */
277   { 0x03b6, 0x013c }, /*                    lcedilla ļ LATIN SMALL LETTER L WITH CEDILLA */
278   { 0x03ba, 0x0113 }, /*                     emacron ē LATIN SMALL LETTER E WITH MACRON */
279   { 0x03bb, 0x0123 }, /*                    gcedilla ģ LATIN SMALL LETTER G WITH CEDILLA */
280   { 0x03bc, 0x0167 }, /*                      tslash ŧ LATIN SMALL LETTER T WITH STROKE */
281   { 0x03bd, 0x014a }, /*                         ENG Ŋ LATIN CAPITAL LETTER ENG */
282   { 0x03bf, 0x014b }, /*                         eng ŋ LATIN SMALL LETTER ENG */
283   { 0x03c0, 0x0100 }, /*                     Amacron Ā LATIN CAPITAL LETTER A WITH MACRON */
284   { 0x03c7, 0x012e }, /*                     Iogonek Į LATIN CAPITAL LETTER I WITH OGONEK */
285   { 0x03cc, 0x0116 }, /*                   Eabovedot Ė LATIN CAPITAL LETTER E WITH DOT ABOVE */
286   { 0x03cf, 0x012a }, /*                     Imacron Ī LATIN CAPITAL LETTER I WITH MACRON */
287   { 0x03d1, 0x0145 }, /*                    Ncedilla Ņ LATIN CAPITAL LETTER N WITH CEDILLA */
288   { 0x03d2, 0x014c }, /*                     Omacron Ō LATIN CAPITAL LETTER O WITH MACRON */
289   { 0x03d3, 0x0136 }, /*                    Kcedilla Ķ LATIN CAPITAL LETTER K WITH CEDILLA */
290   { 0x03d9, 0x0172 }, /*                     Uogonek Ų LATIN CAPITAL LETTER U WITH OGONEK */
291   { 0x03dd, 0x0168 }, /*                      Utilde Ũ LATIN CAPITAL LETTER U WITH TILDE */
292   { 0x03de, 0x016a }, /*                     Umacron Ū LATIN CAPITAL LETTER U WITH MACRON */
293   { 0x03e0, 0x0101 }, /*                     amacron ā LATIN SMALL LETTER A WITH MACRON */
294   { 0x03e7, 0x012f }, /*                     iogonek į LATIN SMALL LETTER I WITH OGONEK */
295   { 0x03ec, 0x0117 }, /*                   eabovedot ė LATIN SMALL LETTER E WITH DOT ABOVE */
296   { 0x03ef, 0x012b }, /*                     imacron ī LATIN SMALL LETTER I WITH MACRON */
297   { 0x03f1, 0x0146 }, /*                    ncedilla ņ LATIN SMALL LETTER N WITH CEDILLA */
298   { 0x03f2, 0x014d }, /*                     omacron ō LATIN SMALL LETTER O WITH MACRON */
299   { 0x03f3, 0x0137 }, /*                    kcedilla ķ LATIN SMALL LETTER K WITH CEDILLA */
300   { 0x03f9, 0x0173 }, /*                     uogonek ų LATIN SMALL LETTER U WITH OGONEK */
301   { 0x03fd, 0x0169 }, /*                      utilde ũ LATIN SMALL LETTER U WITH TILDE */
302   { 0x03fe, 0x016b }, /*                     umacron ū LATIN SMALL LETTER U WITH MACRON */
303   { 0x047e, 0x203e }, /*                    overline ‾ OVERLINE */
304   { 0x04a1, 0x3002 }, /*               kana_fullstop 。 IDEOGRAPHIC FULL STOP */
305   { 0x04a2, 0x300c }, /*         kana_openingbracket 「 LEFT CORNER BRACKET */
306   { 0x04a3, 0x300d }, /*         kana_closingbracket 」 RIGHT CORNER BRACKET */
307   { 0x04a4, 0x3001 }, /*                  kana_comma 、 IDEOGRAPHIC COMMA */
308   { 0x04a5, 0x30fb }, /*            kana_conjunctive ・ KATAKANA MIDDLE DOT */
309   { 0x04a6, 0x30f2 }, /*                     kana_WO ヲ KATAKANA LETTER WO */
310   { 0x04a7, 0x30a1 }, /*                      kana_a ァ KATAKANA LETTER SMALL A */
311   { 0x04a8, 0x30a3 }, /*                      kana_i ィ KATAKANA LETTER SMALL I */
312   { 0x04a9, 0x30a5 }, /*                      kana_u ゥ KATAKANA LETTER SMALL U */
313   { 0x04aa, 0x30a7 }, /*                      kana_e ェ KATAKANA LETTER SMALL E */
314   { 0x04ab, 0x30a9 }, /*                      kana_o ォ KATAKANA LETTER SMALL O */
315   { 0x04ac, 0x30e3 }, /*                     kana_ya ャ KATAKANA LETTER SMALL YA */
316   { 0x04ad, 0x30e5 }, /*                     kana_yu ュ KATAKANA LETTER SMALL YU */
317   { 0x04ae, 0x30e7 }, /*                     kana_yo ョ KATAKANA LETTER SMALL YO */
318   { 0x04af, 0x30c3 }, /*                    kana_tsu ッ KATAKANA LETTER SMALL TU */
319   { 0x04b0, 0x30fc }, /*              prolongedsound ー KATAKANA-HIRAGANA PROLONGED SOUND MARK */
320   { 0x04b1, 0x30a2 }, /*                      kana_A ア KATAKANA LETTER A */
321   { 0x04b2, 0x30a4 }, /*                      kana_I イ KATAKANA LETTER I */
322   { 0x04b3, 0x30a6 }, /*                      kana_U ウ KATAKANA LETTER U */
323   { 0x04b4, 0x30a8 }, /*                      kana_E エ KATAKANA LETTER E */
324   { 0x04b5, 0x30aa }, /*                      kana_O オ KATAKANA LETTER O */
325   { 0x04b6, 0x30ab }, /*                     kana_KA カ KATAKANA LETTER KA */
326   { 0x04b7, 0x30ad }, /*                     kana_KI キ KATAKANA LETTER KI */
327   { 0x04b8, 0x30af }, /*                     kana_KU ク KATAKANA LETTER KU */
328   { 0x04b9, 0x30b1 }, /*                     kana_KE ケ KATAKANA LETTER KE */
329   { 0x04ba, 0x30b3 }, /*                     kana_KO コ KATAKANA LETTER KO */
330   { 0x04bb, 0x30b5 }, /*                     kana_SA サ KATAKANA LETTER SA */
331   { 0x04bc, 0x30b7 }, /*                    kana_SHI シ KATAKANA LETTER SI */
332   { 0x04bd, 0x30b9 }, /*                     kana_SU ス KATAKANA LETTER SU */
333   { 0x04be, 0x30bb }, /*                     kana_SE セ KATAKANA LETTER SE */
334   { 0x04bf, 0x30bd }, /*                     kana_SO ソ KATAKANA LETTER SO */
335   { 0x04c0, 0x30bf }, /*                     kana_TA タ KATAKANA LETTER TA */
336   { 0x04c1, 0x30c1 }, /*                    kana_CHI チ KATAKANA LETTER TI */
337   { 0x04c2, 0x30c4 }, /*                    kana_TSU ツ KATAKANA LETTER TU */
338   { 0x04c3, 0x30c6 }, /*                     kana_TE テ KATAKANA LETTER TE */
339   { 0x04c4, 0x30c8 }, /*                     kana_TO ト KATAKANA LETTER TO */
340   { 0x04c5, 0x30ca }, /*                     kana_NA ナ KATAKANA LETTER NA */
341   { 0x04c6, 0x30cb }, /*                     kana_NI ニ KATAKANA LETTER NI */
342   { 0x04c7, 0x30cc }, /*                     kana_NU ヌ KATAKANA LETTER NU */
343   { 0x04c8, 0x30cd }, /*                     kana_NE ネ KATAKANA LETTER NE */
344   { 0x04c9, 0x30ce }, /*                     kana_NO ノ KATAKANA LETTER NO */
345   { 0x04ca, 0x30cf }, /*                     kana_HA ハ KATAKANA LETTER HA */
346   { 0x04cb, 0x30d2 }, /*                     kana_HI ヒ KATAKANA LETTER HI */
347   { 0x04cc, 0x30d5 }, /*                     kana_FU フ KATAKANA LETTER HU */
348   { 0x04cd, 0x30d8 }, /*                     kana_HE ヘ KATAKANA LETTER HE */
349   { 0x04ce, 0x30db }, /*                     kana_HO ホ KATAKANA LETTER HO */
350   { 0x04cf, 0x30de }, /*                     kana_MA マ KATAKANA LETTER MA */
351   { 0x04d0, 0x30df }, /*                     kana_MI ミ KATAKANA LETTER MI */
352   { 0x04d1, 0x30e0 }, /*                     kana_MU ム KATAKANA LETTER MU */
353   { 0x04d2, 0x30e1 }, /*                     kana_ME メ KATAKANA LETTER ME */
354   { 0x04d3, 0x30e2 }, /*                     kana_MO モ KATAKANA LETTER MO */
355   { 0x04d4, 0x30e4 }, /*                     kana_YA ヤ KATAKANA LETTER YA */
356   { 0x04d5, 0x30e6 }, /*                     kana_YU ユ KATAKANA LETTER YU */
357   { 0x04d6, 0x30e8 }, /*                     kana_YO ヨ KATAKANA LETTER YO */
358   { 0x04d7, 0x30e9 }, /*                     kana_RA ラ KATAKANA LETTER RA */
359   { 0x04d8, 0x30ea }, /*                     kana_RI リ KATAKANA LETTER RI */
360   { 0x04d9, 0x30eb }, /*                     kana_RU ル KATAKANA LETTER RU */
361   { 0x04da, 0x30ec }, /*                     kana_RE レ KATAKANA LETTER RE */
362   { 0x04db, 0x30ed }, /*                     kana_RO ロ KATAKANA LETTER RO */
363   { 0x04dc, 0x30ef }, /*                     kana_WA ワ KATAKANA LETTER WA */
364   { 0x04dd, 0x30f3 }, /*                      kana_N ン KATAKANA LETTER N */
365   { 0x04de, 0x309b }, /*                 voicedsound ゛ KATAKANA-HIRAGANA VOICED SOUND MARK */
366   { 0x04df, 0x309c }, /*             semivoicedsound ゜ KATAKANA-HIRAGANA SEMI-VOICED SOUND MARK */
367   { 0x05ac, 0x060c }, /*                Arabic_comma ، ARABIC COMMA */
368   { 0x05bb, 0x061b }, /*            Arabic_semicolon ؛ ARABIC SEMICOLON */
369   { 0x05bf, 0x061f }, /*        Arabic_question_mark ؟ ARABIC QUESTION MARK */
370   { 0x05c1, 0x0621 }, /*                Arabic_hamza ء ARABIC LETTER HAMZA */
371   { 0x05c2, 0x0622 }, /*          Arabic_maddaonalef آ ARABIC LETTER ALEF WITH MADDA ABOVE */
372   { 0x05c3, 0x0623 }, /*          Arabic_hamzaonalef أ ARABIC LETTER ALEF WITH HAMZA ABOVE */
373   { 0x05c4, 0x0624 }, /*           Arabic_hamzaonwaw ؤ ARABIC LETTER WAW WITH HAMZA ABOVE */
374   { 0x05c5, 0x0625 }, /*       Arabic_hamzaunderalef إ ARABIC LETTER ALEF WITH HAMZA BELOW */
375   { 0x05c6, 0x0626 }, /*           Arabic_hamzaonyeh ئ ARABIC LETTER YEH WITH HAMZA ABOVE */
376   { 0x05c7, 0x0627 }, /*                 Arabic_alef ا ARABIC LETTER ALEF */
377   { 0x05c8, 0x0628 }, /*                  Arabic_beh ب ARABIC LETTER BEH */
378   { 0x05c9, 0x0629 }, /*           Arabic_tehmarbuta ة ARABIC LETTER TEH MARBUTA */
379   { 0x05ca, 0x062a }, /*                  Arabic_teh ت ARABIC LETTER TEH */
380   { 0x05cb, 0x062b }, /*                 Arabic_theh ث ARABIC LETTER THEH */
381   { 0x05cc, 0x062c }, /*                 Arabic_jeem ج ARABIC LETTER JEEM */
382   { 0x05cd, 0x062d }, /*                  Arabic_hah ح ARABIC LETTER HAH */
383   { 0x05ce, 0x062e }, /*                 Arabic_khah خ ARABIC LETTER KHAH */
384   { 0x05cf, 0x062f }, /*                  Arabic_dal د ARABIC LETTER DAL */
385   { 0x05d0, 0x0630 }, /*                 Arabic_thal ذ ARABIC LETTER THAL */
386   { 0x05d1, 0x0631 }, /*                   Arabic_ra ر ARABIC LETTER REH */
387   { 0x05d2, 0x0632 }, /*                 Arabic_zain ز ARABIC LETTER ZAIN */
388   { 0x05d3, 0x0633 }, /*                 Arabic_seen س ARABIC LETTER SEEN */
389   { 0x05d4, 0x0634 }, /*                Arabic_sheen ش ARABIC LETTER SHEEN */
390   { 0x05d5, 0x0635 }, /*                  Arabic_sad ص ARABIC LETTER SAD */
391   { 0x05d6, 0x0636 }, /*                  Arabic_dad ض ARABIC LETTER DAD */
392   { 0x05d7, 0x0637 }, /*                  Arabic_tah ط ARABIC LETTER TAH */
393   { 0x05d8, 0x0638 }, /*                  Arabic_zah ظ ARABIC LETTER ZAH */
394   { 0x05d9, 0x0639 }, /*                  Arabic_ain ع ARABIC LETTER AIN */
395   { 0x05da, 0x063a }, /*                Arabic_ghain غ ARABIC LETTER GHAIN */
396   { 0x05e0, 0x0640 }, /*              Arabic_tatweel ـ ARABIC TATWEEL */
397   { 0x05e1, 0x0641 }, /*                  Arabic_feh ف ARABIC LETTER FEH */
398   { 0x05e2, 0x0642 }, /*                  Arabic_qaf ق ARABIC LETTER QAF */
399   { 0x05e3, 0x0643 }, /*                  Arabic_kaf ك ARABIC LETTER KAF */
400   { 0x05e4, 0x0644 }, /*                  Arabic_lam ل ARABIC LETTER LAM */
401   { 0x05e5, 0x0645 }, /*                 Arabic_meem م ARABIC LETTER MEEM */
402   { 0x05e6, 0x0646 }, /*                 Arabic_noon ن ARABIC LETTER NOON */
403   { 0x05e7, 0x0647 }, /*                   Arabic_ha ه ARABIC LETTER HEH */
404   { 0x05e8, 0x0648 }, /*                  Arabic_waw و ARABIC LETTER WAW */
405   { 0x05e9, 0x0649 }, /*          Arabic_alefmaksura ى ARABIC LETTER ALEF MAKSURA */
406   { 0x05ea, 0x064a }, /*                  Arabic_yeh ي ARABIC LETTER YEH */
407   { 0x05eb, 0x064b }, /*             Arabic_fathatan ً ARABIC FATHATAN */
408   { 0x05ec, 0x064c }, /*             Arabic_dammatan ٌ ARABIC DAMMATAN */
409   { 0x05ed, 0x064d }, /*             Arabic_kasratan ٍ ARABIC KASRATAN */
410   { 0x05ee, 0x064e }, /*                Arabic_fatha َ ARABIC FATHA */
411   { 0x05ef, 0x064f }, /*                Arabic_damma ُ ARABIC DAMMA */
412   { 0x05f0, 0x0650 }, /*                Arabic_kasra ِ ARABIC KASRA */
413   { 0x05f1, 0x0651 }, /*               Arabic_shadda ّ ARABIC SHADDA */
414   { 0x05f2, 0x0652 }, /*                Arabic_sukun ْ ARABIC SUKUN */
415   { 0x06a1, 0x0452 }, /*                 Serbian_dje ђ CYRILLIC SMALL LETTER DJE */
416   { 0x06a2, 0x0453 }, /*               Macedonia_gje ѓ CYRILLIC SMALL LETTER GJE */
417   { 0x06a3, 0x0451 }, /*                 Cyrillic_io ё CYRILLIC SMALL LETTER IO */
418   { 0x06a4, 0x0454 }, /*                Ukrainian_ie є CYRILLIC SMALL LETTER UKRAINIAN IE */
419   { 0x06a5, 0x0455 }, /*               Macedonia_dse ѕ CYRILLIC SMALL LETTER DZE */
420   { 0x06a6, 0x0456 }, /*                 Ukrainian_i і CYRILLIC SMALL LETTER BYELORUSSIAN-UKRAINIAN I */
421   { 0x06a7, 0x0457 }, /*                Ukrainian_yi ї CYRILLIC SMALL LETTER YI */
422   { 0x06a8, 0x0458 }, /*                 Cyrillic_je ј CYRILLIC SMALL LETTER JE */
423   { 0x06a9, 0x0459 }, /*                Cyrillic_lje љ CYRILLIC SMALL LETTER LJE */
424   { 0x06aa, 0x045a }, /*                Cyrillic_nje њ CYRILLIC SMALL LETTER NJE */
425   { 0x06ab, 0x045b }, /*                Serbian_tshe ћ CYRILLIC SMALL LETTER TSHE */
426   { 0x06ac, 0x045c }, /*               Macedonia_kje ќ CYRILLIC SMALL LETTER KJE */
427   { 0x06ad, 0x0491 }, /*   Ukrainian_ghe_with_upturn ґ CYRILLIC SMALL LETTER GHE WITH UPTURN */
428   { 0x06ae, 0x045e }, /*         Byelorussian_shortu ў CYRILLIC SMALL LETTER SHORT U */
429   { 0x06af, 0x045f }, /*               Cyrillic_dzhe џ CYRILLIC SMALL LETTER DZHE */
430   { 0x06b0, 0x2116 }, /*                  numerosign № NUMERO SIGN */
431   { 0x06b1, 0x0402 }, /*                 Serbian_DJE Ђ CYRILLIC CAPITAL LETTER DJE */
432   { 0x06b2, 0x0403 }, /*               Macedonia_GJE Ѓ CYRILLIC CAPITAL LETTER GJE */
433   { 0x06b3, 0x0401 }, /*                 Cyrillic_IO Ё CYRILLIC CAPITAL LETTER IO */
434   { 0x06b4, 0x0404 }, /*                Ukrainian_IE Є CYRILLIC CAPITAL LETTER UKRAINIAN IE */
435   { 0x06b5, 0x0405 }, /*               Macedonia_DSE Ѕ CYRILLIC CAPITAL LETTER DZE */
436   { 0x06b6, 0x0406 }, /*                 Ukrainian_I І CYRILLIC CAPITAL LETTER BYELORUSSIAN-UKRAINIAN I */
437   { 0x06b7, 0x0407 }, /*                Ukrainian_YI Ї CYRILLIC CAPITAL LETTER YI */
438   { 0x06b8, 0x0408 }, /*                 Cyrillic_JE Ј CYRILLIC CAPITAL LETTER JE */
439   { 0x06b9, 0x0409 }, /*                Cyrillic_LJE Љ CYRILLIC CAPITAL LETTER LJE */
440   { 0x06ba, 0x040a }, /*                Cyrillic_NJE Њ CYRILLIC CAPITAL LETTER NJE */
441   { 0x06bb, 0x040b }, /*                Serbian_TSHE Ћ CYRILLIC CAPITAL LETTER TSHE */
442   { 0x06bc, 0x040c }, /*               Macedonia_KJE Ќ CYRILLIC CAPITAL LETTER KJE */
443   { 0x06bd, 0x0490 }, /*   Ukrainian_GHE_WITH_UPTURN Ґ CYRILLIC CAPITAL LETTER GHE WITH UPTURN */
444   { 0x06be, 0x040e }, /*         Byelorussian_SHORTU Ў CYRILLIC CAPITAL LETTER SHORT U */
445   { 0x06bf, 0x040f }, /*               Cyrillic_DZHE Џ CYRILLIC CAPITAL LETTER DZHE */
446   { 0x06c0, 0x044e }, /*                 Cyrillic_yu ю CYRILLIC SMALL LETTER YU */
447   { 0x06c1, 0x0430 }, /*                  Cyrillic_a а CYRILLIC SMALL LETTER A */
448   { 0x06c2, 0x0431 }, /*                 Cyrillic_be б CYRILLIC SMALL LETTER BE */
449   { 0x06c3, 0x0446 }, /*                Cyrillic_tse ц CYRILLIC SMALL LETTER TSE */
450   { 0x06c4, 0x0434 }, /*                 Cyrillic_de д CYRILLIC SMALL LETTER DE */
451   { 0x06c5, 0x0435 }, /*                 Cyrillic_ie е CYRILLIC SMALL LETTER IE */
452   { 0x06c6, 0x0444 }, /*                 Cyrillic_ef ф CYRILLIC SMALL LETTER EF */
453   { 0x06c7, 0x0433 }, /*                Cyrillic_ghe г CYRILLIC SMALL LETTER GHE */
454   { 0x06c8, 0x0445 }, /*                 Cyrillic_ha х CYRILLIC SMALL LETTER HA */
455   { 0x06c9, 0x0438 }, /*                  Cyrillic_i и CYRILLIC SMALL LETTER I */
456   { 0x06ca, 0x0439 }, /*             Cyrillic_shorti й CYRILLIC SMALL LETTER SHORT I */
457   { 0x06cb, 0x043a }, /*                 Cyrillic_ka к CYRILLIC SMALL LETTER KA */
458   { 0x06cc, 0x043b }, /*                 Cyrillic_el л CYRILLIC SMALL LETTER EL */
459   { 0x06cd, 0x043c }, /*                 Cyrillic_em м CYRILLIC SMALL LETTER EM */
460   { 0x06ce, 0x043d }, /*                 Cyrillic_en н CYRILLIC SMALL LETTER EN */
461   { 0x06cf, 0x043e }, /*                  Cyrillic_o о CYRILLIC SMALL LETTER O */
462   { 0x06d0, 0x043f }, /*                 Cyrillic_pe п CYRILLIC SMALL LETTER PE */
463   { 0x06d1, 0x044f }, /*                 Cyrillic_ya я CYRILLIC SMALL LETTER YA */
464   { 0x06d2, 0x0440 }, /*                 Cyrillic_er р CYRILLIC SMALL LETTER ER */
465   { 0x06d3, 0x0441 }, /*                 Cyrillic_es с CYRILLIC SMALL LETTER ES */
466   { 0x06d4, 0x0442 }, /*                 Cyrillic_te т CYRILLIC SMALL LETTER TE */
467   { 0x06d5, 0x0443 }, /*                  Cyrillic_u у CYRILLIC SMALL LETTER U */
468   { 0x06d6, 0x0436 }, /*                Cyrillic_zhe ж CYRILLIC SMALL LETTER ZHE */
469   { 0x06d7, 0x0432 }, /*                 Cyrillic_ve в CYRILLIC SMALL LETTER VE */
470   { 0x06d8, 0x044c }, /*           Cyrillic_softsign ь CYRILLIC SMALL LETTER SOFT SIGN */
471   { 0x06d9, 0x044b }, /*               Cyrillic_yeru ы CYRILLIC SMALL LETTER YERU */
472   { 0x06da, 0x0437 }, /*                 Cyrillic_ze з CYRILLIC SMALL LETTER ZE */
473   { 0x06db, 0x0448 }, /*                Cyrillic_sha ш CYRILLIC SMALL LETTER SHA */
474   { 0x06dc, 0x044d }, /*                  Cyrillic_e э CYRILLIC SMALL LETTER E */
475   { 0x06dd, 0x0449 }, /*              Cyrillic_shcha щ CYRILLIC SMALL LETTER SHCHA */
476   { 0x06de, 0x0447 }, /*                Cyrillic_che ч CYRILLIC SMALL LETTER CHE */
477   { 0x06df, 0x044a }, /*           Cyrillic_hardsign ъ CYRILLIC SMALL LETTER HARD SIGN */
478   { 0x06e0, 0x042e }, /*                 Cyrillic_YU Ю CYRILLIC CAPITAL LETTER YU */
479   { 0x06e1, 0x0410 }, /*                  Cyrillic_A А CYRILLIC CAPITAL LETTER A */
480   { 0x06e2, 0x0411 }, /*                 Cyrillic_BE Б CYRILLIC CAPITAL LETTER BE */
481   { 0x06e3, 0x0426 }, /*                Cyrillic_TSE Ц CYRILLIC CAPITAL LETTER TSE */
482   { 0x06e4, 0x0414 }, /*                 Cyrillic_DE Д CYRILLIC CAPITAL LETTER DE */
483   { 0x06e5, 0x0415 }, /*                 Cyrillic_IE Е CYRILLIC CAPITAL LETTER IE */
484   { 0x06e6, 0x0424 }, /*                 Cyrillic_EF Ф CYRILLIC CAPITAL LETTER EF */
485   { 0x06e7, 0x0413 }, /*                Cyrillic_GHE Г CYRILLIC CAPITAL LETTER GHE */
486   { 0x06e8, 0x0425 }, /*                 Cyrillic_HA Х CYRILLIC CAPITAL LETTER HA */
487   { 0x06e9, 0x0418 }, /*                  Cyrillic_I И CYRILLIC CAPITAL LETTER I */
488   { 0x06ea, 0x0419 }, /*             Cyrillic_SHORTI Й CYRILLIC CAPITAL LETTER SHORT I */
489   { 0x06eb, 0x041a }, /*                 Cyrillic_KA К CYRILLIC CAPITAL LETTER KA */
490   { 0x06ec, 0x041b }, /*                 Cyrillic_EL Л CYRILLIC CAPITAL LETTER EL */
491   { 0x06ed, 0x041c }, /*                 Cyrillic_EM М CYRILLIC CAPITAL LETTER EM */
492   { 0x06ee, 0x041d }, /*                 Cyrillic_EN Н CYRILLIC CAPITAL LETTER EN */
493   { 0x06ef, 0x041e }, /*                  Cyrillic_O О CYRILLIC CAPITAL LETTER O */
494   { 0x06f0, 0x041f }, /*                 Cyrillic_PE П CYRILLIC CAPITAL LETTER PE */
495   { 0x06f1, 0x042f }, /*                 Cyrillic_YA Я CYRILLIC CAPITAL LETTER YA */
496   { 0x06f2, 0x0420 }, /*                 Cyrillic_ER Р CYRILLIC CAPITAL LETTER ER */
497   { 0x06f3, 0x0421 }, /*                 Cyrillic_ES С CYRILLIC CAPITAL LETTER ES */
498   { 0x06f4, 0x0422 }, /*                 Cyrillic_TE Т CYRILLIC CAPITAL LETTER TE */
499   { 0x06f5, 0x0423 }, /*                  Cyrillic_U У CYRILLIC CAPITAL LETTER U */
500   { 0x06f6, 0x0416 }, /*                Cyrillic_ZHE Ж CYRILLIC CAPITAL LETTER ZHE */
501   { 0x06f7, 0x0412 }, /*                 Cyrillic_VE В CYRILLIC CAPITAL LETTER VE */
502   { 0x06f8, 0x042c }, /*           Cyrillic_SOFTSIGN Ь CYRILLIC CAPITAL LETTER SOFT SIGN */
503   { 0x06f9, 0x042b }, /*               Cyrillic_YERU Ы CYRILLIC CAPITAL LETTER YERU */
504   { 0x06fa, 0x0417 }, /*                 Cyrillic_ZE З CYRILLIC CAPITAL LETTER ZE */
505   { 0x06fb, 0x0428 }, /*                Cyrillic_SHA Ш CYRILLIC CAPITAL LETTER SHA */
506   { 0x06fc, 0x042d }, /*                  Cyrillic_E Э CYRILLIC CAPITAL LETTER E */
507   { 0x06fd, 0x0429 }, /*              Cyrillic_SHCHA Щ CYRILLIC CAPITAL LETTER SHCHA */
508   { 0x06fe, 0x0427 }, /*                Cyrillic_CHE Ч CYRILLIC CAPITAL LETTER CHE */
509   { 0x06ff, 0x042a }, /*           Cyrillic_HARDSIGN Ъ CYRILLIC CAPITAL LETTER HARD SIGN */
510   { 0x07a1, 0x0386 }, /*           Greek_ALPHAaccent Ά GREEK CAPITAL LETTER ALPHA WITH TONOS */
511   { 0x07a2, 0x0388 }, /*         Greek_EPSILONaccent Έ GREEK CAPITAL LETTER EPSILON WITH TONOS */
512   { 0x07a3, 0x0389 }, /*             Greek_ETAaccent Ή GREEK CAPITAL LETTER ETA WITH TONOS */
513   { 0x07a4, 0x038a }, /*            Greek_IOTAaccent Ί GREEK CAPITAL LETTER IOTA WITH TONOS */
514   { 0x07a5, 0x03aa }, /*          Greek_IOTAdieresis Ϊ GREEK CAPITAL LETTER IOTA WITH DIALYTIKA */
515   { 0x07a7, 0x038c }, /*         Greek_OMICRONaccent Ό GREEK CAPITAL LETTER OMICRON WITH TONOS */
516   { 0x07a8, 0x038e }, /*         Greek_UPSILONaccent Ύ GREEK CAPITAL LETTER UPSILON WITH TONOS */
517   { 0x07a9, 0x03ab }, /*       Greek_UPSILONdieresis Ϋ GREEK CAPITAL LETTER UPSILON WITH DIALYTIKA */
518   { 0x07ab, 0x038f }, /*           Greek_OMEGAaccent Ώ GREEK CAPITAL LETTER OMEGA WITH TONOS */
519   { 0x07ae, 0x0385 }, /*        Greek_accentdieresis ΅ GREEK DIALYTIKA TONOS */
520   { 0x07af, 0x2015 }, /*              Greek_horizbar ― HORIZONTAL BAR */
521   { 0x07b1, 0x03ac }, /*           Greek_alphaaccent ά GREEK SMALL LETTER ALPHA WITH TONOS */
522   { 0x07b2, 0x03ad }, /*         Greek_epsilonaccent έ GREEK SMALL LETTER EPSILON WITH TONOS */
523   { 0x07b3, 0x03ae }, /*             Greek_etaaccent ή GREEK SMALL LETTER ETA WITH TONOS */
524   { 0x07b4, 0x03af }, /*            Greek_iotaaccent ί GREEK SMALL LETTER IOTA WITH TONOS */
525   { 0x07b5, 0x03ca }, /*          Greek_iotadieresis ϊ GREEK SMALL LETTER IOTA WITH DIALYTIKA */
526   { 0x07b6, 0x0390 }, /*    Greek_iotaaccentdieresis ΐ GREEK SMALL LETTER IOTA WITH DIALYTIKA AND TONOS */
527   { 0x07b7, 0x03cc }, /*         Greek_omicronaccent ό GREEK SMALL LETTER OMICRON WITH TONOS */
528   { 0x07b8, 0x03cd }, /*         Greek_upsilonaccent ύ GREEK SMALL LETTER UPSILON WITH TONOS */
529   { 0x07b9, 0x03cb }, /*       Greek_upsilondieresis ϋ GREEK SMALL LETTER UPSILON WITH DIALYTIKA */
530   { 0x07ba, 0x03b0 }, /* Greek_upsilonaccentdieresis ΰ GREEK SMALL LETTER UPSILON WITH DIALYTIKA AND TONOS */
531   { 0x07bb, 0x03ce }, /*           Greek_omegaaccent ώ GREEK SMALL LETTER OMEGA WITH TONOS */
532   { 0x07c1, 0x0391 }, /*                 Greek_ALPHA Α GREEK CAPITAL LETTER ALPHA */
533   { 0x07c2, 0x0392 }, /*                  Greek_BETA Β GREEK CAPITAL LETTER BETA */
534   { 0x07c3, 0x0393 }, /*                 Greek_GAMMA Γ GREEK CAPITAL LETTER GAMMA */
535   { 0x07c4, 0x0394 }, /*                 Greek_DELTA Δ GREEK CAPITAL LETTER DELTA */
536   { 0x07c5, 0x0395 }, /*               Greek_EPSILON Ε GREEK CAPITAL LETTER EPSILON */
537   { 0x07c6, 0x0396 }, /*                  Greek_ZETA Ζ GREEK CAPITAL LETTER ZETA */
538   { 0x07c7, 0x0397 }, /*                   Greek_ETA Η GREEK CAPITAL LETTER ETA */
539   { 0x07c8, 0x0398 }, /*                 Greek_THETA Θ GREEK CAPITAL LETTER THETA */
540   { 0x07c9, 0x0399 }, /*                  Greek_IOTA Ι GREEK CAPITAL LETTER IOTA */
541   { 0x07ca, 0x039a }, /*                 Greek_KAPPA Κ GREEK CAPITAL LETTER KAPPA */
542   { 0x07cb, 0x039b }, /*                Greek_LAMBDA Λ GREEK CAPITAL LETTER LAMDA */
543   { 0x07cc, 0x039c }, /*                    Greek_MU Μ GREEK CAPITAL LETTER MU */
544   { 0x07cd, 0x039d }, /*                    Greek_NU Ν GREEK CAPITAL LETTER NU */
545   { 0x07ce, 0x039e }, /*                    Greek_XI Ξ GREEK CAPITAL LETTER XI */
546   { 0x07cf, 0x039f }, /*               Greek_OMICRON Ο GREEK CAPITAL LETTER OMICRON */
547   { 0x07d0, 0x03a0 }, /*                    Greek_PI Π GREEK CAPITAL LETTER PI */
548   { 0x07d1, 0x03a1 }, /*                   Greek_RHO Ρ GREEK CAPITAL LETTER RHO */
549   { 0x07d2, 0x03a3 }, /*                 Greek_SIGMA Σ GREEK CAPITAL LETTER SIGMA */
550   { 0x07d4, 0x03a4 }, /*                   Greek_TAU Τ GREEK CAPITAL LETTER TAU */
551   { 0x07d5, 0x03a5 }, /*               Greek_UPSILON Υ GREEK CAPITAL LETTER UPSILON */
552   { 0x07d6, 0x03a6 }, /*                   Greek_PHI Φ GREEK CAPITAL LETTER PHI */
553   { 0x07d7, 0x03a7 }, /*                   Greek_CHI Χ GREEK CAPITAL LETTER CHI */
554   { 0x07d8, 0x03a8 }, /*                   Greek_PSI Ψ GREEK CAPITAL LETTER PSI */
555   { 0x07d9, 0x03a9 }, /*                 Greek_OMEGA Ω GREEK CAPITAL LETTER OMEGA */
556   { 0x07e1, 0x03b1 }, /*                 Greek_alpha α GREEK SMALL LETTER ALPHA */
557   { 0x07e2, 0x03b2 }, /*                  Greek_beta β GREEK SMALL LETTER BETA */
558   { 0x07e3, 0x03b3 }, /*                 Greek_gamma γ GREEK SMALL LETTER GAMMA */
559   { 0x07e4, 0x03b4 }, /*                 Greek_delta δ GREEK SMALL LETTER DELTA */
560   { 0x07e5, 0x03b5 }, /*               Greek_epsilon ε GREEK SMALL LETTER EPSILON */
561   { 0x07e6, 0x03b6 }, /*                  Greek_zeta ζ GREEK SMALL LETTER ZETA */
562   { 0x07e7, 0x03b7 }, /*                   Greek_eta η GREEK SMALL LETTER ETA */
563   { 0x07e8, 0x03b8 }, /*                 Greek_theta θ GREEK SMALL LETTER THETA */
564   { 0x07e9, 0x03b9 }, /*                  Greek_iota ι GREEK SMALL LETTER IOTA */
565   { 0x07ea, 0x03ba }, /*                 Greek_kappa κ GREEK SMALL LETTER KAPPA */
566   { 0x07eb, 0x03bb }, /*                Greek_lambda λ GREEK SMALL LETTER LAMDA */
567   { 0x07ec, 0x03bc }, /*                    Greek_mu μ GREEK SMALL LETTER MU */
568   { 0x07ed, 0x03bd }, /*                    Greek_nu ν GREEK SMALL LETTER NU */
569   { 0x07ee, 0x03be }, /*                    Greek_xi ξ GREEK SMALL LETTER XI */
570   { 0x07ef, 0x03bf }, /*               Greek_omicron ο GREEK SMALL LETTER OMICRON */
571   { 0x07f0, 0x03c0 }, /*                    Greek_pi π GREEK SMALL LETTER PI */
572   { 0x07f1, 0x03c1 }, /*                   Greek_rho ρ GREEK SMALL LETTER RHO */
573   { 0x07f2, 0x03c3 }, /*                 Greek_sigma σ GREEK SMALL LETTER SIGMA */
574   { 0x07f3, 0x03c2 }, /*       Greek_finalsmallsigma ς GREEK SMALL LETTER FINAL SIGMA */
575   { 0x07f4, 0x03c4 }, /*                   Greek_tau τ GREEK SMALL LETTER TAU */
576   { 0x07f5, 0x03c5 }, /*               Greek_upsilon υ GREEK SMALL LETTER UPSILON */
577   { 0x07f6, 0x03c6 }, /*                   Greek_phi φ GREEK SMALL LETTER PHI */
578   { 0x07f7, 0x03c7 }, /*                   Greek_chi χ GREEK SMALL LETTER CHI */
579   { 0x07f8, 0x03c8 }, /*                   Greek_psi ψ GREEK SMALL LETTER PSI */
580   { 0x07f9, 0x03c9 }, /*                 Greek_omega ω GREEK SMALL LETTER OMEGA */
581 /*  0x08a1                               leftradical ? ??? */
582 /*  0x08a2                            topleftradical ? ??? */
583 /*  0x08a3                            horizconnector ? ??? */
584   { 0x08a4, 0x2320 }, /*                 topintegral ⌠ TOP HALF INTEGRAL */
585   { 0x08a5, 0x2321 }, /*                 botintegral ⌡ BOTTOM HALF INTEGRAL */
586   { 0x08a6, 0x2502 }, /*               vertconnector │ BOX DRAWINGS LIGHT VERTICAL */
587 /*  0x08a7                          topleftsqbracket ? ??? */
588 /*  0x08a8                          botleftsqbracket ? ??? */
589 /*  0x08a9                         toprightsqbracket ? ??? */
590 /*  0x08aa                         botrightsqbracket ? ??? */
591 /*  0x08ab                             topleftparens ? ??? */
592 /*  0x08ac                             botleftparens ? ??? */
593 /*  0x08ad                            toprightparens ? ??? */
594 /*  0x08ae                            botrightparens ? ??? */
595 /*  0x08af                      leftmiddlecurlybrace ? ??? */
596 /*  0x08b0                     rightmiddlecurlybrace ? ??? */
597 /*  0x08b1                          topleftsummation ? ??? */
598 /*  0x08b2                          botleftsummation ? ??? */
599 /*  0x08b3                 topvertsummationconnector ? ??? */
600 /*  0x08b4                 botvertsummationconnector ? ??? */
601 /*  0x08b5                         toprightsummation ? ??? */
602 /*  0x08b6                         botrightsummation ? ??? */
603 /*  0x08b7                      rightmiddlesummation ? ??? */
604   { 0x08bc, 0x2264 }, /*               lessthanequal ≤ LESS-THAN OR EQUAL TO */
605   { 0x08bd, 0x2260 }, /*                    notequal ≠ NOT EQUAL TO */
606   { 0x08be, 0x2265 }, /*            greaterthanequal ≥ GREATER-THAN OR EQUAL TO */
607   { 0x08bf, 0x222b }, /*                    integral ∫ INTEGRAL */
608   { 0x08c0, 0x2234 }, /*                   therefore ∴ THEREFORE */
609   { 0x08c1, 0x221d }, /*                   variation ∝ PROPORTIONAL TO */
610   { 0x08c2, 0x221e }, /*                    infinity ∞ INFINITY */
611   { 0x08c5, 0x2207 }, /*                       nabla ∇ NABLA */
612   { 0x08c8, 0x2245 }, /*                 approximate ≅ APPROXIMATELY EQUAL TO */
613 /*  0x08c9                              similarequal ? ??? */
614   { 0x08cd, 0x21d4 }, /*                    ifonlyif ⇔ LEFT RIGHT DOUBLE ARROW */
615   { 0x08ce, 0x21d2 }, /*                     implies ⇒ RIGHTWARDS DOUBLE ARROW */
616   { 0x08cf, 0x2261 }, /*                   identical ≡ IDENTICAL TO */
617   { 0x08d6, 0x221a }, /*                     radical √ SQUARE ROOT */
618   { 0x08da, 0x2282 }, /*                  includedin ⊂ SUBSET OF */
619   { 0x08db, 0x2283 }, /*                    includes ⊃ SUPERSET OF */
620   { 0x08dc, 0x2229 }, /*                intersection ∩ INTERSECTION */
621   { 0x08dd, 0x222a }, /*                       union ∪ UNION */
622   { 0x08de, 0x2227 }, /*                  logicaland ∧ LOGICAL AND */
623   { 0x08df, 0x2228 }, /*                   logicalor ∨ LOGICAL OR */
624   { 0x08ef, 0x2202 }, /*           partialderivative ∂ PARTIAL DIFFERENTIAL */
625   { 0x08f6, 0x0192 }, /*                    function ƒ LATIN SMALL LETTER F WITH HOOK */
626   { 0x08fb, 0x2190 }, /*                   leftarrow ← LEFTWARDS ARROW */
627   { 0x08fc, 0x2191 }, /*                     uparrow ↑ UPWARDS ARROW */
628   { 0x08fd, 0x2192 }, /*                  rightarrow → RIGHTWARDS ARROW */
629   { 0x08fe, 0x2193 }, /*                   downarrow ↓ DOWNWARDS ARROW */
630   { 0x09df, 0x2422 }, /*                       blank ␢ BLANK SYMBOL */
631   { 0x09e0, 0x25c6 }, /*                soliddiamond ◆ BLACK DIAMOND */
632   { 0x09e1, 0x2592 }, /*                checkerboard ▒ MEDIUM SHADE */
633   { 0x09e2, 0x2409 }, /*                          ht ␉ SYMBOL FOR HORIZONTAL TABULATION */
634   { 0x09e3, 0x240c }, /*                          ff ␌ SYMBOL FOR FORM FEED */
635   { 0x09e4, 0x240d }, /*                          cr ␍ SYMBOL FOR CARRIAGE RETURN */
636   { 0x09e5, 0x240a }, /*                          lf ␊ SYMBOL FOR LINE FEED */
637   { 0x09e8, 0x2424 }, /*                          nl ␤ SYMBOL FOR NEWLINE */
638   { 0x09e9, 0x240b }, /*                          vt ␋ SYMBOL FOR VERTICAL TABULATION */
639   { 0x09ea, 0x2518 }, /*              lowrightcorner ┘ BOX DRAWINGS LIGHT UP AND LEFT */
640   { 0x09eb, 0x2510 }, /*               uprightcorner ┐ BOX DRAWINGS LIGHT DOWN AND LEFT */
641   { 0x09ec, 0x250c }, /*                upleftcorner ┌ BOX DRAWINGS LIGHT DOWN AND RIGHT */
642   { 0x09ed, 0x2514 }, /*               lowleftcorner └ BOX DRAWINGS LIGHT UP AND RIGHT */
643   { 0x09ee, 0x253c }, /*               crossinglines ┼ BOX DRAWINGS LIGHT VERTICAL AND HORIZONTAL */
644 /*  0x09ef                            horizlinescan1 ? ??? */
645 /*  0x09f0                            horizlinescan3 ? ??? */
646   { 0x09f1, 0x2500 }, /*              horizlinescan5 ─ BOX DRAWINGS LIGHT HORIZONTAL */
647 /*  0x09f2                            horizlinescan7 ? ??? */
648 /*  0x09f3                            horizlinescan9 ? ??? */
649   { 0x09f4, 0x251c }, /*                       leftt ├ BOX DRAWINGS LIGHT VERTICAL AND RIGHT */
650   { 0x09f5, 0x2524 }, /*                      rightt ┤ BOX DRAWINGS LIGHT VERTICAL AND LEFT */
651   { 0x09f6, 0x2534 }, /*                        bott ┴ BOX DRAWINGS LIGHT UP AND HORIZONTAL */
652   { 0x09f7, 0x252c }, /*                        topt ┬ BOX DRAWINGS LIGHT DOWN AND HORIZONTAL */
653   { 0x09f8, 0x2502 }, /*                     vertbar │ BOX DRAWINGS LIGHT VERTICAL */
654   { 0x0aa1, 0x2003 }, /*                     emspace   EM SPACE */
655   { 0x0aa2, 0x2002 }, /*                     enspace   EN SPACE */
656   { 0x0aa3, 0x2004 }, /*                    em3space   THREE-PER-EM SPACE */
657   { 0x0aa4, 0x2005 }, /*                    em4space   FOUR-PER-EM SPACE */
658   { 0x0aa5, 0x2007 }, /*                  digitspace   FIGURE SPACE */
659   { 0x0aa6, 0x2008 }, /*                  punctspace   PUNCTUATION SPACE */
660   { 0x0aa7, 0x2009 }, /*                   thinspace   THIN SPACE */
661   { 0x0aa8, 0x200a }, /*                   hairspace   HAIR SPACE */
662   { 0x0aa9, 0x2014 }, /*                      emdash — EM DASH */
663   { 0x0aaa, 0x2013 }, /*                      endash – EN DASH */
664 /*  0x0aac                               signifblank ? ??? */
665   { 0x0aae, 0x2026 }, /*                    ellipsis … HORIZONTAL ELLIPSIS */
666 /*  0x0aaf                           doubbaselinedot ? ??? */
667   { 0x0ab0, 0x2153 }, /*                    onethird ⅓ VULGAR FRACTION ONE THIRD */
668   { 0x0ab1, 0x2154 }, /*                   twothirds ⅔ VULGAR FRACTION TWO THIRDS */
669   { 0x0ab2, 0x2155 }, /*                    onefifth ⅕ VULGAR FRACTION ONE FIFTH */
670   { 0x0ab3, 0x2156 }, /*                   twofifths ⅖ VULGAR FRACTION TWO FIFTHS */
671   { 0x0ab4, 0x2157 }, /*                 threefifths ⅗ VULGAR FRACTION THREE FIFTHS */
672   { 0x0ab5, 0x2158 }, /*                  fourfifths ⅘ VULGAR FRACTION FOUR FIFTHS */
673   { 0x0ab6, 0x2159 }, /*                    onesixth ⅙ VULGAR FRACTION ONE SIXTH */
674   { 0x0ab7, 0x215a }, /*                  fivesixths ⅚ VULGAR FRACTION FIVE SIXTHS */
675   { 0x0ab8, 0x2105 }, /*                      careof ℅ CARE OF */
676   { 0x0abb, 0x2012 }, /*                     figdash ‒ FIGURE DASH */
677   { 0x0abc, 0x2329 }, /*            leftanglebracket 〈 LEFT-POINTING ANGLE BRACKET */
678   { 0x0abd, 0x002e }, /*                decimalpoint . FULL STOP */
679   { 0x0abe, 0x232a }, /*           rightanglebracket 〉 RIGHT-POINTING ANGLE BRACKET */
680 /*  0x0abf                                    marker ? ??? */
681   { 0x0ac3, 0x215b }, /*                   oneeighth ⅛ VULGAR FRACTION ONE EIGHTH */
682   { 0x0ac4, 0x215c }, /*                threeeighths ⅜ VULGAR FRACTION THREE EIGHTHS */
683   { 0x0ac5, 0x215d }, /*                 fiveeighths ⅝ VULGAR FRACTION FIVE EIGHTHS */
684   { 0x0ac6, 0x215e }, /*                seveneighths ⅞ VULGAR FRACTION SEVEN EIGHTHS */
685   { 0x0ac9, 0x2122 }, /*                   trademark ™ TRADE MARK SIGN */
686   { 0x0aca, 0x2613 }, /*               signaturemark ☓ SALTIRE */
687 /*  0x0acb                         trademarkincircle ? ??? */
688   { 0x0acc, 0x25c1 }, /*            leftopentriangle ◁ WHITE LEFT-POINTING TRIANGLE */
689   { 0x0acd, 0x25b7 }, /*           rightopentriangle ▷ WHITE RIGHT-POINTING TRIANGLE */
690   { 0x0ace, 0x25cb }, /*                emopencircle ○ WHITE CIRCLE */
691   { 0x0acf, 0x25a1 }, /*             emopenrectangle □ WHITE SQUARE */
692   { 0x0ad0, 0x2018 }, /*         leftsinglequotemark ‘ LEFT SINGLE QUOTATION MARK */
693   { 0x0ad1, 0x2019 }, /*        rightsinglequotemark ’ RIGHT SINGLE QUOTATION MARK */
694   { 0x0ad2, 0x201c }, /*         leftdoublequotemark “ LEFT DOUBLE QUOTATION MARK */
695   { 0x0ad3, 0x201d }, /*        rightdoublequotemark ” RIGHT DOUBLE QUOTATION MARK */
696   { 0x0ad4, 0x211e }, /*                prescription ℞ PRESCRIPTION TAKE */
697   { 0x0ad6, 0x2032 }, /*                     minutes ′ PRIME */
698   { 0x0ad7, 0x2033 }, /*                     seconds ″ DOUBLE PRIME */
699   { 0x0ad9, 0x271d }, /*                  latincross ✝ LATIN CROSS */
700 /*  0x0ada                                  hexagram ? ??? */
701   { 0x0adb, 0x25ac }, /*            filledrectbullet ▬ BLACK RECTANGLE */
702   { 0x0adc, 0x25c0 }, /*         filledlefttribullet ◀ BLACK LEFT-POINTING TRIANGLE */
703   { 0x0add, 0x25b6 }, /*        filledrighttribullet ▶ BLACK RIGHT-POINTING TRIANGLE */
704   { 0x0ade, 0x25cf }, /*              emfilledcircle ● BLACK CIRCLE */
705   { 0x0adf, 0x25a0 }, /*                emfilledrect ■ BLACK SQUARE */
706   { 0x0ae0, 0x25e6 }, /*            enopencircbullet ◦ WHITE BULLET */
707   { 0x0ae1, 0x25ab }, /*          enopensquarebullet ▫ WHITE SMALL SQUARE */
708   { 0x0ae2, 0x25ad }, /*              openrectbullet ▭ WHITE RECTANGLE */
709   { 0x0ae3, 0x25b3 }, /*             opentribulletup △ WHITE UP-POINTING TRIANGLE */
710   { 0x0ae4, 0x25bd }, /*           opentribulletdown ▽ WHITE DOWN-POINTING TRIANGLE */
711   { 0x0ae5, 0x2606 }, /*                    openstar ☆ WHITE STAR */
712   { 0x0ae6, 0x2022 }, /*          enfilledcircbullet • BULLET */
713   { 0x0ae7, 0x25aa }, /*            enfilledsqbullet ▪ BLACK SMALL SQUARE */
714   { 0x0ae8, 0x25b2 }, /*           filledtribulletup ▲ BLACK UP-POINTING TRIANGLE */
715   { 0x0ae9, 0x25bc }, /*         filledtribulletdown ▼ BLACK DOWN-POINTING TRIANGLE */
716   { 0x0aea, 0x261c }, /*                 leftpointer ☜ WHITE LEFT POINTING INDEX */
717   { 0x0aeb, 0x261e }, /*                rightpointer ☞ WHITE RIGHT POINTING INDEX */
718   { 0x0aec, 0x2663 }, /*                        club ♣ BLACK CLUB SUIT */
719   { 0x0aed, 0x2666 }, /*                     diamond ♦ BLACK DIAMOND SUIT */
720   { 0x0aee, 0x2665 }, /*                       heart ♥ BLACK HEART SUIT */
721   { 0x0af0, 0x2720 }, /*                maltesecross ✠ MALTESE CROSS */
722   { 0x0af1, 0x2020 }, /*                      dagger † DAGGER */
723   { 0x0af2, 0x2021 }, /*                doubledagger ‡ DOUBLE DAGGER */
724   { 0x0af3, 0x2713 }, /*                   checkmark ✓ CHECK MARK */
725   { 0x0af4, 0x2717 }, /*                 ballotcross ✗ BALLOT X */
726   { 0x0af5, 0x266f }, /*                musicalsharp ♯ MUSIC SHARP SIGN */
727   { 0x0af6, 0x266d }, /*                 musicalflat ♭ MUSIC FLAT SIGN */
728   { 0x0af7, 0x2642 }, /*                  malesymbol ♂ MALE SIGN */
729   { 0x0af8, 0x2640 }, /*                femalesymbol ♀ FEMALE SIGN */
730   { 0x0af9, 0x260e }, /*                   telephone ☎ BLACK TELEPHONE */
731   { 0x0afa, 0x2315 }, /*           telephonerecorder ⌕ TELEPHONE RECORDER */
732   { 0x0afb, 0x2117 }, /*         phonographcopyright ℗ SOUND RECORDING COPYRIGHT */
733   { 0x0afc, 0x2038 }, /*                       caret ‸ CARET */
734   { 0x0afd, 0x201a }, /*          singlelowquotemark ‚ SINGLE LOW-9 QUOTATION MARK */
735   { 0x0afe, 0x201e }, /*          doublelowquotemark „ DOUBLE LOW-9 QUOTATION MARK */
736 /*  0x0aff                                    cursor ? ??? */
737   { 0x0ba3, 0x003c }, /*                   leftcaret < LESS-THAN SIGN */
738   { 0x0ba6, 0x003e }, /*                  rightcaret > GREATER-THAN SIGN */
739   { 0x0ba8, 0x2228 }, /*                   downcaret ∨ LOGICAL OR */
740   { 0x0ba9, 0x2227 }, /*                     upcaret ∧ LOGICAL AND */
741   { 0x0bc0, 0x00af }, /*                     overbar ¯ MACRON */
742   { 0x0bc2, 0x22a4 }, /*                    downtack ⊤ DOWN TACK */
743   { 0x0bc3, 0x2229 }, /*                      upshoe ∩ INTERSECTION */
744   { 0x0bc4, 0x230a }, /*                   downstile ⌊ LEFT FLOOR */
745   { 0x0bc6, 0x005f }, /*                    underbar _ LOW LINE */
746   { 0x0bca, 0x2218 }, /*                         jot ∘ RING OPERATOR */
747   { 0x0bcc, 0x2395 }, /*                        quad ⎕ APL FUNCTIONAL SYMBOL QUAD (Unicode 3.0) */
748   { 0x0bce, 0x22a5 }, /*                      uptack ⊥ UP TACK */
749   { 0x0bcf, 0x25cb }, /*                      circle ○ WHITE CIRCLE */
750   { 0x0bd3, 0x2308 }, /*                     upstile ⌈ LEFT CEILING */
751   { 0x0bd6, 0x222a }, /*                    downshoe ∪ UNION */
752   { 0x0bd8, 0x2283 }, /*                   rightshoe ⊃ SUPERSET OF */
753   { 0x0bda, 0x2282 }, /*                    leftshoe ⊂ SUBSET OF */
754   { 0x0bdc, 0x22a3 }, /*                    lefttack ⊣ LEFT TACK */
755   { 0x0bfc, 0x22a2 }, /*                   righttack ⊢ RIGHT TACK */
756   { 0x0cdf, 0x2017 }, /*        hebrew_doublelowline ‗ DOUBLE LOW LINE */
757   { 0x0ce0, 0x05d0 }, /*                hebrew_aleph א HEBREW LETTER ALEF */
758   { 0x0ce1, 0x05d1 }, /*                  hebrew_bet ב HEBREW LETTER BET */
759   { 0x0ce2, 0x05d2 }, /*                hebrew_gimel ג HEBREW LETTER GIMEL */
760   { 0x0ce3, 0x05d3 }, /*                hebrew_dalet ד HEBREW LETTER DALET */
761   { 0x0ce4, 0x05d4 }, /*                   hebrew_he ה HEBREW LETTER HE */
762   { 0x0ce5, 0x05d5 }, /*                  hebrew_waw ו HEBREW LETTER VAV */
763   { 0x0ce6, 0x05d6 }, /*                 hebrew_zain ז HEBREW LETTER ZAYIN */
764   { 0x0ce7, 0x05d7 }, /*                 hebrew_chet ח HEBREW LETTER HET */
765   { 0x0ce8, 0x05d8 }, /*                  hebrew_tet ט HEBREW LETTER TET */
766   { 0x0ce9, 0x05d9 }, /*                  hebrew_yod י HEBREW LETTER YOD */
767   { 0x0cea, 0x05da }, /*            hebrew_finalkaph ך HEBREW LETTER FINAL KAF */
768   { 0x0ceb, 0x05db }, /*                 hebrew_kaph כ HEBREW LETTER KAF */
769   { 0x0cec, 0x05dc }, /*                hebrew_lamed ל HEBREW LETTER LAMED */
770   { 0x0ced, 0x05dd }, /*             hebrew_finalmem ם HEBREW LETTER FINAL MEM */
771   { 0x0cee, 0x05de }, /*                  hebrew_mem מ HEBREW LETTER MEM */
772   { 0x0cef, 0x05df }, /*             hebrew_finalnun ן HEBREW LETTER FINAL NUN */
773   { 0x0cf0, 0x05e0 }, /*                  hebrew_nun נ HEBREW LETTER NUN */
774   { 0x0cf1, 0x05e1 }, /*               hebrew_samech ס HEBREW LETTER SAMEKH */
775   { 0x0cf2, 0x05e2 }, /*                 hebrew_ayin ע HEBREW LETTER AYIN */
776   { 0x0cf3, 0x05e3 }, /*              hebrew_finalpe ף HEBREW LETTER FINAL PE */
777   { 0x0cf4, 0x05e4 }, /*                   hebrew_pe פ HEBREW LETTER PE */
778   { 0x0cf5, 0x05e5 }, /*            hebrew_finalzade ץ HEBREW LETTER FINAL TSADI */
779   { 0x0cf6, 0x05e6 }, /*                 hebrew_zade צ HEBREW LETTER TSADI */
780   { 0x0cf7, 0x05e7 }, /*                 hebrew_qoph ק HEBREW LETTER QOF */
781   { 0x0cf8, 0x05e8 }, /*                 hebrew_resh ר HEBREW LETTER RESH */
782   { 0x0cf9, 0x05e9 }, /*                 hebrew_shin ש HEBREW LETTER SHIN */
783   { 0x0cfa, 0x05ea }, /*                  hebrew_taw ת HEBREW LETTER TAV */
784   { 0x0da1, 0x0e01 }, /*                  Thai_kokai ก THAI CHARACTER KO KAI */
785   { 0x0da2, 0x0e02 }, /*                Thai_khokhai ข THAI CHARACTER KHO KHAI */
786   { 0x0da3, 0x0e03 }, /*               Thai_khokhuat ฃ THAI CHARACTER KHO KHUAT */
787   { 0x0da4, 0x0e04 }, /*               Thai_khokhwai ค THAI CHARACTER KHO KHWAI */
788   { 0x0da5, 0x0e05 }, /*                Thai_khokhon ฅ THAI CHARACTER KHO KHON */
789   { 0x0da6, 0x0e06 }, /*             Thai_khorakhang ฆ THAI CHARACTER KHO RAKHANG */
790   { 0x0da7, 0x0e07 }, /*                 Thai_ngongu ง THAI CHARACTER NGO NGU */
791   { 0x0da8, 0x0e08 }, /*                Thai_chochan จ THAI CHARACTER CHO CHAN */
792   { 0x0da9, 0x0e09 }, /*               Thai_choching ฉ THAI CHARACTER CHO CHING */
793   { 0x0daa, 0x0e0a }, /*               Thai_chochang ช THAI CHARACTER CHO CHANG */
794   { 0x0dab, 0x0e0b }, /*                   Thai_soso ซ THAI CHARACTER SO SO */
795   { 0x0dac, 0x0e0c }, /*                Thai_chochoe ฌ THAI CHARACTER CHO CHOE */
796   { 0x0dad, 0x0e0d }, /*                 Thai_yoying ญ THAI CHARACTER YO YING */
797   { 0x0dae, 0x0e0e }, /*                Thai_dochada ฎ THAI CHARACTER DO CHADA */
798   { 0x0daf, 0x0e0f }, /*                Thai_topatak ฏ THAI CHARACTER TO PATAK */
799   { 0x0db0, 0x0e10 }, /*                Thai_thothan ฐ THAI CHARACTER THO THAN */
800   { 0x0db1, 0x0e11 }, /*          Thai_thonangmontho ฑ THAI CHARACTER THO NANGMONTHO */
801   { 0x0db2, 0x0e12 }, /*             Thai_thophuthao ฒ THAI CHARACTER THO PHUTHAO */
802   { 0x0db3, 0x0e13 }, /*                  Thai_nonen ณ THAI CHARACTER NO NEN */
803   { 0x0db4, 0x0e14 }, /*                  Thai_dodek ด THAI CHARACTER DO DEK */
804   { 0x0db5, 0x0e15 }, /*                  Thai_totao ต THAI CHARACTER TO TAO */
805   { 0x0db6, 0x0e16 }, /*               Thai_thothung ถ THAI CHARACTER THO THUNG */
806   { 0x0db7, 0x0e17 }, /*              Thai_thothahan ท THAI CHARACTER THO THAHAN */
807   { 0x0db8, 0x0e18 }, /*               Thai_thothong ธ THAI CHARACTER THO THONG */
808   { 0x0db9, 0x0e19 }, /*                   Thai_nonu น THAI CHARACTER NO NU */
809   { 0x0dba, 0x0e1a }, /*               Thai_bobaimai บ THAI CHARACTER BO BAIMAI */
810   { 0x0dbb, 0x0e1b }, /*                  Thai_popla ป THAI CHARACTER PO PLA */
811   { 0x0dbc, 0x0e1c }, /*               Thai_phophung ผ THAI CHARACTER PHO PHUNG */
812   { 0x0dbd, 0x0e1d }, /*                   Thai_fofa ฝ THAI CHARACTER FO FA */
813   { 0x0dbe, 0x0e1e }, /*                Thai_phophan พ THAI CHARACTER PHO PHAN */
814   { 0x0dbf, 0x0e1f }, /*                  Thai_fofan ฟ THAI CHARACTER FO FAN */
815   { 0x0dc0, 0x0e20 }, /*             Thai_phosamphao ภ THAI CHARACTER PHO SAMPHAO */
816   { 0x0dc1, 0x0e21 }, /*                   Thai_moma ม THAI CHARACTER MO MA */
817   { 0x0dc2, 0x0e22 }, /*                  Thai_yoyak ย THAI CHARACTER YO YAK */
818   { 0x0dc3, 0x0e23 }, /*                  Thai_rorua ร THAI CHARACTER RO RUA */
819   { 0x0dc4, 0x0e24 }, /*                     Thai_ru ฤ THAI CHARACTER RU */
820   { 0x0dc5, 0x0e25 }, /*                 Thai_loling ล THAI CHARACTER LO LING */
821   { 0x0dc6, 0x0e26 }, /*                     Thai_lu ฦ THAI CHARACTER LU */
822   { 0x0dc7, 0x0e27 }, /*                 Thai_wowaen ว THAI CHARACTER WO WAEN */
823   { 0x0dc8, 0x0e28 }, /*                 Thai_sosala ศ THAI CHARACTER SO SALA */
824   { 0x0dc9, 0x0e29 }, /*                 Thai_sorusi ษ THAI CHARACTER SO RUSI */
825   { 0x0dca, 0x0e2a }, /*                  Thai_sosua ส THAI CHARACTER SO SUA */
826   { 0x0dcb, 0x0e2b }, /*                  Thai_hohip ห THAI CHARACTER HO HIP */
827   { 0x0dcc, 0x0e2c }, /*                Thai_lochula ฬ THAI CHARACTER LO CHULA */
828   { 0x0dcd, 0x0e2d }, /*                   Thai_oang อ THAI CHARACTER O ANG */
829   { 0x0dce, 0x0e2e }, /*               Thai_honokhuk ฮ THAI CHARACTER HO NOKHUK */
830   { 0x0dcf, 0x0e2f }, /*              Thai_paiyannoi ฯ THAI CHARACTER PAIYANNOI */
831   { 0x0dd0, 0x0e30 }, /*                  Thai_saraa ะ THAI CHARACTER SARA A */
832   { 0x0dd1, 0x0e31 }, /*             Thai_maihanakat ั THAI CHARACTER MAI HAN-AKAT */
833   { 0x0dd2, 0x0e32 }, /*                 Thai_saraaa า THAI CHARACTER SARA AA */
834   { 0x0dd3, 0x0e33 }, /*                 Thai_saraam ำ THAI CHARACTER SARA AM */
835   { 0x0dd4, 0x0e34 }, /*                  Thai_sarai ิ THAI CHARACTER SARA I */
836   { 0x0dd5, 0x0e35 }, /*                 Thai_saraii ี THAI CHARACTER SARA II */
837   { 0x0dd6, 0x0e36 }, /*                 Thai_saraue ึ THAI CHARACTER SARA UE */
838   { 0x0dd7, 0x0e37 }, /*                Thai_sarauee ื THAI CHARACTER SARA UEE */
839   { 0x0dd8, 0x0e38 }, /*                  Thai_sarau ุ THAI CHARACTER SARA U */
840   { 0x0dd9, 0x0e39 }, /*                 Thai_sarauu ู THAI CHARACTER SARA UU */
841   { 0x0dda, 0x0e3a }, /*                Thai_phinthu ฺ THAI CHARACTER PHINTHU */
842   { 0x0dde, 0x0e3e }, /*      Thai_maihanakat_maitho ฾ ??? */
843   { 0x0ddf, 0x0e3f }, /*                   Thai_baht ฿ THAI CURRENCY SYMBOL BAHT */
844   { 0x0de0, 0x0e40 }, /*                  Thai_sarae เ THAI CHARACTER SARA E */
845   { 0x0de1, 0x0e41 }, /*                 Thai_saraae แ THAI CHARACTER SARA AE */
846   { 0x0de2, 0x0e42 }, /*                  Thai_sarao โ THAI CHARACTER SARA O */
847   { 0x0de3, 0x0e43 }, /*          Thai_saraaimaimuan ใ THAI CHARACTER SARA AI MAIMUAN */
848   { 0x0de4, 0x0e44 }, /*         Thai_saraaimaimalai ไ THAI CHARACTER SARA AI MAIMALAI */
849   { 0x0de5, 0x0e45 }, /*            Thai_lakkhangyao ๅ THAI CHARACTER LAKKHANGYAO */
850   { 0x0de6, 0x0e46 }, /*               Thai_maiyamok ๆ THAI CHARACTER MAIYAMOK */
851   { 0x0de7, 0x0e47 }, /*              Thai_maitaikhu ็ THAI CHARACTER MAITAIKHU */
852   { 0x0de8, 0x0e48 }, /*                  Thai_maiek ่ THAI CHARACTER MAI EK */
853   { 0x0de9, 0x0e49 }, /*                 Thai_maitho ้ THAI CHARACTER MAI THO */
854   { 0x0dea, 0x0e4a }, /*                 Thai_maitri ๊ THAI CHARACTER MAI TRI */
855   { 0x0deb, 0x0e4b }, /*            Thai_maichattawa ๋ THAI CHARACTER MAI CHATTAWA */
856   { 0x0dec, 0x0e4c }, /*            Thai_thanthakhat ์ THAI CHARACTER THANTHAKHAT */
857   { 0x0ded, 0x0e4d }, /*               Thai_nikhahit ํ THAI CHARACTER NIKHAHIT */
858   { 0x0df0, 0x0e50 }, /*                 Thai_leksun ๐ THAI DIGIT ZERO */
859   { 0x0df1, 0x0e51 }, /*                Thai_leknung ๑ THAI DIGIT ONE */
860   { 0x0df2, 0x0e52 }, /*                Thai_leksong ๒ THAI DIGIT TWO */
861   { 0x0df3, 0x0e53 }, /*                 Thai_leksam ๓ THAI DIGIT THREE */
862   { 0x0df4, 0x0e54 }, /*                  Thai_leksi ๔ THAI DIGIT FOUR */
863   { 0x0df5, 0x0e55 }, /*                  Thai_lekha ๕ THAI DIGIT FIVE */
864   { 0x0df6, 0x0e56 }, /*                 Thai_lekhok ๖ THAI DIGIT SIX */
865   { 0x0df7, 0x0e57 }, /*                Thai_lekchet ๗ THAI DIGIT SEVEN */
866   { 0x0df8, 0x0e58 }, /*                Thai_lekpaet ๘ THAI DIGIT EIGHT */
867   { 0x0df9, 0x0e59 }, /*                 Thai_lekkao ๙ THAI DIGIT NINE */
868   { 0x0ea1, 0x3131 }, /*               Hangul_Kiyeog ㄱ HANGUL LETTER KIYEOK */
869   { 0x0ea2, 0x3132 }, /*          Hangul_SsangKiyeog ㄲ HANGUL LETTER SSANGKIYEOK */
870   { 0x0ea3, 0x3133 }, /*           Hangul_KiyeogSios ㄳ HANGUL LETTER KIYEOK-SIOS */
871   { 0x0ea4, 0x3134 }, /*                Hangul_Nieun ㄴ HANGUL LETTER NIEUN */
872   { 0x0ea5, 0x3135 }, /*           Hangul_NieunJieuj ㄵ HANGUL LETTER NIEUN-CIEUC */
873   { 0x0ea6, 0x3136 }, /*           Hangul_NieunHieuh ㄶ HANGUL LETTER NIEUN-HIEUH */
874   { 0x0ea7, 0x3137 }, /*               Hangul_Dikeud ㄷ HANGUL LETTER TIKEUT */
875   { 0x0ea8, 0x3138 }, /*          Hangul_SsangDikeud ㄸ HANGUL LETTER SSANGTIKEUT */
876   { 0x0ea9, 0x3139 }, /*                Hangul_Rieul ㄹ HANGUL LETTER RIEUL */
877   { 0x0eaa, 0x313a }, /*          Hangul_RieulKiyeog ㄺ HANGUL LETTER RIEUL-KIYEOK */
878   { 0x0eab, 0x313b }, /*           Hangul_RieulMieum ㄻ HANGUL LETTER RIEUL-MIEUM */
879   { 0x0eac, 0x313c }, /*           Hangul_RieulPieub ㄼ HANGUL LETTER RIEUL-PIEUP */
880   { 0x0ead, 0x313d }, /*            Hangul_RieulSios ㄽ HANGUL LETTER RIEUL-SIOS */
881   { 0x0eae, 0x313e }, /*           Hangul_RieulTieut ㄾ HANGUL LETTER RIEUL-THIEUTH */
882   { 0x0eaf, 0x313f }, /*          Hangul_RieulPhieuf ㄿ HANGUL LETTER RIEUL-PHIEUPH */
883   { 0x0eb0, 0x3140 }, /*           Hangul_RieulHieuh ㅀ HANGUL LETTER RIEUL-HIEUH */
884   { 0x0eb1, 0x3141 }, /*                Hangul_Mieum ㅁ HANGUL LETTER MIEUM */
885   { 0x0eb2, 0x3142 }, /*                Hangul_Pieub ㅂ HANGUL LETTER PIEUP */
886   { 0x0eb3, 0x3143 }, /*           Hangul_SsangPieub ㅃ HANGUL LETTER SSANGPIEUP */
887   { 0x0eb4, 0x3144 }, /*            Hangul_PieubSios ㅄ HANGUL LETTER PIEUP-SIOS */
888   { 0x0eb5, 0x3145 }, /*                 Hangul_Sios ㅅ HANGUL LETTER SIOS */
889   { 0x0eb6, 0x3146 }, /*            Hangul_SsangSios ㅆ HANGUL LETTER SSANGSIOS */
890   { 0x0eb7, 0x3147 }, /*                Hangul_Ieung ㅇ HANGUL LETTER IEUNG */
891   { 0x0eb8, 0x3148 }, /*                Hangul_Jieuj ㅈ HANGUL LETTER CIEUC */
892   { 0x0eb9, 0x3149 }, /*           Hangul_SsangJieuj ㅉ HANGUL LETTER SSANGCIEUC */
893   { 0x0eba, 0x314a }, /*                Hangul_Cieuc ㅊ HANGUL LETTER CHIEUCH */
894   { 0x0ebb, 0x314b }, /*               Hangul_Khieuq ㅋ HANGUL LETTER KHIEUKH */
895   { 0x0ebc, 0x314c }, /*                Hangul_Tieut ㅌ HANGUL LETTER THIEUTH */
896   { 0x0ebd, 0x314d }, /*               Hangul_Phieuf ㅍ HANGUL LETTER PHIEUPH */
897   { 0x0ebe, 0x314e }, /*                Hangul_Hieuh ㅎ HANGUL LETTER HIEUH */
898   { 0x0ebf, 0x314f }, /*                    Hangul_A ㅏ HANGUL LETTER A */
899   { 0x0ec0, 0x3150 }, /*                   Hangul_AE ㅐ HANGUL LETTER AE */
900   { 0x0ec1, 0x3151 }, /*                   Hangul_YA ㅑ HANGUL LETTER YA */
901   { 0x0ec2, 0x3152 }, /*                  Hangul_YAE ㅒ HANGUL LETTER YAE */
902   { 0x0ec3, 0x3153 }, /*                   Hangul_EO ㅓ HANGUL LETTER EO */
903   { 0x0ec4, 0x3154 }, /*                    Hangul_E ㅔ HANGUL LETTER E */
904   { 0x0ec5, 0x3155 }, /*                  Hangul_YEO ㅕ HANGUL LETTER YEO */
905   { 0x0ec6, 0x3156 }, /*                   Hangul_YE ㅖ HANGUL LETTER YE */
906   { 0x0ec7, 0x3157 }, /*                    Hangul_O ㅗ HANGUL LETTER O */
907   { 0x0ec8, 0x3158 }, /*                   Hangul_WA ㅘ HANGUL LETTER WA */
908   { 0x0ec9, 0x3159 }, /*                  Hangul_WAE ㅙ HANGUL LETTER WAE */
909   { 0x0eca, 0x315a }, /*                   Hangul_OE ㅚ HANGUL LETTER OE */
910   { 0x0ecb, 0x315b }, /*                   Hangul_YO ㅛ HANGUL LETTER YO */
911   { 0x0ecc, 0x315c }, /*                    Hangul_U ㅜ HANGUL LETTER U */
912   { 0x0ecd, 0x315d }, /*                  Hangul_WEO ㅝ HANGUL LETTER WEO */
913   { 0x0ece, 0x315e }, /*                   Hangul_WE ㅞ HANGUL LETTER WE */
914   { 0x0ecf, 0x315f }, /*                   Hangul_WI ㅟ HANGUL LETTER WI */
915   { 0x0ed0, 0x3160 }, /*                   Hangul_YU ㅠ HANGUL LETTER YU */
916   { 0x0ed1, 0x3161 }, /*                   Hangul_EU ㅡ HANGUL LETTER EU */
917   { 0x0ed2, 0x3162 }, /*                   Hangul_YI ㅢ HANGUL LETTER YI */
918   { 0x0ed3, 0x3163 }, /*                    Hangul_I ㅣ HANGUL LETTER I */
919   { 0x0ed4, 0x11a8 }, /*             Hangul_J_Kiyeog ᆨ HANGUL JONGSEONG KIYEOK */
920   { 0x0ed5, 0x11a9 }, /*        Hangul_J_SsangKiyeog ᆩ HANGUL JONGSEONG SSANGKIYEOK */
921   { 0x0ed6, 0x11aa }, /*         Hangul_J_KiyeogSios ᆪ HANGUL JONGSEONG KIYEOK-SIOS */
922   { 0x0ed7, 0x11ab }, /*              Hangul_J_Nieun ᆫ HANGUL JONGSEONG NIEUN */
923   { 0x0ed8, 0x11ac }, /*         Hangul_J_NieunJieuj ᆬ HANGUL JONGSEONG NIEUN-CIEUC */
924   { 0x0ed9, 0x11ad }, /*         Hangul_J_NieunHieuh ᆭ HANGUL JONGSEONG NIEUN-HIEUH */
925   { 0x0eda, 0x11ae }, /*             Hangul_J_Dikeud ᆮ HANGUL JONGSEONG TIKEUT */
926   { 0x0edb, 0x11af }, /*              Hangul_J_Rieul ᆯ HANGUL JONGSEONG RIEUL */
927   { 0x0edc, 0x11b0 }, /*        Hangul_J_RieulKiyeog ᆰ HANGUL JONGSEONG RIEUL-KIYEOK */
928   { 0x0edd, 0x11b1 }, /*         Hangul_J_RieulMieum ᆱ HANGUL JONGSEONG RIEUL-MIEUM */
929   { 0x0ede, 0x11b2 }, /*         Hangul_J_RieulPieub ᆲ HANGUL JONGSEONG RIEUL-PIEUP */
930   { 0x0edf, 0x11b3 }, /*          Hangul_J_RieulSios ᆳ HANGUL JONGSEONG RIEUL-SIOS */
931   { 0x0ee0, 0x11b4 }, /*         Hangul_J_RieulTieut ᆴ HANGUL JONGSEONG RIEUL-THIEUTH */
932   { 0x0ee1, 0x11b5 }, /*        Hangul_J_RieulPhieuf ᆵ HANGUL JONGSEONG RIEUL-PHIEUPH */
933   { 0x0ee2, 0x11b6 }, /*         Hangul_J_RieulHieuh ᆶ HANGUL JONGSEONG RIEUL-HIEUH */
934   { 0x0ee3, 0x11b7 }, /*              Hangul_J_Mieum ᆷ HANGUL JONGSEONG MIEUM */
935   { 0x0ee4, 0x11b8 }, /*              Hangul_J_Pieub ᆸ HANGUL JONGSEONG PIEUP */
936   { 0x0ee5, 0x11b9 }, /*          Hangul_J_PieubSios ᆹ HANGUL JONGSEONG PIEUP-SIOS */
937   { 0x0ee6, 0x11ba }, /*               Hangul_J_Sios ᆺ HANGUL JONGSEONG SIOS */
938   { 0x0ee7, 0x11bb }, /*          Hangul_J_SsangSios ᆻ HANGUL JONGSEONG SSANGSIOS */
939   { 0x0ee8, 0x11bc }, /*              Hangul_J_Ieung ᆼ HANGUL JONGSEONG IEUNG */
940   { 0x0ee9, 0x11bd }, /*              Hangul_J_Jieuj ᆽ HANGUL JONGSEONG CIEUC */
941   { 0x0eea, 0x11be }, /*              Hangul_J_Cieuc ᆾ HANGUL JONGSEONG CHIEUCH */
942   { 0x0eeb, 0x11bf }, /*             Hangul_J_Khieuq ᆿ HANGUL JONGSEONG KHIEUKH */
943   { 0x0eec, 0x11c0 }, /*              Hangul_J_Tieut ᇀ HANGUL JONGSEONG THIEUTH */
944   { 0x0eed, 0x11c1 }, /*             Hangul_J_Phieuf ᇁ HANGUL JONGSEONG PHIEUPH */
945   { 0x0eee, 0x11c2 }, /*              Hangul_J_Hieuh ᇂ HANGUL JONGSEONG HIEUH */
946   { 0x0eef, 0x316d }, /*     Hangul_RieulYeorinHieuh ㅭ HANGUL LETTER RIEUL-YEORINHIEUH */
947   { 0x0ef0, 0x3171 }, /*    Hangul_SunkyeongeumMieum ㅱ HANGUL LETTER KAPYEOUNMIEUM */
948   { 0x0ef1, 0x3178 }, /*    Hangul_SunkyeongeumPieub ㅸ HANGUL LETTER KAPYEOUNPIEUP */
949   { 0x0ef2, 0x317f }, /*              Hangul_PanSios ㅿ HANGUL LETTER PANSIOS */
950 /*  0x0ef3                  Hangul_KkogjiDalrinIeung ? ??? */
951   { 0x0ef4, 0x3184 }, /*   Hangul_SunkyeongeumPhieuf ㆄ HANGUL LETTER KAPYEOUNPHIEUPH */
952   { 0x0ef5, 0x3186 }, /*          Hangul_YeorinHieuh ㆆ HANGUL LETTER YEORINHIEUH */
953   { 0x0ef6, 0x318d }, /*                Hangul_AraeA ㆍ HANGUL LETTER ARAEA */
954   { 0x0ef7, 0x318e }, /*               Hangul_AraeAE ㆎ HANGUL LETTER ARAEAE */
955   { 0x0ef8, 0x11eb }, /*            Hangul_J_PanSios ᇫ HANGUL JONGSEONG PANSIOS */
956 /*  0x0ef9                Hangul_J_KkogjiDalrinIeung ? ??? */
957   { 0x0efa, 0x11f9 }, /*        Hangul_J_YeorinHieuh ᇹ HANGUL JONGSEONG YEORINHIEUH */
958   { 0x0eff, 0x20a9 }, /*                  Korean_Won ₩ WON SIGN */
959   { 0x13bc, 0x0152 }, /*                          OE Œ LATIN CAPITAL LIGATURE OE */
960   { 0x13bd, 0x0153 }, /*                          oe œ LATIN SMALL LIGATURE OE */
961   { 0x13be, 0x0178 }, /*                  Ydiaeresis Ÿ LATIN CAPITAL LETTER Y WITH DIAERESIS */
962   { 0x20a0, 0x20a0 }, /*                     EcuSign ₠ EURO-CURRENCY SIGN */
963   { 0x20a1, 0x20a1 }, /*                   ColonSign ₡ COLON SIGN */
964   { 0x20a2, 0x20a2 }, /*                CruzeiroSign ₢ CRUZEIRO SIGN */
965   { 0x20a3, 0x20a3 }, /*                  FFrancSign ₣ FRENCH FRANC SIGN */
966   { 0x20a4, 0x20a4 }, /*                    LiraSign ₤ LIRA SIGN */
967   { 0x20a5, 0x20a5 }, /*                    MillSign ₥ MILL SIGN */
968   { 0x20a6, 0x20a6 }, /*                   NairaSign ₦ NAIRA SIGN */
969   { 0x20a7, 0x20a7 }, /*                  PesetaSign ₧ PESETA SIGN */
970   { 0x20a8, 0x20a8 }, /*                   RupeeSign ₨ RUPEE SIGN */
971   { 0x20a9, 0x20a9 }, /*                     WonSign ₩ WON SIGN */
972   { 0x20aa, 0x20aa }, /*               NewSheqelSign ₪ NEW SHEQEL SIGN */
973   { 0x20ab, 0x20ab }, /*                    DongSign ₫ DONG SIGN */
974   { 0x20ac, 0x20ac }, /*                    EuroSign € EURO SIGN */
975
976
977   /* Following items added to GTK, not in the xterm table */
978
979   /* Numeric keypad */
980   
981   { 0xFF80 /* Space */, ' ' },
982   { 0xFFAA /* Multiply */, '*' },
983   { 0xFFAB /* Add */, '+' },
984   { 0xFFAC /* Separator */, ',' },
985   { 0xFFAD /* Subtract */, '-' },
986   { 0xFFAE /* Decimal */, '.' },
987   { 0xFFAF /* Divide */, '/' },
988   { 0xFFB0 /* 0 */, '0' },
989   { 0xFFB1 /* 1 */, '1' },
990   { 0xFFB2 /* 2 */, '2' },
991   { 0xFFB3 /* 3 */, '3' },
992   { 0xFFB4 /* 4 */, '4' },
993   { 0xFFB5 /* 5 */, '5' },
994   { 0xFFB6 /* 6 */, '6' },
995   { 0xFFB7 /* 7 */, '7' },
996   { 0xFFB8 /* 8 */, '8' },
997   { 0xFFB9 /* 9 */, '9' },
998   { 0xFFBD /* Equal */, '=' },  
999
1000   /* End numeric keypad */
1001 };
1002
1003 /**
1004  * keyval_to_unicode:
1005  * @keyval: a Xlib key symbol 
1006  * 
1007  * Convert from a key symbol to the corresponding ISO10646 (Unicode)
1008  * character.
1009  * 
1010  * Return value: the corresponding unicode character, or 0 if there
1011  *               is no corresponding character.
1012  **/
1013 Uint32
1014 keysym_to_unicode (KeySym keyval)
1015 {
1016   int min = 0;
1017   int max = countof(keysym_to_unicode_tab) - 1;
1018   int mid;
1019
1020   /* First check for Latin-1 characters (1:1 mapping) */
1021   if ((keyval >= 0x0020 && keyval <= 0x007e) ||
1022       (keyval >= 0x00a0 && keyval <= 0x00ff))
1023     return keyval;
1024
1025   /* Also check for directly encoded 24-bit UCS characters:
1026    */
1027   if ((keyval & 0xff000000) == 0x01000000)
1028     return keyval & 0x00ffffff;
1029
1030   /* binary search in table */
1031   while (max >= min) {
1032     mid = (min + max) / 2;
1033     if (keysym_to_unicode_tab[mid].keysym < keyval)
1034       min = mid + 1;
1035     else if (keysym_to_unicode_tab[mid].keysym > keyval)
1036       max = mid - 1;
1037     else {
1038       /* found it */
1039       return keysym_to_unicode_tab[mid].ucs;
1040     }
1041   }
1042   
1043   /* No matching Unicode value found */
1044   return 0;
1045 }
1046
1047 static const struct {
1048   unsigned short keysym;
1049   unsigned short ucs;
1050 } unicode_to_keysym_tab[] = {
1051   { 0x0abd, 0x002e }, /*                decimalpoint . FULL STOP */
1052   { 0x0ba3, 0x003c }, /*                   leftcaret < LESS-THAN SIGN */
1053   { 0x0ba6, 0x003e }, /*                  rightcaret > GREATER-THAN SIGN */
1054   { 0x0bc6, 0x005f }, /*                    underbar _ LOW LINE */
1055   { 0x0bc0, 0x00af }, /*                     overbar ¯ MACRON */
1056   { 0x03c0, 0x0100 }, /*                     Amacron Ā LATIN CAPITAL LETTER A WITH MACRON */
1057   { 0x03e0, 0x0101 }, /*                     amacron ā LATIN SMALL LETTER A WITH MACRON */
1058   { 0x01c3, 0x0102 }, /*                      Abreve Ă LATIN CAPITAL LETTER A WITH BREVE */
1059   { 0x01e3, 0x0103 }, /*                      abreve ă LATIN SMALL LETTER A WITH BREVE */
1060   { 0x01a1, 0x0104 }, /*                     Aogonek Ą LATIN CAPITAL LETTER A WITH OGONEK */
1061   { 0x01b1, 0x0105 }, /*                     aogonek ą LATIN SMALL LETTER A WITH OGONEK */
1062   { 0x01c6, 0x0106 }, /*                      Cacute Ć LATIN CAPITAL LETTER C WITH ACUTE */
1063   { 0x01e6, 0x0107 }, /*                      cacute ć LATIN SMALL LETTER C WITH ACUTE */
1064   { 0x02c6, 0x0108 }, /*                 Ccircumflex Ĉ LATIN CAPITAL LETTER C WITH CIRCUMFLEX */
1065   { 0x02e6, 0x0109 }, /*                 ccircumflex ĉ LATIN SMALL LETTER C WITH CIRCUMFLEX */
1066   { 0x02c5, 0x010a }, /*                   Cabovedot Ċ LATIN CAPITAL LETTER C WITH DOT ABOVE */
1067   { 0x02e5, 0x010b }, /*                   cabovedot ċ LATIN SMALL LETTER C WITH DOT ABOVE */
1068   { 0x01c8, 0x010c }, /*                      Ccaron Č LATIN CAPITAL LETTER C WITH CARON */
1069   { 0x01e8, 0x010d }, /*                      ccaron č LATIN SMALL LETTER C WITH CARON */
1070   { 0x01cf, 0x010e }, /*                      Dcaron Ď LATIN CAPITAL LETTER D WITH CARON */
1071   { 0x01ef, 0x010f }, /*                      dcaron ď LATIN SMALL LETTER D WITH CARON */
1072   { 0x01d0, 0x0110 }, /*                     Dstroke Đ LATIN CAPITAL LETTER D WITH STROKE */
1073   { 0x01f0, 0x0111 }, /*                     dstroke đ LATIN SMALL LETTER D WITH STROKE */
1074   { 0x03aa, 0x0112 }, /*                     Emacron Ē LATIN CAPITAL LETTER E WITH MACRON */
1075   { 0x03ba, 0x0113 }, /*                     emacron ē LATIN SMALL LETTER E WITH MACRON */
1076   { 0x03cc, 0x0116 }, /*                   Eabovedot Ė LATIN CAPITAL LETTER E WITH DOT ABOVE */
1077   { 0x03ec, 0x0117 }, /*                   eabovedot ė LATIN SMALL LETTER E WITH DOT ABOVE */
1078   { 0x01ca, 0x0118 }, /*                     Eogonek Ę LATIN CAPITAL LETTER E WITH OGONEK */
1079   { 0x01ea, 0x0119 }, /*                     eogonek ę LATIN SMALL LETTER E WITH OGONEK */
1080   { 0x01cc, 0x011a }, /*                      Ecaron Ě LATIN CAPITAL LETTER E WITH CARON */
1081   { 0x01ec, 0x011b }, /*                      ecaron ě LATIN SMALL LETTER E WITH CARON */
1082   { 0x02d8, 0x011c }, /*                 Gcircumflex Ĝ LATIN CAPITAL LETTER G WITH CIRCUMFLEX */
1083   { 0x02f8, 0x011d }, /*                 gcircumflex ĝ LATIN SMALL LETTER G WITH CIRCUMFLEX */
1084   { 0x02ab, 0x011e }, /*                      Gbreve Ğ LATIN CAPITAL LETTER G WITH BREVE */
1085   { 0x02bb, 0x011f }, /*                      gbreve ğ LATIN SMALL LETTER G WITH BREVE */
1086   { 0x02d5, 0x0120 }, /*                   Gabovedot Ġ LATIN CAPITAL LETTER G WITH DOT ABOVE */
1087   { 0x02f5, 0x0121 }, /*                   gabovedot ġ LATIN SMALL LETTER G WITH DOT ABOVE */
1088   { 0x03ab, 0x0122 }, /*                    Gcedilla Ģ LATIN CAPITAL LETTER G WITH CEDILLA */
1089   { 0x03bb, 0x0123 }, /*                    gcedilla ģ LATIN SMALL LETTER G WITH CEDILLA */
1090   { 0x02a6, 0x0124 }, /*                 Hcircumflex Ĥ LATIN CAPITAL LETTER H WITH CIRCUMFLEX */
1091   { 0x02b6, 0x0125 }, /*                 hcircumflex ĥ LATIN SMALL LETTER H WITH CIRCUMFLEX */
1092   { 0x02a1, 0x0126 }, /*                     Hstroke Ħ LATIN CAPITAL LETTER H WITH STROKE */
1093   { 0x02b1, 0x0127 }, /*                     hstroke ħ LATIN SMALL LETTER H WITH STROKE */
1094   { 0x03a5, 0x0128 }, /*                      Itilde Ĩ LATIN CAPITAL LETTER I WITH TILDE */
1095   { 0x03b5, 0x0129 }, /*                      itilde ĩ LATIN SMALL LETTER I WITH TILDE */
1096   { 0x03cf, 0x012a }, /*                     Imacron Ī LATIN CAPITAL LETTER I WITH MACRON */
1097   { 0x03ef, 0x012b }, /*                     imacron ī LATIN SMALL LETTER I WITH MACRON */
1098   { 0x03c7, 0x012e }, /*                     Iogonek Į LATIN CAPITAL LETTER I WITH OGONEK */
1099   { 0x03e7, 0x012f }, /*                     iogonek į LATIN SMALL LETTER I WITH OGONEK */
1100   { 0x02a9, 0x0130 }, /*                   Iabovedot İ LATIN CAPITAL LETTER I WITH DOT ABOVE */
1101   { 0x02b9, 0x0131 }, /*                    idotless ı LATIN SMALL LETTER DOTLESS I */
1102   { 0x02ac, 0x0134 }, /*                 Jcircumflex Ĵ LATIN CAPITAL LETTER J WITH CIRCUMFLEX */
1103   { 0x02bc, 0x0135 }, /*                 jcircumflex ĵ LATIN SMALL LETTER J WITH CIRCUMFLEX */
1104   { 0x03d3, 0x0136 }, /*                    Kcedilla Ķ LATIN CAPITAL LETTER K WITH CEDILLA */
1105   { 0x03f3, 0x0137 }, /*                    kcedilla ķ LATIN SMALL LETTER K WITH CEDILLA */
1106   { 0x03a2, 0x0138 }, /*                         kra ĸ LATIN SMALL LETTER KRA */
1107   { 0x01c5, 0x0139 }, /*                      Lacute Ĺ LATIN CAPITAL LETTER L WITH ACUTE */
1108   { 0x01e5, 0x013a }, /*                      lacute ĺ LATIN SMALL LETTER L WITH ACUTE */
1109   { 0x03a6, 0x013b }, /*                    Lcedilla Ļ LATIN CAPITAL LETTER L WITH CEDILLA */
1110   { 0x03b6, 0x013c }, /*                    lcedilla ļ LATIN SMALL LETTER L WITH CEDILLA */
1111   { 0x01a5, 0x013d }, /*                      Lcaron Ľ LATIN CAPITAL LETTER L WITH CARON */
1112   { 0x01b5, 0x013e }, /*                      lcaron ľ LATIN SMALL LETTER L WITH CARON */
1113   { 0x01a3, 0x0141 }, /*                     Lstroke Ł LATIN CAPITAL LETTER L WITH STROKE */
1114   { 0x01b3, 0x0142 }, /*                     lstroke ł LATIN SMALL LETTER L WITH STROKE */
1115   { 0x01d1, 0x0143 }, /*                      Nacute Ń LATIN CAPITAL LETTER N WITH ACUTE */
1116   { 0x01f1, 0x0144 }, /*                      nacute ń LATIN SMALL LETTER N WITH ACUTE */
1117   { 0x03d1, 0x0145 }, /*                    Ncedilla Ņ LATIN CAPITAL LETTER N WITH CEDILLA */
1118   { 0x03f1, 0x0146 }, /*                    ncedilla ņ LATIN SMALL LETTER N WITH CEDILLA */
1119   { 0x01d2, 0x0147 }, /*                      Ncaron Ň LATIN CAPITAL LETTER N WITH CARON */
1120   { 0x01f2, 0x0148 }, /*                      ncaron ň LATIN SMALL LETTER N WITH CARON */
1121   { 0x03bd, 0x014a }, /*                         ENG Ŋ LATIN CAPITAL LETTER ENG */
1122   { 0x03bf, 0x014b }, /*                         eng ŋ LATIN SMALL LETTER ENG */
1123   { 0x03d2, 0x014c }, /*                     Omacron Ō LATIN CAPITAL LETTER O WITH MACRON */
1124   { 0x03f2, 0x014d }, /*                     omacron ō LATIN SMALL LETTER O WITH MACRON */
1125   { 0x01d5, 0x0150 }, /*                Odoubleacute Ő LATIN CAPITAL LETTER O WITH DOUBLE ACUTE */
1126   { 0x01f5, 0x0151 }, /*                odoubleacute ő LATIN SMALL LETTER O WITH DOUBLE ACUTE */
1127   { 0x13bc, 0x0152 }, /*                          OE Œ LATIN CAPITAL LIGATURE OE */
1128   { 0x13bd, 0x0153 }, /*                          oe œ LATIN SMALL LIGATURE OE */
1129   { 0x01c0, 0x0154 }, /*                      Racute Ŕ LATIN CAPITAL LETTER R WITH ACUTE */
1130   { 0x01e0, 0x0155 }, /*                      racute ŕ LATIN SMALL LETTER R WITH ACUTE */
1131   { 0x03a3, 0x0156 }, /*                    Rcedilla Ŗ LATIN CAPITAL LETTER R WITH CEDILLA */
1132   { 0x03b3, 0x0157 }, /*                    rcedilla ŗ LATIN SMALL LETTER R WITH CEDILLA */
1133   { 0x01d8, 0x0158 }, /*                      Rcaron Ř LATIN CAPITAL LETTER R WITH CARON */
1134   { 0x01f8, 0x0159 }, /*                      rcaron ř LATIN SMALL LETTER R WITH CARON */
1135   { 0x01a6, 0x015a }, /*                      Sacute Ś LATIN CAPITAL LETTER S WITH ACUTE */
1136   { 0x01b6, 0x015b }, /*                      sacute ś LATIN SMALL LETTER S WITH ACUTE */
1137   { 0x02de, 0x015c }, /*                 Scircumflex Ŝ LATIN CAPITAL LETTER S WITH CIRCUMFLEX */
1138   { 0x02fe, 0x015d }, /*                 scircumflex ŝ LATIN SMALL LETTER S WITH CIRCUMFLEX */
1139   { 0x01aa, 0x015e }, /*                    Scedilla Ş LATIN CAPITAL LETTER S WITH CEDILLA */
1140   { 0x01ba, 0x015f }, /*                    scedilla ş LATIN SMALL LETTER S WITH CEDILLA */
1141   { 0x01a9, 0x0160 }, /*                      Scaron Š LATIN CAPITAL LETTER S WITH CARON */
1142   { 0x01b9, 0x0161 }, /*                      scaron š LATIN SMALL LETTER S WITH CARON */
1143   { 0x01de, 0x0162 }, /*                    Tcedilla Ţ LATIN CAPITAL LETTER T WITH CEDILLA */
1144   { 0x01fe, 0x0163 }, /*                    tcedilla ţ LATIN SMALL LETTER T WITH CEDILLA */
1145   { 0x01ab, 0x0164 }, /*                      Tcaron Ť LATIN CAPITAL LETTER T WITH CARON */
1146   { 0x01bb, 0x0165 }, /*                      tcaron ť LATIN SMALL LETTER T WITH CARON */
1147   { 0x03ac, 0x0166 }, /*                      Tslash Ŧ LATIN CAPITAL LETTER T WITH STROKE */
1148   { 0x03bc, 0x0167 }, /*                      tslash ŧ LATIN SMALL LETTER T WITH STROKE */
1149   { 0x03dd, 0x0168 }, /*                      Utilde Ũ LATIN CAPITAL LETTER U WITH TILDE */
1150   { 0x03fd, 0x0169 }, /*                      utilde ũ LATIN SMALL LETTER U WITH TILDE */
1151   { 0x03de, 0x016a }, /*                     Umacron Ū LATIN CAPITAL LETTER U WITH MACRON */
1152   { 0x03fe, 0x016b }, /*                     umacron ū LATIN SMALL LETTER U WITH MACRON */
1153   { 0x02dd, 0x016c }, /*                      Ubreve Ŭ LATIN CAPITAL LETTER U WITH BREVE */
1154   { 0x02fd, 0x016d }, /*                      ubreve ŭ LATIN SMALL LETTER U WITH BREVE */
1155   { 0x01d9, 0x016e }, /*                       Uring Ů LATIN CAPITAL LETTER U WITH RING ABOVE */
1156   { 0x01f9, 0x016f }, /*                       uring ů LATIN SMALL LETTER U WITH RING ABOVE */
1157   { 0x01db, 0x0170 }, /*                Udoubleacute Ű LATIN CAPITAL LETTER U WITH DOUBLE ACUTE */
1158   { 0x01fb, 0x0171 }, /*                udoubleacute ű LATIN SMALL LETTER U WITH DOUBLE ACUTE */
1159   { 0x03d9, 0x0172 }, /*                     Uogonek Ų LATIN CAPITAL LETTER U WITH OGONEK */
1160   { 0x03f9, 0x0173 }, /*                     uogonek ų LATIN SMALL LETTER U WITH OGONEK */
1161   { 0x13be, 0x0178 }, /*                  Ydiaeresis Ÿ LATIN CAPITAL LETTER Y WITH DIAERESIS */
1162   { 0x01ac, 0x0179 }, /*                      Zacute Ź LATIN CAPITAL LETTER Z WITH ACUTE */
1163   { 0x01bc, 0x017a }, /*                      zacute ź LATIN SMALL LETTER Z WITH ACUTE */
1164   { 0x01af, 0x017b }, /*                   Zabovedot Ż LATIN CAPITAL LETTER Z WITH DOT ABOVE */
1165   { 0x01bf, 0x017c }, /*                   zabovedot ż LATIN SMALL LETTER Z WITH DOT ABOVE */
1166   { 0x01ae, 0x017d }, /*                      Zcaron Ž LATIN CAPITAL LETTER Z WITH CARON */
1167   { 0x01be, 0x017e }, /*                      zcaron ž LATIN SMALL LETTER Z WITH CARON */
1168   { 0x08f6, 0x0192 }, /*                    function ƒ LATIN SMALL LETTER F WITH HOOK */
1169   { 0x01b7, 0x02c7 }, /*                       caron ˇ CARON */
1170   { 0x01a2, 0x02d8 }, /*                       breve ˘ BREVE */
1171   { 0x01ff, 0x02d9 }, /*                    abovedot ˙ DOT ABOVE */
1172   { 0x01b2, 0x02db }, /*                      ogonek ˛ OGONEK */
1173   { 0x01bd, 0x02dd }, /*                 doubleacute ˝ DOUBLE ACUTE ACCENT */
1174   { 0x07ae, 0x0385 }, /*        Greek_accentdieresis ΅ GREEK DIALYTIKA TONOS */
1175   { 0x07a1, 0x0386 }, /*           Greek_ALPHAaccent Ά GREEK CAPITAL LETTER ALPHA WITH TONOS */
1176   { 0x07a2, 0x0388 }, /*         Greek_EPSILONaccent Έ GREEK CAPITAL LETTER EPSILON WITH TONOS */
1177   { 0x07a3, 0x0389 }, /*             Greek_ETAaccent Ή GREEK CAPITAL LETTER ETA WITH TONOS */
1178   { 0x07a4, 0x038a }, /*            Greek_IOTAaccent Ί GREEK CAPITAL LETTER IOTA WITH TONOS */
1179   { 0x07a7, 0x038c }, /*         Greek_OMICRONaccent Ό GREEK CAPITAL LETTER OMICRON WITH TONOS */
1180   { 0x07a8, 0x038e }, /*         Greek_UPSILONaccent Ύ GREEK CAPITAL LETTER UPSILON WITH TONOS */
1181   { 0x07ab, 0x038f }, /*           Greek_OMEGAaccent Ώ GREEK CAPITAL LETTER OMEGA WITH TONOS */
1182   { 0x07b6, 0x0390 }, /*    Greek_iotaaccentdieresis ΐ GREEK SMALL LETTER IOTA WITH DIALYTIKA AND TONOS */
1183   { 0x07c1, 0x0391 }, /*                 Greek_ALPHA Α GREEK CAPITAL LETTER ALPHA */
1184   { 0x07c2, 0x0392 }, /*                  Greek_BETA Β GREEK CAPITAL LETTER BETA */
1185   { 0x07c3, 0x0393 }, /*                 Greek_GAMMA Γ GREEK CAPITAL LETTER GAMMA */
1186   { 0x07c4, 0x0394 }, /*                 Greek_DELTA Δ GREEK CAPITAL LETTER DELTA */
1187   { 0x07c5, 0x0395 }, /*               Greek_EPSILON Ε GREEK CAPITAL LETTER EPSILON */
1188   { 0x07c6, 0x0396 }, /*                  Greek_ZETA Ζ GREEK CAPITAL LETTER ZETA */
1189   { 0x07c7, 0x0397 }, /*                   Greek_ETA Η GREEK CAPITAL LETTER ETA */
1190   { 0x07c8, 0x0398 }, /*                 Greek_THETA Θ GREEK CAPITAL LETTER THETA */
1191   { 0x07c9, 0x0399 }, /*                  Greek_IOTA Ι GREEK CAPITAL LETTER IOTA */
1192   { 0x07ca, 0x039a }, /*                 Greek_KAPPA Κ GREEK CAPITAL LETTER KAPPA */
1193   { 0x07cb, 0x039b }, /*                Greek_LAMBDA Λ GREEK CAPITAL LETTER LAMDA */
1194   { 0x07cc, 0x039c }, /*                    Greek_MU Μ GREEK CAPITAL LETTER MU */
1195   { 0x07cd, 0x039d }, /*                    Greek_NU Ν GREEK CAPITAL LETTER NU */
1196   { 0x07ce, 0x039e }, /*                    Greek_XI Ξ GREEK CAPITAL LETTER XI */
1197   { 0x07cf, 0x039f }, /*               Greek_OMICRON Ο GREEK CAPITAL LETTER OMICRON */
1198   { 0x07d0, 0x03a0 }, /*                    Greek_PI Π GREEK CAPITAL LETTER PI */
1199   { 0x07d1, 0x03a1 }, /*                   Greek_RHO Ρ GREEK CAPITAL LETTER RHO */
1200   { 0x07d2, 0x03a3 }, /*                 Greek_SIGMA Σ GREEK CAPITAL LETTER SIGMA */
1201   { 0x07d4, 0x03a4 }, /*                   Greek_TAU Τ GREEK CAPITAL LETTER TAU */
1202   { 0x07d5, 0x03a5 }, /*               Greek_UPSILON Υ GREEK CAPITAL LETTER UPSILON */
1203   { 0x07d6, 0x03a6 }, /*                   Greek_PHI Φ GREEK CAPITAL LETTER PHI */
1204   { 0x07d7, 0x03a7 }, /*                   Greek_CHI Χ GREEK CAPITAL LETTER CHI */
1205   { 0x07d8, 0x03a8 }, /*                   Greek_PSI Ψ GREEK CAPITAL LETTER PSI */
1206   { 0x07d9, 0x03a9 }, /*                 Greek_OMEGA Ω GREEK CAPITAL LETTER OMEGA */
1207   { 0x07a5, 0x03aa }, /*          Greek_IOTAdieresis Ϊ GREEK CAPITAL LETTER IOTA WITH DIALYTIKA */
1208   { 0x07a9, 0x03ab }, /*       Greek_UPSILONdieresis Ϋ GREEK CAPITAL LETTER UPSILON WITH DIALYTIKA */
1209   { 0x07b1, 0x03ac }, /*           Greek_alphaaccent ά GREEK SMALL LETTER ALPHA WITH TONOS */
1210   { 0x07b2, 0x03ad }, /*         Greek_epsilonaccent έ GREEK SMALL LETTER EPSILON WITH TONOS */
1211   { 0x07b3, 0x03ae }, /*             Greek_etaaccent ή GREEK SMALL LETTER ETA WITH TONOS */
1212   { 0x07b4, 0x03af }, /*            Greek_iotaaccent ί GREEK SMALL LETTER IOTA WITH TONOS */
1213   { 0x07ba, 0x03b0 }, /* Greek_upsilonaccentdieresis ΰ GREEK SMALL LETTER UPSILON WITH DIALYTIKA AND TONOS */
1214   { 0x07e1, 0x03b1 }, /*                 Greek_alpha α GREEK SMALL LETTER ALPHA */
1215   { 0x07e2, 0x03b2 }, /*                  Greek_beta β GREEK SMALL LETTER BETA */
1216   { 0x07e3, 0x03b3 }, /*                 Greek_gamma γ GREEK SMALL LETTER GAMMA */
1217   { 0x07e4, 0x03b4 }, /*                 Greek_delta δ GREEK SMALL LETTER DELTA */
1218   { 0x07e5, 0x03b5 }, /*               Greek_epsilon ε GREEK SMALL LETTER EPSILON */
1219   { 0x07e6, 0x03b6 }, /*                  Greek_zeta ζ GREEK SMALL LETTER ZETA */
1220   { 0x07e7, 0x03b7 }, /*                   Greek_eta η GREEK SMALL LETTER ETA */
1221   { 0x07e8, 0x03b8 }, /*                 Greek_theta θ GREEK SMALL LETTER THETA */
1222   { 0x07e9, 0x03b9 }, /*                  Greek_iota ι GREEK SMALL LETTER IOTA */
1223   { 0x07ea, 0x03ba }, /*                 Greek_kappa κ GREEK SMALL LETTER KAPPA */
1224   { 0x07eb, 0x03bb }, /*                Greek_lambda λ GREEK SMALL LETTER LAMDA */
1225   { 0x07ec, 0x03bc }, /*                    Greek_mu μ GREEK SMALL LETTER MU */
1226   { 0x07ed, 0x03bd }, /*                    Greek_nu ν GREEK SMALL LETTER NU */
1227   { 0x07ee, 0x03be }, /*                    Greek_xi ξ GREEK SMALL LETTER XI */
1228   { 0x07ef, 0x03bf }, /*               Greek_omicron ο GREEK SMALL LETTER OMICRON */
1229   { 0x07f0, 0x03c0 }, /*                    Greek_pi π GREEK SMALL LETTER PI */
1230   { 0x07f1, 0x03c1 }, /*                   Greek_rho ρ GREEK SMALL LETTER RHO */
1231   { 0x07f3, 0x03c2 }, /*       Greek_finalsmallsigma ς GREEK SMALL LETTER FINAL SIGMA */
1232   { 0x07f2, 0x03c3 }, /*                 Greek_sigma σ GREEK SMALL LETTER SIGMA */
1233   { 0x07f4, 0x03c4 }, /*                   Greek_tau τ GREEK SMALL LETTER TAU */
1234   { 0x07f5, 0x03c5 }, /*               Greek_upsilon υ GREEK SMALL LETTER UPSILON */
1235   { 0x07f6, 0x03c6 }, /*                   Greek_phi φ GREEK SMALL LETTER PHI */
1236   { 0x07f7, 0x03c7 }, /*                   Greek_chi χ GREEK SMALL LETTER CHI */
1237   { 0x07f8, 0x03c8 }, /*                   Greek_psi ψ GREEK SMALL LETTER PSI */
1238   { 0x07f9, 0x03c9 }, /*                 Greek_omega ω GREEK SMALL LETTER OMEGA */
1239   { 0x07b5, 0x03ca }, /*          Greek_iotadieresis ϊ GREEK SMALL LETTER IOTA WITH DIALYTIKA */
1240   { 0x07b9, 0x03cb }, /*       Greek_upsilondieresis ϋ GREEK SMALL LETTER UPSILON WITH DIALYTIKA */
1241   { 0x07b7, 0x03cc }, /*         Greek_omicronaccent ό GREEK SMALL LETTER OMICRON WITH TONOS */
1242   { 0x07b8, 0x03cd }, /*         Greek_upsilonaccent ύ GREEK SMALL LETTER UPSILON WITH TONOS */
1243   { 0x07bb, 0x03ce }, /*           Greek_omegaaccent ώ GREEK SMALL LETTER OMEGA WITH TONOS */
1244   { 0x06b3, 0x0401 }, /*                 Cyrillic_IO Ё CYRILLIC CAPITAL LETTER IO */
1245   { 0x06b1, 0x0402 }, /*                 Serbian_DJE Ђ CYRILLIC CAPITAL LETTER DJE */
1246   { 0x06b2, 0x0403 }, /*               Macedonia_GJE Ѓ CYRILLIC CAPITAL LETTER GJE */
1247   { 0x06b4, 0x0404 }, /*                Ukrainian_IE Є CYRILLIC CAPITAL LETTER UKRAINIAN IE */
1248   { 0x06b5, 0x0405 }, /*               Macedonia_DSE Ѕ CYRILLIC CAPITAL LETTER DZE */
1249   { 0x06b6, 0x0406 }, /*                 Ukrainian_I І CYRILLIC CAPITAL LETTER BYELORUSSIAN-UKRAINIAN I */
1250   { 0x06b7, 0x0407 }, /*                Ukrainian_YI Ї CYRILLIC CAPITAL LETTER YI */
1251   { 0x06b8, 0x0408 }, /*                 Cyrillic_JE Ј CYRILLIC CAPITAL LETTER JE */
1252   { 0x06b9, 0x0409 }, /*                Cyrillic_LJE Љ CYRILLIC CAPITAL LETTER LJE */
1253   { 0x06ba, 0x040a }, /*                Cyrillic_NJE Њ CYRILLIC CAPITAL LETTER NJE */
1254   { 0x06bb, 0x040b }, /*                Serbian_TSHE Ћ CYRILLIC CAPITAL LETTER TSHE */
1255   { 0x06bc, 0x040c }, /*               Macedonia_KJE Ќ CYRILLIC CAPITAL LETTER KJE */
1256   { 0x06be, 0x040e }, /*         Byelorussian_SHORTU Ў CYRILLIC CAPITAL LETTER SHORT U */
1257   { 0x06bf, 0x040f }, /*               Cyrillic_DZHE Џ CYRILLIC CAPITAL LETTER DZHE */
1258   { 0x06e1, 0x0410 }, /*                  Cyrillic_A А CYRILLIC CAPITAL LETTER A */
1259   { 0x06e2, 0x0411 }, /*                 Cyrillic_BE Б CYRILLIC CAPITAL LETTER BE */
1260   { 0x06f7, 0x0412 }, /*                 Cyrillic_VE В CYRILLIC CAPITAL LETTER VE */
1261   { 0x06e7, 0x0413 }, /*                Cyrillic_GHE Г CYRILLIC CAPITAL LETTER GHE */
1262   { 0x06e4, 0x0414 }, /*                 Cyrillic_DE Д CYRILLIC CAPITAL LETTER DE */
1263   { 0x06e5, 0x0415 }, /*                 Cyrillic_IE Е CYRILLIC CAPITAL LETTER IE */
1264   { 0x06f6, 0x0416 }, /*                Cyrillic_ZHE Ж CYRILLIC CAPITAL LETTER ZHE */
1265   { 0x06fa, 0x0417 }, /*                 Cyrillic_ZE З CYRILLIC CAPITAL LETTER ZE */
1266   { 0x06e9, 0x0418 }, /*                  Cyrillic_I И CYRILLIC CAPITAL LETTER I */
1267   { 0x06ea, 0x0419 }, /*             Cyrillic_SHORTI Й CYRILLIC CAPITAL LETTER SHORT I */
1268   { 0x06eb, 0x041a }, /*                 Cyrillic_KA К CYRILLIC CAPITAL LETTER KA */
1269   { 0x06ec, 0x041b }, /*                 Cyrillic_EL Л CYRILLIC CAPITAL LETTER EL */
1270   { 0x06ed, 0x041c }, /*                 Cyrillic_EM М CYRILLIC CAPITAL LETTER EM */
1271   { 0x06ee, 0x041d }, /*                 Cyrillic_EN Н CYRILLIC CAPITAL LETTER EN */
1272   { 0x06ef, 0x041e }, /*                  Cyrillic_O О CYRILLIC CAPITAL LETTER O */
1273   { 0x06f0, 0x041f }, /*                 Cyrillic_PE П CYRILLIC CAPITAL LETTER PE */
1274   { 0x06f2, 0x0420 }, /*                 Cyrillic_ER Р CYRILLIC CAPITAL LETTER ER */
1275   { 0x06f3, 0x0421 }, /*                 Cyrillic_ES С CYRILLIC CAPITAL LETTER ES */
1276   { 0x06f4, 0x0422 }, /*                 Cyrillic_TE Т CYRILLIC CAPITAL LETTER TE */
1277   { 0x06f5, 0x0423 }, /*                  Cyrillic_U У CYRILLIC CAPITAL LETTER U */
1278   { 0x06e6, 0x0424 }, /*                 Cyrillic_EF Ф CYRILLIC CAPITAL LETTER EF */
1279   { 0x06e8, 0x0425 }, /*                 Cyrillic_HA Х CYRILLIC CAPITAL LETTER HA */
1280   { 0x06e3, 0x0426 }, /*                Cyrillic_TSE Ц CYRILLIC CAPITAL LETTER TSE */
1281   { 0x06fe, 0x0427 }, /*                Cyrillic_CHE Ч CYRILLIC CAPITAL LETTER CHE */
1282   { 0x06fb, 0x0428 }, /*                Cyrillic_SHA Ш CYRILLIC CAPITAL LETTER SHA */
1283   { 0x06fd, 0x0429 }, /*              Cyrillic_SHCHA Щ CYRILLIC CAPITAL LETTER SHCHA */
1284   { 0x06ff, 0x042a }, /*           Cyrillic_HARDSIGN Ъ CYRILLIC CAPITAL LETTER HARD SIGN */
1285   { 0x06f9, 0x042b }, /*               Cyrillic_YERU Ы CYRILLIC CAPITAL LETTER YERU */
1286   { 0x06f8, 0x042c }, /*           Cyrillic_SOFTSIGN Ь CYRILLIC CAPITAL LETTER SOFT SIGN */
1287   { 0x06fc, 0x042d }, /*                  Cyrillic_E Э CYRILLIC CAPITAL LETTER E */
1288   { 0x06e0, 0x042e }, /*                 Cyrillic_YU Ю CYRILLIC CAPITAL LETTER YU */
1289   { 0x06f1, 0x042f }, /*                 Cyrillic_YA Я CYRILLIC CAPITAL LETTER YA */
1290   { 0x06c1, 0x0430 }, /*                  Cyrillic_a а CYRILLIC SMALL LETTER A */
1291   { 0x06c2, 0x0431 }, /*                 Cyrillic_be б CYRILLIC SMALL LETTER BE */
1292   { 0x06d7, 0x0432 }, /*                 Cyrillic_ve в CYRILLIC SMALL LETTER VE */
1293   { 0x06c7, 0x0433 }, /*                Cyrillic_ghe г CYRILLIC SMALL LETTER GHE */
1294   { 0x06c4, 0x0434 }, /*                 Cyrillic_de д CYRILLIC SMALL LETTER DE */
1295   { 0x06c5, 0x0435 }, /*                 Cyrillic_ie е CYRILLIC SMALL LETTER IE */
1296   { 0x06d6, 0x0436 }, /*                Cyrillic_zhe ж CYRILLIC SMALL LETTER ZHE */
1297   { 0x06da, 0x0437 }, /*                 Cyrillic_ze з CYRILLIC SMALL LETTER ZE */
1298   { 0x06c9, 0x0438 }, /*                  Cyrillic_i и CYRILLIC SMALL LETTER I */
1299   { 0x06ca, 0x0439 }, /*             Cyrillic_shorti й CYRILLIC SMALL LETTER SHORT I */
1300   { 0x06cb, 0x043a }, /*                 Cyrillic_ka к CYRILLIC SMALL LETTER KA */
1301   { 0x06cc, 0x043b }, /*                 Cyrillic_el л CYRILLIC SMALL LETTER EL */
1302   { 0x06cd, 0x043c }, /*                 Cyrillic_em м CYRILLIC SMALL LETTER EM */
1303   { 0x06ce, 0x043d }, /*                 Cyrillic_en н CYRILLIC SMALL LETTER EN */
1304   { 0x06cf, 0x043e }, /*                  Cyrillic_o о CYRILLIC SMALL LETTER O */
1305   { 0x06d0, 0x043f }, /*                 Cyrillic_pe п CYRILLIC SMALL LETTER PE */
1306   { 0x06d2, 0x0440 }, /*                 Cyrillic_er р CYRILLIC SMALL LETTER ER */
1307   { 0x06d3, 0x0441 }, /*                 Cyrillic_es с CYRILLIC SMALL LETTER ES */
1308   { 0x06d4, 0x0442 }, /*                 Cyrillic_te т CYRILLIC SMALL LETTER TE */
1309   { 0x06d5, 0x0443 }, /*                  Cyrillic_u у CYRILLIC SMALL LETTER U */
1310   { 0x06c6, 0x0444 }, /*                 Cyrillic_ef ф CYRILLIC SMALL LETTER EF */
1311   { 0x06c8, 0x0445 }, /*                 Cyrillic_ha х CYRILLIC SMALL LETTER HA */
1312   { 0x06c3, 0x0446 }, /*                Cyrillic_tse ц CYRILLIC SMALL LETTER TSE */
1313   { 0x06de, 0x0447 }, /*                Cyrillic_che ч CYRILLIC SMALL LETTER CHE */
1314   { 0x06db, 0x0448 }, /*                Cyrillic_sha ш CYRILLIC SMALL LETTER SHA */
1315   { 0x06dd, 0x0449 }, /*              Cyrillic_shcha щ CYRILLIC SMALL LETTER SHCHA */
1316   { 0x06df, 0x044a }, /*           Cyrillic_hardsign ъ CYRILLIC SMALL LETTER HARD SIGN */
1317   { 0x06d9, 0x044b }, /*               Cyrillic_yeru ы CYRILLIC SMALL LETTER YERU */
1318   { 0x06d8, 0x044c }, /*           Cyrillic_softsign ь CYRILLIC SMALL LETTER SOFT SIGN */
1319   { 0x06dc, 0x044d }, /*                  Cyrillic_e э CYRILLIC SMALL LETTER E */
1320   { 0x06c0, 0x044e }, /*                 Cyrillic_yu ю CYRILLIC SMALL LETTER YU */
1321   { 0x06d1, 0x044f }, /*                 Cyrillic_ya я CYRILLIC SMALL LETTER YA */
1322   { 0x06a3, 0x0451 }, /*                 Cyrillic_io ё CYRILLIC SMALL LETTER IO */
1323   { 0x06a1, 0x0452 }, /*                 Serbian_dje ђ CYRILLIC SMALL LETTER DJE */
1324   { 0x06a2, 0x0453 }, /*               Macedonia_gje ѓ CYRILLIC SMALL LETTER GJE */
1325   { 0x06a4, 0x0454 }, /*                Ukrainian_ie є CYRILLIC SMALL LETTER UKRAINIAN IE */
1326   { 0x06a5, 0x0455 }, /*               Macedonia_dse ѕ CYRILLIC SMALL LETTER DZE */
1327   { 0x06a6, 0x0456 }, /*                 Ukrainian_i і CYRILLIC SMALL LETTER BYELORUSSIAN-UKRAINIAN I */
1328   { 0x06a7, 0x0457 }, /*                Ukrainian_yi ї CYRILLIC SMALL LETTER YI */
1329   { 0x06a8, 0x0458 }, /*                 Cyrillic_je ј CYRILLIC SMALL LETTER JE */
1330   { 0x06a9, 0x0459 }, /*                Cyrillic_lje љ CYRILLIC SMALL LETTER LJE */
1331   { 0x06aa, 0x045a }, /*                Cyrillic_nje њ CYRILLIC SMALL LETTER NJE */
1332   { 0x06ab, 0x045b }, /*                Serbian_tshe ћ CYRILLIC SMALL LETTER TSHE */
1333   { 0x06ac, 0x045c }, /*               Macedonia_kje ќ CYRILLIC SMALL LETTER KJE */
1334   { 0x06ae, 0x045e }, /*         Byelorussian_shortu ў CYRILLIC SMALL LETTER SHORT U */
1335   { 0x06af, 0x045f }, /*               Cyrillic_dzhe џ CYRILLIC SMALL LETTER DZHE */
1336   { 0x0ce0, 0x05d0 }, /*                hebrew_aleph א HEBREW LETTER ALEF */
1337   { 0x0ce1, 0x05d1 }, /*                  hebrew_bet ב HEBREW LETTER BET */
1338   { 0x0ce2, 0x05d2 }, /*                hebrew_gimel ג HEBREW LETTER GIMEL */
1339   { 0x0ce3, 0x05d3 }, /*                hebrew_dalet ד HEBREW LETTER DALET */
1340   { 0x0ce4, 0x05d4 }, /*                   hebrew_he ה HEBREW LETTER HE */
1341   { 0x0ce5, 0x05d5 }, /*                  hebrew_waw ו HEBREW LETTER VAV */
1342   { 0x0ce6, 0x05d6 }, /*                 hebrew_zain ז HEBREW LETTER ZAYIN */
1343   { 0x0ce7, 0x05d7 }, /*                 hebrew_chet ח HEBREW LETTER HET */
1344   { 0x0ce8, 0x05d8 }, /*                  hebrew_tet ט HEBREW LETTER TET */
1345   { 0x0ce9, 0x05d9 }, /*                  hebrew_yod י HEBREW LETTER YOD */
1346   { 0x0cea, 0x05da }, /*            hebrew_finalkaph ך HEBREW LETTER FINAL KAF */
1347   { 0x0ceb, 0x05db }, /*                 hebrew_kaph כ HEBREW LETTER KAF */
1348   { 0x0cec, 0x05dc }, /*                hebrew_lamed ל HEBREW LETTER LAMED */
1349   { 0x0ced, 0x05dd }, /*             hebrew_finalmem ם HEBREW LETTER FINAL MEM */
1350   { 0x0cee, 0x05de }, /*                  hebrew_mem מ HEBREW LETTER MEM */
1351   { 0x0cef, 0x05df }, /*             hebrew_finalnun ן HEBREW LETTER FINAL NUN */
1352   { 0x0cf0, 0x05e0 }, /*                  hebrew_nun נ HEBREW LETTER NUN */
1353   { 0x0cf1, 0x05e1 }, /*               hebrew_samech ס HEBREW LETTER SAMEKH */
1354   { 0x0cf2, 0x05e2 }, /*                 hebrew_ayin ע HEBREW LETTER AYIN */
1355   { 0x0cf3, 0x05e3 }, /*              hebrew_finalpe ף HEBREW LETTER FINAL PE */
1356   { 0x0cf4, 0x05e4 }, /*                   hebrew_pe פ HEBREW LETTER PE */
1357   { 0x0cf5, 0x05e5 }, /*            hebrew_finalzade ץ HEBREW LETTER FINAL TSADI */
1358   { 0x0cf6, 0x05e6 }, /*                 hebrew_zade צ HEBREW LETTER TSADI */
1359   { 0x0cf7, 0x05e7 }, /*                 hebrew_qoph ק HEBREW LETTER QOF */
1360   { 0x0cf8, 0x05e8 }, /*                 hebrew_resh ר HEBREW LETTER RESH */
1361   { 0x0cf9, 0x05e9 }, /*                 hebrew_shin ש HEBREW LETTER SHIN */
1362   { 0x0cfa, 0x05ea }, /*                  hebrew_taw ת HEBREW LETTER TAV */
1363   { 0x05ac, 0x060c }, /*                Arabic_comma ، ARABIC COMMA */
1364   { 0x05bb, 0x061b }, /*            Arabic_semicolon ؛ ARABIC SEMICOLON */
1365   { 0x05bf, 0x061f }, /*        Arabic_question_mark ؟ ARABIC QUESTION MARK */
1366   { 0x05c1, 0x0621 }, /*                Arabic_hamza ء ARABIC LETTER HAMZA */
1367   { 0x05c2, 0x0622 }, /*          Arabic_maddaonalef آ ARABIC LETTER ALEF WITH MADDA ABOVE */
1368   { 0x05c3, 0x0623 }, /*          Arabic_hamzaonalef أ ARABIC LETTER ALEF WITH HAMZA ABOVE */
1369   { 0x05c4, 0x0624 }, /*           Arabic_hamzaonwaw ؤ ARABIC LETTER WAW WITH HAMZA ABOVE */
1370   { 0x05c5, 0x0625 }, /*       Arabic_hamzaunderalef إ ARABIC LETTER ALEF WITH HAMZA BELOW */
1371   { 0x05c6, 0x0626 }, /*           Arabic_hamzaonyeh ئ ARABIC LETTER YEH WITH HAMZA ABOVE */
1372   { 0x05c7, 0x0627 }, /*                 Arabic_alef ا ARABIC LETTER ALEF */
1373   { 0x05c8, 0x0628 }, /*                  Arabic_beh ب ARABIC LETTER BEH */
1374   { 0x05c9, 0x0629 }, /*           Arabic_tehmarbuta ة ARABIC LETTER TEH MARBUTA */
1375   { 0x05ca, 0x062a }, /*                  Arabic_teh ت ARABIC LETTER TEH */
1376   { 0x05cb, 0x062b }, /*                 Arabic_theh ث ARABIC LETTER THEH */
1377   { 0x05cc, 0x062c }, /*                 Arabic_jeem ج ARABIC LETTER JEEM */
1378   { 0x05cd, 0x062d }, /*                  Arabic_hah ح ARABIC LETTER HAH */
1379   { 0x05ce, 0x062e }, /*                 Arabic_khah خ ARABIC LETTER KHAH */
1380   { 0x05cf, 0x062f }, /*                  Arabic_dal د ARABIC LETTER DAL */
1381   { 0x05d0, 0x0630 }, /*                 Arabic_thal ذ ARABIC LETTER THAL */
1382   { 0x05d1, 0x0631 }, /*                   Arabic_ra ر ARABIC LETTER REH */
1383   { 0x05d2, 0x0632 }, /*                 Arabic_zain ز ARABIC LETTER ZAIN */
1384   { 0x05d3, 0x0633 }, /*                 Arabic_seen س ARABIC LETTER SEEN */
1385   { 0x05d4, 0x0634 }, /*                Arabic_sheen ش ARABIC LETTER SHEEN */
1386   { 0x05d5, 0x0635 }, /*                  Arabic_sad ص ARABIC LETTER SAD */
1387   { 0x05d6, 0x0636 }, /*                  Arabic_dad ض ARABIC LETTER DAD */
1388   { 0x05d7, 0x0637 }, /*                  Arabic_tah ط ARABIC LETTER TAH */
1389   { 0x05d8, 0x0638 }, /*                  Arabic_zah ظ ARABIC LETTER ZAH */
1390   { 0x05d9, 0x0639 }, /*                  Arabic_ain ع ARABIC LETTER AIN */
1391   { 0x05da, 0x063a }, /*                Arabic_ghain غ ARABIC LETTER GHAIN */
1392   { 0x05e0, 0x0640 }, /*              Arabic_tatweel ـ ARABIC TATWEEL */
1393   { 0x05e1, 0x0641 }, /*                  Arabic_feh ف ARABIC LETTER FEH */
1394   { 0x05e2, 0x0642 }, /*                  Arabic_qaf ق ARABIC LETTER QAF */
1395   { 0x05e3, 0x0643 }, /*                  Arabic_kaf ك ARABIC LETTER KAF */
1396   { 0x05e4, 0x0644 }, /*                  Arabic_lam ل ARABIC LETTER LAM */
1397   { 0x05e5, 0x0645 }, /*                 Arabic_meem م ARABIC LETTER MEEM */
1398   { 0x05e6, 0x0646 }, /*                 Arabic_noon ن ARABIC LETTER NOON */
1399   { 0x05e7, 0x0647 }, /*                   Arabic_ha ه ARABIC LETTER HEH */
1400   { 0x05e8, 0x0648 }, /*                  Arabic_waw و ARABIC LETTER WAW */
1401   { 0x05e9, 0x0649 }, /*          Arabic_alefmaksura ى ARABIC LETTER ALEF MAKSURA */
1402   { 0x05ea, 0x064a }, /*                  Arabic_yeh ي ARABIC LETTER YEH */
1403   { 0x05eb, 0x064b }, /*             Arabic_fathatan ً ARABIC FATHATAN */
1404   { 0x05ec, 0x064c }, /*             Arabic_dammatan ٌ ARABIC DAMMATAN */
1405   { 0x05ed, 0x064d }, /*             Arabic_kasratan ٍ ARABIC KASRATAN */
1406   { 0x05ee, 0x064e }, /*                Arabic_fatha َ ARABIC FATHA */
1407   { 0x05ef, 0x064f }, /*                Arabic_damma ُ ARABIC DAMMA */
1408   { 0x05f0, 0x0650 }, /*                Arabic_kasra ِ ARABIC KASRA */
1409   { 0x05f1, 0x0651 }, /*               Arabic_shadda ّ ARABIC SHADDA */
1410   { 0x05f2, 0x0652 }, /*                Arabic_sukun ْ ARABIC SUKUN */
1411   { 0x0da1, 0x0e01 }, /*                  Thai_kokai ก THAI CHARACTER KO KAI */
1412   { 0x0da2, 0x0e02 }, /*                Thai_khokhai ข THAI CHARACTER KHO KHAI */
1413   { 0x0da3, 0x0e03 }, /*               Thai_khokhuat ฃ THAI CHARACTER KHO KHUAT */
1414   { 0x0da4, 0x0e04 }, /*               Thai_khokhwai ค THAI CHARACTER KHO KHWAI */
1415   { 0x0da5, 0x0e05 }, /*                Thai_khokhon ฅ THAI CHARACTER KHO KHON */
1416   { 0x0da6, 0x0e06 }, /*             Thai_khorakhang ฆ THAI CHARACTER KHO RAKHANG */
1417   { 0x0da7, 0x0e07 }, /*                 Thai_ngongu ง THAI CHARACTER NGO NGU */
1418   { 0x0da8, 0x0e08 }, /*                Thai_chochan จ THAI CHARACTER CHO CHAN */
1419   { 0x0da9, 0x0e09 }, /*               Thai_choching ฉ THAI CHARACTER CHO CHING */
1420   { 0x0daa, 0x0e0a }, /*               Thai_chochang ช THAI CHARACTER CHO CHANG */
1421   { 0x0dab, 0x0e0b }, /*                   Thai_soso ซ THAI CHARACTER SO SO */
1422   { 0x0dac, 0x0e0c }, /*                Thai_chochoe ฌ THAI CHARACTER CHO CHOE */
1423   { 0x0dad, 0x0e0d }, /*                 Thai_yoying ญ THAI CHARACTER YO YING */
1424   { 0x0dae, 0x0e0e }, /*                Thai_dochada ฎ THAI CHARACTER DO CHADA */
1425   { 0x0daf, 0x0e0f }, /*                Thai_topatak ฏ THAI CHARACTER TO PATAK */
1426   { 0x0db0, 0x0e10 }, /*                Thai_thothan ฐ THAI CHARACTER THO THAN */
1427   { 0x0db1, 0x0e11 }, /*          Thai_thonangmontho ฑ THAI CHARACTER THO NANGMONTHO */
1428   { 0x0db2, 0x0e12 }, /*             Thai_thophuthao ฒ THAI CHARACTER THO PHUTHAO */
1429   { 0x0db3, 0x0e13 }, /*                  Thai_nonen ณ THAI CHARACTER NO NEN */
1430   { 0x0db4, 0x0e14 }, /*                  Thai_dodek ด THAI CHARACTER DO DEK */
1431   { 0x0db5, 0x0e15 }, /*                  Thai_totao ต THAI CHARACTER TO TAO */
1432   { 0x0db6, 0x0e16 }, /*               Thai_thothung ถ THAI CHARACTER THO THUNG */
1433   { 0x0db7, 0x0e17 }, /*              Thai_thothahan ท THAI CHARACTER THO THAHAN */
1434   { 0x0db8, 0x0e18 }, /*               Thai_thothong ธ THAI CHARACTER THO THONG */
1435   { 0x0db9, 0x0e19 }, /*                   Thai_nonu น THAI CHARACTER NO NU */
1436   { 0x0dba, 0x0e1a }, /*               Thai_bobaimai บ THAI CHARACTER BO BAIMAI */
1437   { 0x0dbb, 0x0e1b }, /*                  Thai_popla ป THAI CHARACTER PO PLA */
1438   { 0x0dbc, 0x0e1c }, /*               Thai_phophung ผ THAI CHARACTER PHO PHUNG */
1439   { 0x0dbd, 0x0e1d }, /*                   Thai_fofa ฝ THAI CHARACTER FO FA */
1440   { 0x0dbe, 0x0e1e }, /*                Thai_phophan พ THAI CHARACTER PHO PHAN */
1441   { 0x0dbf, 0x0e1f }, /*                  Thai_fofan ฟ THAI CHARACTER FO FAN */
1442   { 0x0dc0, 0x0e20 }, /*             Thai_phosamphao ภ THAI CHARACTER PHO SAMPHAO */
1443   { 0x0dc1, 0x0e21 }, /*                   Thai_moma ม THAI CHARACTER MO MA */
1444   { 0x0dc2, 0x0e22 }, /*                  Thai_yoyak ย THAI CHARACTER YO YAK */
1445   { 0x0dc3, 0x0e23 }, /*                  Thai_rorua ร THAI CHARACTER RO RUA */
1446   { 0x0dc4, 0x0e24 }, /*                     Thai_ru ฤ THAI CHARACTER RU */
1447   { 0x0dc5, 0x0e25 }, /*                 Thai_loling ล THAI CHARACTER LO LING */
1448   { 0x0dc6, 0x0e26 }, /*                     Thai_lu ฦ THAI CHARACTER LU */
1449   { 0x0dc7, 0x0e27 }, /*                 Thai_wowaen ว THAI CHARACTER WO WAEN */
1450   { 0x0dc8, 0x0e28 }, /*                 Thai_sosala ศ THAI CHARACTER SO SALA */
1451   { 0x0dc9, 0x0e29 }, /*                 Thai_sorusi ษ THAI CHARACTER SO RUSI */
1452   { 0x0dca, 0x0e2a }, /*                  Thai_sosua ส THAI CHARACTER SO SUA */
1453   { 0x0dcb, 0x0e2b }, /*                  Thai_hohip ห THAI CHARACTER HO HIP */
1454   { 0x0dcc, 0x0e2c }, /*                Thai_lochula ฬ THAI CHARACTER LO CHULA */
1455   { 0x0dcd, 0x0e2d }, /*                   Thai_oang อ THAI CHARACTER O ANG */
1456   { 0x0dce, 0x0e2e }, /*               Thai_honokhuk ฮ THAI CHARACTER HO NOKHUK */
1457   { 0x0dcf, 0x0e2f }, /*              Thai_paiyannoi ฯ THAI CHARACTER PAIYANNOI */
1458   { 0x0dd0, 0x0e30 }, /*                  Thai_saraa ะ THAI CHARACTER SARA A */
1459   { 0x0dd1, 0x0e31 }, /*             Thai_maihanakat ั THAI CHARACTER MAI HAN-AKAT */
1460   { 0x0dd2, 0x0e32 }, /*                 Thai_saraaa า THAI CHARACTER SARA AA */
1461   { 0x0dd3, 0x0e33 }, /*                 Thai_saraam ำ THAI CHARACTER SARA AM */
1462   { 0x0dd4, 0x0e34 }, /*                  Thai_sarai ิ THAI CHARACTER SARA I */
1463   { 0x0dd5, 0x0e35 }, /*                 Thai_saraii ี THAI CHARACTER SARA II */
1464   { 0x0dd6, 0x0e36 }, /*                 Thai_saraue ึ THAI CHARACTER SARA UE */
1465   { 0x0dd7, 0x0e37 }, /*                Thai_sarauee ื THAI CHARACTER SARA UEE */
1466   { 0x0dd8, 0x0e38 }, /*                  Thai_sarau ุ THAI CHARACTER SARA U */
1467   { 0x0dd9, 0x0e39 }, /*                 Thai_sarauu ู THAI CHARACTER SARA UU */
1468   { 0x0dda, 0x0e3a }, /*                Thai_phinthu ฺ THAI CHARACTER PHINTHU */
1469   { 0x0ddf, 0x0e3f }, /*                   Thai_baht ฿ THAI CURRENCY SYMBOL BAHT */
1470   { 0x0de0, 0x0e40 }, /*                  Thai_sarae เ THAI CHARACTER SARA E */
1471   { 0x0de1, 0x0e41 }, /*                 Thai_saraae แ THAI CHARACTER SARA AE */
1472   { 0x0de2, 0x0e42 }, /*                  Thai_sarao โ THAI CHARACTER SARA O */
1473   { 0x0de3, 0x0e43 }, /*          Thai_saraaimaimuan ใ THAI CHARACTER SARA AI MAIMUAN */
1474   { 0x0de4, 0x0e44 }, /*         Thai_saraaimaimalai ไ THAI CHARACTER SARA AI MAIMALAI */
1475   { 0x0de5, 0x0e45 }, /*            Thai_lakkhangyao ๅ THAI CHARACTER LAKKHANGYAO */
1476   { 0x0de6, 0x0e46 }, /*               Thai_maiyamok ๆ THAI CHARACTER MAIYAMOK */
1477   { 0x0de7, 0x0e47 }, /*              Thai_maitaikhu ็ THAI CHARACTER MAITAIKHU */
1478   { 0x0de8, 0x0e48 }, /*                  Thai_maiek ่ THAI CHARACTER MAI EK */
1479   { 0x0de9, 0x0e49 }, /*                 Thai_maitho ้ THAI CHARACTER MAI THO */
1480   { 0x0dea, 0x0e4a }, /*                 Thai_maitri ๊ THAI CHARACTER MAI TRI */
1481   { 0x0deb, 0x0e4b }, /*            Thai_maichattawa ๋ THAI CHARACTER MAI CHATTAWA */
1482   { 0x0dec, 0x0e4c }, /*            Thai_thanthakhat ์ THAI CHARACTER THANTHAKHAT */
1483   { 0x0ded, 0x0e4d }, /*               Thai_nikhahit ํ THAI CHARACTER NIKHAHIT */
1484   { 0x0df0, 0x0e50 }, /*                 Thai_leksun ๐ THAI DIGIT ZERO */
1485   { 0x0df1, 0x0e51 }, /*                Thai_leknung ๑ THAI DIGIT ONE */
1486   { 0x0df2, 0x0e52 }, /*                Thai_leksong ๒ THAI DIGIT TWO */
1487   { 0x0df3, 0x0e53 }, /*                 Thai_leksam ๓ THAI DIGIT THREE */
1488   { 0x0df4, 0x0e54 }, /*                  Thai_leksi ๔ THAI DIGIT FOUR */
1489   { 0x0df5, 0x0e55 }, /*                  Thai_lekha ๕ THAI DIGIT FIVE */
1490   { 0x0df6, 0x0e56 }, /*                 Thai_lekhok ๖ THAI DIGIT SIX */
1491   { 0x0df7, 0x0e57 }, /*                Thai_lekchet ๗ THAI DIGIT SEVEN */
1492   { 0x0df8, 0x0e58 }, /*                Thai_lekpaet ๘ THAI DIGIT EIGHT */
1493   { 0x0df9, 0x0e59 }, /*                 Thai_lekkao ๙ THAI DIGIT NINE */
1494   { 0x0ed4, 0x11a8 }, /*             Hangul_J_Kiyeog ᆨ HANGUL JONGSEONG KIYEOK */
1495   { 0x0ed5, 0x11a9 }, /*        Hangul_J_SsangKiyeog ᆩ HANGUL JONGSEONG SSANGKIYEOK */
1496   { 0x0ed6, 0x11aa }, /*         Hangul_J_KiyeogSios ᆪ HANGUL JONGSEONG KIYEOK-SIOS */
1497   { 0x0ed7, 0x11ab }, /*              Hangul_J_Nieun ᆫ HANGUL JONGSEONG NIEUN */
1498   { 0x0ed8, 0x11ac }, /*         Hangul_J_NieunJieuj ᆬ HANGUL JONGSEONG NIEUN-CIEUC */
1499   { 0x0ed9, 0x11ad }, /*         Hangul_J_NieunHieuh ᆭ HANGUL JONGSEONG NIEUN-HIEUH */
1500   { 0x0eda, 0x11ae }, /*             Hangul_J_Dikeud ᆮ HANGUL JONGSEONG TIKEUT */
1501   { 0x0edb, 0x11af }, /*              Hangul_J_Rieul ᆯ HANGUL JONGSEONG RIEUL */
1502   { 0x0edc, 0x11b0 }, /*        Hangul_J_RieulKiyeog ᆰ HANGUL JONGSEONG RIEUL-KIYEOK */
1503   { 0x0edd, 0x11b1 }, /*         Hangul_J_RieulMieum ᆱ HANGUL JONGSEONG RIEUL-MIEUM */
1504   { 0x0ede, 0x11b2 }, /*         Hangul_J_RieulPieub ᆲ HANGUL JONGSEONG RIEUL-PIEUP */
1505   { 0x0edf, 0x11b3 }, /*          Hangul_J_RieulSios ᆳ HANGUL JONGSEONG RIEUL-SIOS */
1506   { 0x0ee0, 0x11b4 }, /*         Hangul_J_RieulTieut ᆴ HANGUL JONGSEONG RIEUL-THIEUTH */
1507   { 0x0ee1, 0x11b5 }, /*        Hangul_J_RieulPhieuf ᆵ HANGUL JONGSEONG RIEUL-PHIEUPH */
1508   { 0x0ee2, 0x11b6 }, /*         Hangul_J_RieulHieuh ᆶ HANGUL JONGSEONG RIEUL-HIEUH */
1509   { 0x0ee3, 0x11b7 }, /*              Hangul_J_Mieum ᆷ HANGUL JONGSEONG MIEUM */
1510   { 0x0ee4, 0x11b8 }, /*              Hangul_J_Pieub ᆸ HANGUL JONGSEONG PIEUP */
1511   { 0x0ee5, 0x11b9 }, /*          Hangul_J_PieubSios ᆹ HANGUL JONGSEONG PIEUP-SIOS */
1512   { 0x0ee6, 0x11ba }, /*               Hangul_J_Sios ᆺ HANGUL JONGSEONG SIOS */
1513   { 0x0ee7, 0x11bb }, /*          Hangul_J_SsangSios ᆻ HANGUL JONGSEONG SSANGSIOS */
1514   { 0x0ee8, 0x11bc }, /*              Hangul_J_Ieung ᆼ HANGUL JONGSEONG IEUNG */
1515   { 0x0ee9, 0x11bd }, /*              Hangul_J_Jieuj ᆽ HANGUL JONGSEONG CIEUC */
1516   { 0x0eea, 0x11be }, /*              Hangul_J_Cieuc ᆾ HANGUL JONGSEONG CHIEUCH */
1517   { 0x0eeb, 0x11bf }, /*             Hangul_J_Khieuq ᆿ HANGUL JONGSEONG KHIEUKH */
1518   { 0x0eec, 0x11c0 }, /*              Hangul_J_Tieut ᇀ HANGUL JONGSEONG THIEUTH */
1519   { 0x0eed, 0x11c1 }, /*             Hangul_J_Phieuf ᇁ HANGUL JONGSEONG PHIEUPH */
1520   { 0x0eee, 0x11c2 }, /*              Hangul_J_Hieuh ᇂ HANGUL JONGSEONG HIEUH */
1521   { 0x0ef8, 0x11eb }, /*            Hangul_J_PanSios ᇫ HANGUL JONGSEONG PANSIOS */
1522   { 0x0efa, 0x11f9 }, /*        Hangul_J_YeorinHieuh ᇹ HANGUL JONGSEONG YEORINHIEUH */
1523   { 0x0aa2, 0x2002 }, /*                     enspace   EN SPACE */
1524   { 0x0aa1, 0x2003 }, /*                     emspace   EM SPACE */
1525   { 0x0aa3, 0x2004 }, /*                    em3space   THREE-PER-EM SPACE */
1526   { 0x0aa4, 0x2005 }, /*                    em4space   FOUR-PER-EM SPACE */
1527   { 0x0aa5, 0x2007 }, /*                  digitspace   FIGURE SPACE */
1528   { 0x0aa6, 0x2008 }, /*                  punctspace   PUNCTUATION SPACE */
1529   { 0x0aa7, 0x2009 }, /*                   thinspace   THIN SPACE */
1530   { 0x0aa8, 0x200a }, /*                   hairspace   HAIR SPACE */
1531   { 0x0abb, 0x2012 }, /*                     figdash ‒ FIGURE DASH */
1532   { 0x0aaa, 0x2013 }, /*                      endash – EN DASH */
1533   { 0x0aa9, 0x2014 }, /*                      emdash — EM DASH */
1534   { 0x07af, 0x2015 }, /*              Greek_horizbar ― HORIZONTAL BAR */
1535   { 0x0cdf, 0x2017 }, /*        hebrew_doublelowline ‗ DOUBLE LOW LINE */
1536   { 0x0ad0, 0x2018 }, /*         leftsinglequotemark ‘ LEFT SINGLE QUOTATION MARK */
1537   { 0x0ad1, 0x2019 }, /*        rightsinglequotemark ’ RIGHT SINGLE QUOTATION MARK */
1538   { 0x0afd, 0x201a }, /*          singlelowquotemark ‚ SINGLE LOW-9 QUOTATION MARK */
1539   { 0x0ad2, 0x201c }, /*         leftdoublequotemark “ LEFT DOUBLE QUOTATION MARK */
1540   { 0x0ad3, 0x201d }, /*        rightdoublequotemark ” RIGHT DOUBLE QUOTATION MARK */
1541   { 0x0afe, 0x201e }, /*          doublelowquotemark „ DOUBLE LOW-9 QUOTATION MARK */
1542   { 0x0af1, 0x2020 }, /*                      dagger † DAGGER */
1543   { 0x0af2, 0x2021 }, /*                doubledagger ‡ DOUBLE DAGGER */
1544   { 0x0ae6, 0x2022 }, /*          enfilledcircbullet • BULLET */
1545   { 0x0aae, 0x2026 }, /*                    ellipsis … HORIZONTAL ELLIPSIS */
1546   { 0x0ad6, 0x2032 }, /*                     minutes ′ PRIME */
1547   { 0x0ad7, 0x2033 }, /*                     seconds ″ DOUBLE PRIME */
1548   { 0x0afc, 0x2038 }, /*                       caret ‸ CARET */
1549   { 0x047e, 0x203e }, /*                    overline ‾ OVERLINE */
1550   { 0x20a0, 0x20a0 }, /*                     EcuSign ₠ EURO-CURRENCY SIGN */
1551   { 0x20a1, 0x20a1 }, /*                   ColonSign ₡ COLON SIGN */
1552   { 0x20a2, 0x20a2 }, /*                CruzeiroSign ₢ CRUZEIRO SIGN */
1553   { 0x20a3, 0x20a3 }, /*                  FFrancSign ₣ FRENCH FRANC SIGN */
1554   { 0x20a4, 0x20a4 }, /*                    LiraSign ₤ LIRA SIGN */
1555   { 0x20a5, 0x20a5 }, /*                    MillSign ₥ MILL SIGN */
1556   { 0x20a6, 0x20a6 }, /*                   NairaSign ₦ NAIRA SIGN */
1557   { 0x20a7, 0x20a7 }, /*                  PesetaSign ₧ PESETA SIGN */
1558   { 0x20a8, 0x20a8 }, /*                   RupeeSign ₨ RUPEE SIGN */
1559   { 0x0eff, 0x20a9 }, /*                  Korean_Won ₩ WON SIGN */
1560   { 0x20a9, 0x20a9 }, /*                     WonSign ₩ WON SIGN */
1561   { 0x20aa, 0x20aa }, /*               NewSheqelSign ₪ NEW SHEQEL SIGN */
1562   { 0x20ab, 0x20ab }, /*                    DongSign ₫ DONG SIGN */
1563   { 0x20ac, 0x20ac }, /*                    EuroSign € EURO SIGN */
1564   { 0x0ab8, 0x2105 }, /*                      careof ℅ CARE OF */
1565   { 0x06b0, 0x2116 }, /*                  numerosign № NUMERO SIGN */
1566   { 0x0afb, 0x2117 }, /*         phonographcopyright ℗ SOUND RECORDING COPYRIGHT */
1567   { 0x0ad4, 0x211e }, /*                prescription ℞ PRESCRIPTION TAKE */
1568   { 0x0ac9, 0x2122 }, /*                   trademark ™ TRADE MARK SIGN */
1569   { 0x0ab0, 0x2153 }, /*                    onethird ⅓ VULGAR FRACTION ONE THIRD */
1570   { 0x0ab1, 0x2154 }, /*                   twothirds ⅔ VULGAR FRACTION TWO THIRDS */
1571   { 0x0ab2, 0x2155 }, /*                    onefifth ⅕ VULGAR FRACTION ONE FIFTH */
1572   { 0x0ab3, 0x2156 }, /*                   twofifths ⅖ VULGAR FRACTION TWO FIFTHS */
1573   { 0x0ab4, 0x2157 }, /*                 threefifths ⅗ VULGAR FRACTION THREE FIFTHS */
1574   { 0x0ab5, 0x2158 }, /*                  fourfifths ⅘ VULGAR FRACTION FOUR FIFTHS */
1575   { 0x0ab6, 0x2159 }, /*                    onesixth ⅙ VULGAR FRACTION ONE SIXTH */
1576   { 0x0ab7, 0x215a }, /*                  fivesixths ⅚ VULGAR FRACTION FIVE SIXTHS */
1577   { 0x0ac3, 0x215b }, /*                   oneeighth ⅛ VULGAR FRACTION ONE EIGHTH */
1578   { 0x0ac4, 0x215c }, /*                threeeighths ⅜ VULGAR FRACTION THREE EIGHTHS */
1579   { 0x0ac5, 0x215d }, /*                 fiveeighths ⅝ VULGAR FRACTION FIVE EIGHTHS */
1580   { 0x0ac6, 0x215e }, /*                seveneighths ⅞ VULGAR FRACTION SEVEN EIGHTHS */
1581   { 0x08fb, 0x2190 }, /*                   leftarrow ← LEFTWARDS ARROW */
1582   { 0x08fc, 0x2191 }, /*                     uparrow ↑ UPWARDS ARROW */
1583   { 0x08fd, 0x2192 }, /*                  rightarrow → RIGHTWARDS ARROW */
1584   { 0x08fe, 0x2193 }, /*                   downarrow ↓ DOWNWARDS ARROW */
1585   { 0x08ce, 0x21d2 }, /*                     implies ⇒ RIGHTWARDS DOUBLE ARROW */
1586   { 0x08cd, 0x21d4 }, /*                    ifonlyif ⇔ LEFT RIGHT DOUBLE ARROW */
1587   { 0x08ef, 0x2202 }, /*           partialderivative ∂ PARTIAL DIFFERENTIAL */
1588   { 0x08c5, 0x2207 }, /*                       nabla ∇ NABLA */
1589   { 0x0bca, 0x2218 }, /*                         jot ∘ RING OPERATOR */
1590   { 0x08d6, 0x221a }, /*                     radical √ SQUARE ROOT */
1591   { 0x08c1, 0x221d }, /*                   variation ∝ PROPORTIONAL TO */
1592   { 0x08c2, 0x221e }, /*                    infinity ∞ INFINITY */
1593   { 0x08de, 0x2227 }, /*                  logicaland ∧ LOGICAL AND */
1594   { 0x0ba9, 0x2227 }, /*                     upcaret ∧ LOGICAL AND */
1595   { 0x08df, 0x2228 }, /*                   logicalor ∨ LOGICAL OR */
1596   { 0x0ba8, 0x2228 }, /*                   downcaret ∨ LOGICAL OR */
1597   { 0x08dc, 0x2229 }, /*                intersection ∩ INTERSECTION */
1598   { 0x0bc3, 0x2229 }, /*                      upshoe ∩ INTERSECTION */
1599   { 0x08dd, 0x222a }, /*                       union ∪ UNION */
1600   { 0x0bd6, 0x222a }, /*                    downshoe ∪ UNION */
1601   { 0x08bf, 0x222b }, /*                    integral ∫ INTEGRAL */
1602   { 0x08c0, 0x2234 }, /*                   therefore ∴ THEREFORE */
1603   { 0x08c8, 0x2245 }, /*                 approximate ≅ APPROXIMATELY EQUAL TO */
1604   { 0x08bd, 0x2260 }, /*                    notequal ≠ NOT EQUAL TO */
1605   { 0x08cf, 0x2261 }, /*                   identical ≡ IDENTICAL TO */
1606   { 0x08bc, 0x2264 }, /*               lessthanequal ≤ LESS-THAN OR EQUAL TO */
1607   { 0x08be, 0x2265 }, /*            greaterthanequal ≥ GREATER-THAN OR EQUAL TO */
1608   { 0x08da, 0x2282 }, /*                  includedin ⊂ SUBSET OF */
1609   { 0x0bda, 0x2282 }, /*                    leftshoe ⊂ SUBSET OF */
1610   { 0x08db, 0x2283 }, /*                    includes ⊃ SUPERSET OF */
1611   { 0x0bd8, 0x2283 }, /*                   rightshoe ⊃ SUPERSET OF */
1612   { 0x0bfc, 0x22a2 }, /*                   righttack ⊢ RIGHT TACK */
1613   { 0x0bdc, 0x22a3 }, /*                    lefttack ⊣ LEFT TACK */
1614   { 0x0bc2, 0x22a4 }, /*                    downtack ⊤ DOWN TACK */
1615   { 0x0bce, 0x22a5 }, /*                      uptack ⊥ UP TACK */
1616   { 0x0bd3, 0x2308 }, /*                     upstile ⌈ LEFT CEILING */
1617   { 0x0bc4, 0x230a }, /*                   downstile ⌊ LEFT FLOOR */
1618   { 0x0afa, 0x2315 }, /*           telephonerecorder ⌕ TELEPHONE RECORDER */
1619   { 0x08a4, 0x2320 }, /*                 topintegral ⌠ TOP HALF INTEGRAL */
1620   { 0x08a5, 0x2321 }, /*                 botintegral ⌡ BOTTOM HALF INTEGRAL */
1621   { 0x0abc, 0x2329 }, /*            leftanglebracket 〈 LEFT-POINTING ANGLE BRACKET */
1622   { 0x0abe, 0x232a }, /*           rightanglebracket 〉 RIGHT-POINTING ANGLE BRACKET */
1623   { 0x0bcc, 0x2395 }, /*                        quad ⎕ APL FUNCTIONAL SYMBOL QUAD (Unicode 3.0) */
1624   { 0x09e2, 0x2409 }, /*                          ht ␉ SYMBOL FOR HORIZONTAL TABULATION */
1625   { 0x09e5, 0x240a }, /*                          lf ␊ SYMBOL FOR LINE FEED */
1626   { 0x09e9, 0x240b }, /*                          vt ␋ SYMBOL FOR VERTICAL TABULATION */
1627   { 0x09e3, 0x240c }, /*                          ff ␌ SYMBOL FOR FORM FEED */
1628   { 0x09e4, 0x240d }, /*                          cr ␍ SYMBOL FOR CARRIAGE RETURN */
1629   { 0x09df, 0x2422 }, /*                       blank ␢ BLANK SYMBOL */
1630   { 0x09e8, 0x2424 }, /*                          nl ␤ SYMBOL FOR NEWLINE */
1631   { 0x09f1, 0x2500 }, /*              horizlinescan5 ─ BOX DRAWINGS LIGHT HORIZONTAL */
1632   { 0x08a6, 0x2502 }, /*               vertconnector │ BOX DRAWINGS LIGHT VERTICAL */
1633   { 0x09f8, 0x2502 }, /*                     vertbar │ BOX DRAWINGS LIGHT VERTICAL */
1634   { 0x09ec, 0x250c }, /*                upleftcorner ┌ BOX DRAWINGS LIGHT DOWN AND RIGHT */
1635   { 0x09eb, 0x2510 }, /*               uprightcorner ┐ BOX DRAWINGS LIGHT DOWN AND LEFT */
1636   { 0x09ed, 0x2514 }, /*               lowleftcorner └ BOX DRAWINGS LIGHT UP AND RIGHT */
1637   { 0x09ea, 0x2518 }, /*              lowrightcorner ┘ BOX DRAWINGS LIGHT UP AND LEFT */
1638   { 0x09f4, 0x251c }, /*                       leftt ├ BOX DRAWINGS LIGHT VERTICAL AND RIGHT */
1639   { 0x09f5, 0x2524 }, /*                      rightt ┤ BOX DRAWINGS LIGHT VERTICAL AND LEFT */
1640   { 0x09f7, 0x252c }, /*                        topt ┬ BOX DRAWINGS LIGHT DOWN AND HORIZONTAL */
1641   { 0x09f6, 0x2534 }, /*                        bott ┴ BOX DRAWINGS LIGHT UP AND HORIZONTAL */
1642   { 0x09ee, 0x253c }, /*               crossinglines ┼ BOX DRAWINGS LIGHT VERTICAL AND HORIZONTAL */
1643   { 0x09e1, 0x2592 }, /*                checkerboard ▒ MEDIUM SHADE */
1644   { 0x0adf, 0x25a0 }, /*                emfilledrect ■ BLACK SQUARE */
1645   { 0x0acf, 0x25a1 }, /*             emopenrectangle □ WHITE SQUARE */
1646   { 0x0ae7, 0x25aa }, /*            enfilledsqbullet ▪ BLACK SMALL SQUARE */
1647   { 0x0ae1, 0x25ab }, /*          enopensquarebullet ▫ WHITE SMALL SQUARE */
1648   { 0x0adb, 0x25ac }, /*            filledrectbullet ▬ BLACK RECTANGLE */
1649   { 0x0ae2, 0x25ad }, /*              openrectbullet ▭ WHITE RECTANGLE */
1650   { 0x0ae8, 0x25b2 }, /*           filledtribulletup ▲ BLACK UP-POINTING TRIANGLE */
1651   { 0x0ae3, 0x25b3 }, /*             opentribulletup △ WHITE UP-POINTING TRIANGLE */
1652   { 0x0add, 0x25b6 }, /*        filledrighttribullet ▶ BLACK RIGHT-POINTING TRIANGLE */
1653   { 0x0acd, 0x25b7 }, /*           rightopentriangle ▷ WHITE RIGHT-POINTING TRIANGLE */
1654   { 0x0ae9, 0x25bc }, /*         filledtribulletdown ▼ BLACK DOWN-POINTING TRIANGLE */
1655   { 0x0ae4, 0x25bd }, /*           opentribulletdown ▽ WHITE DOWN-POINTING TRIANGLE */
1656   { 0x0adc, 0x25c0 }, /*         filledlefttribullet ◀ BLACK LEFT-POINTING TRIANGLE */
1657   { 0x0acc, 0x25c1 }, /*            leftopentriangle ◁ WHITE LEFT-POINTING TRIANGLE */
1658   { 0x09e0, 0x25c6 }, /*                soliddiamond ◆ BLACK DIAMOND */
1659   { 0x0ace, 0x25cb }, /*                emopencircle ○ WHITE CIRCLE */
1660   { 0x0bcf, 0x25cb }, /*                      circle ○ WHITE CIRCLE */
1661   { 0x0ade, 0x25cf }, /*              emfilledcircle ● BLACK CIRCLE */
1662   { 0x0ae0, 0x25e6 }, /*            enopencircbullet ◦ WHITE BULLET */
1663   { 0x0ae5, 0x2606 }, /*                    openstar ☆ WHITE STAR */
1664   { 0x0af9, 0x260e }, /*                   telephone ☎ BLACK TELEPHONE */
1665   { 0x0aca, 0x2613 }, /*               signaturemark ☓ SALTIRE */
1666   { 0x0aea, 0x261c }, /*                 leftpointer ☜ WHITE LEFT POINTING INDEX */
1667   { 0x0aeb, 0x261e }, /*                rightpointer ☞ WHITE RIGHT POINTING INDEX */
1668   { 0x0af8, 0x2640 }, /*                femalesymbol ♀ FEMALE SIGN */
1669   { 0x0af7, 0x2642 }, /*                  malesymbol ♂ MALE SIGN */
1670   { 0x0aec, 0x2663 }, /*                        club ♣ BLACK CLUB SUIT */
1671   { 0x0aee, 0x2665 }, /*                       heart ♥ BLACK HEART SUIT */
1672   { 0x0aed, 0x2666 }, /*                     diamond ♦ BLACK DIAMOND SUIT */
1673   { 0x0af6, 0x266d }, /*                 musicalflat ♭ MUSIC FLAT SIGN */
1674   { 0x0af5, 0x266f }, /*                musicalsharp ♯ MUSIC SHARP SIGN */
1675   { 0x0af3, 0x2713 }, /*                   checkmark ✓ CHECK MARK */
1676   { 0x0af4, 0x2717 }, /*                 ballotcross ✗ BALLOT X */
1677   { 0x0ad9, 0x271d }, /*                  latincross ✝ LATIN CROSS */
1678   { 0x0af0, 0x2720 }, /*                maltesecross ✠ MALTESE CROSS */
1679   { 0x04a4, 0x3001 }, /*                  kana_comma 、 IDEOGRAPHIC COMMA */
1680   { 0x04a1, 0x3002 }, /*               kana_fullstop 。 IDEOGRAPHIC FULL STOP */
1681   { 0x04a2, 0x300c }, /*         kana_openingbracket 「 LEFT CORNER BRACKET */
1682   { 0x04a3, 0x300d }, /*         kana_closingbracket 」 RIGHT CORNER BRACKET */
1683   { 0x04de, 0x309b }, /*                 voicedsound ゛ KATAKANA-HIRAGANA VOICED SOUND MARK */
1684   { 0x04df, 0x309c }, /*             semivoicedsound ゜ KATAKANA-HIRAGANA SEMI-VOICED SOUND MARK */
1685   { 0x04a7, 0x30a1 }, /*                      kana_a ァ KATAKANA LETTER SMALL A */
1686   { 0x04b1, 0x30a2 }, /*                      kana_A ア KATAKANA LETTER A */
1687   { 0x04a8, 0x30a3 }, /*                      kana_i ィ KATAKANA LETTER SMALL I */
1688   { 0x04b2, 0x30a4 }, /*                      kana_I イ KATAKANA LETTER I */
1689   { 0x04a9, 0x30a5 }, /*                      kana_u ゥ KATAKANA LETTER SMALL U */
1690   { 0x04b3, 0x30a6 }, /*                      kana_U ウ KATAKANA LETTER U */
1691   { 0x04aa, 0x30a7 }, /*                      kana_e ェ KATAKANA LETTER SMALL E */
1692   { 0x04b4, 0x30a8 }, /*                      kana_E エ KATAKANA LETTER E */
1693   { 0x04ab, 0x30a9 }, /*                      kana_o ォ KATAKANA LETTER SMALL O */
1694   { 0x04b5, 0x30aa }, /*                      kana_O オ KATAKANA LETTER O */
1695   { 0x04b6, 0x30ab }, /*                     kana_KA カ KATAKANA LETTER KA */
1696   { 0x04b7, 0x30ad }, /*                     kana_KI キ KATAKANA LETTER KI */
1697   { 0x04b8, 0x30af }, /*                     kana_KU ク KATAKANA LETTER KU */
1698   { 0x04b9, 0x30b1 }, /*                     kana_KE ケ KATAKANA LETTER KE */
1699   { 0x04ba, 0x30b3 }, /*                     kana_KO コ KATAKANA LETTER KO */
1700   { 0x04bb, 0x30b5 }, /*                     kana_SA サ KATAKANA LETTER SA */
1701   { 0x04bc, 0x30b7 }, /*                    kana_SHI シ KATAKANA LETTER SI */
1702   { 0x04bd, 0x30b9 }, /*                     kana_SU ス KATAKANA LETTER SU */
1703   { 0x04be, 0x30bb }, /*                     kana_SE セ KATAKANA LETTER SE */
1704   { 0x04bf, 0x30bd }, /*                     kana_SO ソ KATAKANA LETTER SO */
1705   { 0x04c0, 0x30bf }, /*                     kana_TA タ KATAKANA LETTER TA */
1706   { 0x04c1, 0x30c1 }, /*                    kana_CHI チ KATAKANA LETTER TI */
1707   { 0x04af, 0x30c3 }, /*                    kana_tsu ッ KATAKANA LETTER SMALL TU */
1708   { 0x04c2, 0x30c4 }, /*                    kana_TSU ツ KATAKANA LETTER TU */
1709   { 0x04c3, 0x30c6 }, /*                     kana_TE テ KATAKANA LETTER TE */
1710   { 0x04c4, 0x30c8 }, /*                     kana_TO ト KATAKANA LETTER TO */
1711   { 0x04c5, 0x30ca }, /*                     kana_NA ナ KATAKANA LETTER NA */
1712   { 0x04c6, 0x30cb }, /*                     kana_NI ニ KATAKANA LETTER NI */
1713   { 0x04c7, 0x30cc }, /*                     kana_NU ヌ KATAKANA LETTER NU */
1714   { 0x04c8, 0x30cd }, /*                     kana_NE ネ KATAKANA LETTER NE */
1715   { 0x04c9, 0x30ce }, /*                     kana_NO ノ KATAKANA LETTER NO */
1716   { 0x04ca, 0x30cf }, /*                     kana_HA ハ KATAKANA LETTER HA */
1717   { 0x04cb, 0x30d2 }, /*                     kana_HI ヒ KATAKANA LETTER HI */
1718   { 0x04cc, 0x30d5 }, /*                     kana_FU フ KATAKANA LETTER HU */
1719   { 0x04cd, 0x30d8 }, /*                     kana_HE ヘ KATAKANA LETTER HE */
1720   { 0x04ce, 0x30db }, /*                     kana_HO ホ KATAKANA LETTER HO */
1721   { 0x04cf, 0x30de }, /*                     kana_MA マ KATAKANA LETTER MA */
1722   { 0x04d0, 0x30df }, /*                     kana_MI ミ KATAKANA LETTER MI */
1723   { 0x04d1, 0x30e0 }, /*                     kana_MU ム KATAKANA LETTER MU */
1724   { 0x04d2, 0x30e1 }, /*                     kana_ME メ KATAKANA LETTER ME */
1725   { 0x04d3, 0x30e2 }, /*                     kana_MO モ KATAKANA LETTER MO */
1726   { 0x04ac, 0x30e3 }, /*                     kana_ya ャ KATAKANA LETTER SMALL YA */
1727   { 0x04d4, 0x30e4 }, /*                     kana_YA ヤ KATAKANA LETTER YA */
1728   { 0x04ad, 0x30e5 }, /*                     kana_yu ュ KATAKANA LETTER SMALL YU */
1729   { 0x04d5, 0x30e6 }, /*                     kana_YU ユ KATAKANA LETTER YU */
1730   { 0x04ae, 0x30e7 }, /*                     kana_yo ョ KATAKANA LETTER SMALL YO */
1731   { 0x04d6, 0x30e8 }, /*                     kana_YO ヨ KATAKANA LETTER YO */
1732   { 0x04d7, 0x30e9 }, /*                     kana_RA ラ KATAKANA LETTER RA */
1733   { 0x04d8, 0x30ea }, /*                     kana_RI リ KATAKANA LETTER RI */
1734   { 0x04d9, 0x30eb }, /*                     kana_RU ル KATAKANA LETTER RU */
1735   { 0x04da, 0x30ec }, /*                     kana_RE レ KATAKANA LETTER RE */
1736   { 0x04db, 0x30ed }, /*                     kana_RO ロ KATAKANA LETTER RO */
1737   { 0x04dc, 0x30ef }, /*                     kana_WA ワ KATAKANA LETTER WA */
1738   { 0x04a6, 0x30f2 }, /*                     kana_WO ヲ KATAKANA LETTER WO */
1739   { 0x04dd, 0x30f3 }, /*                      kana_N ン KATAKANA LETTER N */
1740   { 0x04a5, 0x30fb }, /*            kana_conjunctive ・ KATAKANA MIDDLE DOT */
1741   { 0x04b0, 0x30fc }, /*              prolongedsound ー KATAKANA-HIRAGANA PROLONGED SOUND MARK */
1742   { 0x0ea1, 0x3131 }, /*               Hangul_Kiyeog ㄱ HANGUL LETTER KIYEOK */
1743   { 0x0ea2, 0x3132 }, /*          Hangul_SsangKiyeog ㄲ HANGUL LETTER SSANGKIYEOK */
1744   { 0x0ea3, 0x3133 }, /*           Hangul_KiyeogSios ㄳ HANGUL LETTER KIYEOK-SIOS */
1745   { 0x0ea4, 0x3134 }, /*                Hangul_Nieun ㄴ HANGUL LETTER NIEUN */
1746   { 0x0ea5, 0x3135 }, /*           Hangul_NieunJieuj ㄵ HANGUL LETTER NIEUN-CIEUC */
1747   { 0x0ea6, 0x3136 }, /*           Hangul_NieunHieuh ㄶ HANGUL LETTER NIEUN-HIEUH */
1748   { 0x0ea7, 0x3137 }, /*               Hangul_Dikeud ㄷ HANGUL LETTER TIKEUT */
1749   { 0x0ea8, 0x3138 }, /*          Hangul_SsangDikeud ㄸ HANGUL LETTER SSANGTIKEUT */
1750   { 0x0ea9, 0x3139 }, /*                Hangul_Rieul ㄹ HANGUL LETTER RIEUL */
1751   { 0x0eaa, 0x313a }, /*          Hangul_RieulKiyeog ㄺ HANGUL LETTER RIEUL-KIYEOK */
1752   { 0x0eab, 0x313b }, /*           Hangul_RieulMieum ㄻ HANGUL LETTER RIEUL-MIEUM */
1753   { 0x0eac, 0x313c }, /*           Hangul_RieulPieub ㄼ HANGUL LETTER RIEUL-PIEUP */
1754   { 0x0ead, 0x313d }, /*            Hangul_RieulSios ㄽ HANGUL LETTER RIEUL-SIOS */
1755   { 0x0eae, 0x313e }, /*           Hangul_RieulTieut ㄾ HANGUL LETTER RIEUL-THIEUTH */
1756   { 0x0eaf, 0x313f }, /*          Hangul_RieulPhieuf ㄿ HANGUL LETTER RIEUL-PHIEUPH */
1757   { 0x0eb0, 0x3140 }, /*           Hangul_RieulHieuh ㅀ HANGUL LETTER RIEUL-HIEUH */
1758   { 0x0eb1, 0x3141 }, /*                Hangul_Mieum ㅁ HANGUL LETTER MIEUM */
1759   { 0x0eb2, 0x3142 }, /*                Hangul_Pieub ㅂ HANGUL LETTER PIEUP */
1760   { 0x0eb3, 0x3143 }, /*           Hangul_SsangPieub ㅃ HANGUL LETTER SSANGPIEUP */
1761   { 0x0eb4, 0x3144 }, /*            Hangul_PieubSios ㅄ HANGUL LETTER PIEUP-SIOS */
1762   { 0x0eb5, 0x3145 }, /*                 Hangul_Sios ㅅ HANGUL LETTER SIOS */
1763   { 0x0eb6, 0x3146 }, /*            Hangul_SsangSios ㅆ HANGUL LETTER SSANGSIOS */
1764   { 0x0eb7, 0x3147 }, /*                Hangul_Ieung ㅇ HANGUL LETTER IEUNG */
1765   { 0x0eb8, 0x3148 }, /*                Hangul_Jieuj ㅈ HANGUL LETTER CIEUC */
1766   { 0x0eb9, 0x3149 }, /*           Hangul_SsangJieuj ㅉ HANGUL LETTER SSANGCIEUC */
1767   { 0x0eba, 0x314a }, /*                Hangul_Cieuc ㅊ HANGUL LETTER CHIEUCH */
1768   { 0x0ebb, 0x314b }, /*               Hangul_Khieuq ㅋ HANGUL LETTER KHIEUKH */
1769   { 0x0ebc, 0x314c }, /*                Hangul_Tieut ㅌ HANGUL LETTER THIEUTH */
1770   { 0x0ebd, 0x314d }, /*               Hangul_Phieuf ㅍ HANGUL LETTER PHIEUPH */
1771   { 0x0ebe, 0x314e }, /*                Hangul_Hieuh ㅎ HANGUL LETTER HIEUH */
1772   { 0x0ebf, 0x314f }, /*                    Hangul_A ㅏ HANGUL LETTER A */
1773   { 0x0ec0, 0x3150 }, /*                   Hangul_AE ㅐ HANGUL LETTER AE */
1774   { 0x0ec1, 0x3151 }, /*                   Hangul_YA ㅑ HANGUL LETTER YA */
1775   { 0x0ec2, 0x3152 }, /*                  Hangul_YAE ㅒ HANGUL LETTER YAE */
1776   { 0x0ec3, 0x3153 }, /*                   Hangul_EO ㅓ HANGUL LETTER EO */
1777   { 0x0ec4, 0x3154 }, /*                    Hangul_E ㅔ HANGUL LETTER E */
1778   { 0x0ec5, 0x3155 }, /*                  Hangul_YEO ㅕ HANGUL LETTER YEO */
1779   { 0x0ec6, 0x3156 }, /*                   Hangul_YE ㅖ HANGUL LETTER YE */
1780   { 0x0ec7, 0x3157 }, /*                    Hangul_O ㅗ HANGUL LETTER O */
1781   { 0x0ec8, 0x3158 }, /*                   Hangul_WA ㅘ HANGUL LETTER WA */
1782   { 0x0ec9, 0x3159 }, /*                  Hangul_WAE ㅙ HANGUL LETTER WAE */
1783   { 0x0eca, 0x315a }, /*                   Hangul_OE ㅚ HANGUL LETTER OE */
1784   { 0x0ecb, 0x315b }, /*                   Hangul_YO ㅛ HANGUL LETTER YO */
1785   { 0x0ecc, 0x315c }, /*                    Hangul_U ㅜ HANGUL LETTER U */
1786   { 0x0ecd, 0x315d }, /*                  Hangul_WEO ㅝ HANGUL LETTER WEO */
1787   { 0x0ece, 0x315e }, /*                   Hangul_WE ㅞ HANGUL LETTER WE */
1788   { 0x0ecf, 0x315f }, /*                   Hangul_WI ㅟ HANGUL LETTER WI */
1789   { 0x0ed0, 0x3160 }, /*                   Hangul_YU ㅠ HANGUL LETTER YU */
1790   { 0x0ed1, 0x3161 }, /*                   Hangul_EU ㅡ HANGUL LETTER EU */
1791   { 0x0ed2, 0x3162 }, /*                   Hangul_YI ㅢ HANGUL LETTER YI */
1792   { 0x0ed3, 0x3163 }, /*                    Hangul_I ㅣ HANGUL LETTER I */
1793   { 0x0eef, 0x316d }, /*     Hangul_RieulYeorinHieuh ㅭ HANGUL LETTER RIEUL-YEORINHIEUH */
1794   { 0x0ef0, 0x3171 }, /*    Hangul_SunkyeongeumMieum ㅱ HANGUL LETTER KAPYEOUNMIEUM */
1795   { 0x0ef1, 0x3178 }, /*    Hangul_SunkyeongeumPieub ㅸ HANGUL LETTER KAPYEOUNPIEUP */
1796   { 0x0ef2, 0x317f }, /*              Hangul_PanSios ㅿ HANGUL LETTER PANSIOS */
1797   { 0x0ef4, 0x3184 }, /*   Hangul_SunkyeongeumPhieuf ㆄ HANGUL LETTER KAPYEOUNPHIEUPH */
1798   { 0x0ef5, 0x3186 }, /*          Hangul_YeorinHieuh ㆆ HANGUL LETTER YEORINHIEUH */
1799   { 0x0ef6, 0x318d }, /*                Hangul_AraeA ㆍ HANGUL LETTER ARAEA */
1800   { 0x0ef7, 0x318e }, /*               Hangul_AraeAE ㆎ HANGUL LETTER ARAEAE */
1801 };
1802
1803 /**
1804  * unicode_to_keysym:
1805  * @wc: a ISO10646 encoded character
1806  * 
1807  * Convert from a ISO10646 character to a key symbol.
1808  * 
1809  * Return value: the corresponding key symbol, if one exists.
1810  *               or, if there is no corresponding symbol, 
1811  *               wc | 0x01000000
1812  **/
1813 KeySym unicode_to_keysym (Uint32 wc)
1814 {
1815   int min = 0;
1816   int max = countof(unicode_to_keysym_tab) - 1;
1817   int mid;
1818
1819   /* First check for Latin-1 characters (1:1 mapping) */
1820   if ((wc >= 0x0020 && wc <= 0x007e) ||
1821       (wc >= 0x00a0 && wc <= 0x00ff))
1822     return wc;
1823
1824   /* Binary search in table */
1825   while (max >= min) {
1826     mid = (min + max) / 2;
1827     if (unicode_to_keysym_tab[mid].ucs < wc)
1828       min = mid + 1;
1829     else if (unicode_to_keysym_tab[mid].ucs > wc)
1830       max = mid - 1;
1831     else {
1832       /* found it */
1833       return unicode_to_keysym_tab[mid].keysym;
1834     }
1835   }
1836   
1837   /*
1838    * No matching keysym value found, return Unicode value plus 0x01000000
1839    * (a convention introduced in the UTF-8 work on xterm).
1840    */
1841   return wc | 0x01000000;
1842 }
1843