Наткнулся на старый топик.
Все не совсем так, как тут пишут.
Всех иероглифов - китайских (старых традиционных и упрощенных), японских, корейских и вьетнамских + диалектные формы + архаические + неупотребительные (какой-нибудь буддийский монах придумал, два раза нарисовал в своей древней рукописи - и финиш) порядка 120 тысяч.
В обиходе люди среднего интеллектуального уровня обходятся парой тысяч.
Набирать на евроклавиатуре можно несколькимии способами - есть способы по фонетической системе, есть способы идущие от графики.
Преобладают фонетические системы, т.е. в ОС есть база данных иероглифов с вариантами чтения, вы бьете в той или иной фонетической системе звучание слова, а машина "подсовывает" несколько вариантов знака. Вы выбираете нужный.
А еще в Windows 2000, XP и в Proofing Tools (2000, XP, 2003) есть маленькая примочка - IME Pad. Рисуете черта за чертой иероглиф, а компьютер угадывает по вашему рисунку знак, типа как при OCR.
В пруфинг тулах 2003 эта возможность распространена не только на японский, как раньше, а еще на 2 варианта китайских иероглифов. И есть прямая вставка нарисованного мышью или дигитайзером знака.
Кстати, последние версии кодировок Юникода содержат более 70 тысяч иероглифов.
Можете посмотреть на сайте
www.unicode.org базу данных в файле Uhihan.txt (порядка 30 МБ)
<добавлено позже> И еще: иероглифы неодинаковы по своей типизации.
Есть три типа:
а) пиктограмма-картинка - например, иероглиф для "сердца", "человека" и еще многие. Это просто трансформировавшееся за века символическое изображение, имевшее вначале ритуально-сакральный характер. Ведь "иероглиф" в переводе с греческого - священный знак.
б) идеограмма. Типичные примеры - иероглифы "государство", "любовь", "преданность сюзерену". На первом изображен воин с алебардой, охраняющий рубежи, внутри которых - квадратик чек рисового поля. На втором - вверху "когти", под ними "сердце", а внизу сплющенная по вертикали "женщина". Ну и третий: сверху "средина", внизу "сердце".
и в) фоноидеограммы. Это соединение б) с иероглифом-фонетиком, определяющим чтение знака.