コンピューターで全漢字使用可に 6万字コード化


▼ページ最下部
001 2017/12/24(日) 21:22:30 ID:YW0cZQ5VsI
日本語の漢字は、戸籍などに使われているものも含めると6万字あるのに対し、コンピューターは、実は1万字しか扱うことができません。これに対し、このほど15年越しの作業の末、6万字すべてが統一の規格にまとめられて、コンピューターがすべての漢字を扱えるようになり、ビッグデータの活用をはじめさまざまな効果が期待されています。

コンピューターで文字を扱うには、1つ1つの文字に、「コード」と呼ばれる世界共通の番号を割りふる必要がありますが、日本語の漢字で、コードが割りふられているのは1万字だけで、コードが無く、コンピューターが扱えない「外字」は、戸籍で使われているものをはじめおよそ5万字に上っています。

中には、メーカーなどが独自に対応した外字もありますが、コードが無いために、メーカーごとの互換性が無く、データを受け渡してもコンピューターが認識できずに「文字化け」してしまったり、ある人の名前に本名の外字を充てたものと略字を充てたものの2つのデータがあった場合、コンピューター上では、別の人と認識されてしまったりするなどの問題が起きていました。

このためIPA=情報処理推進機構は平成14年から、経済産業省とともに外字を含めたおよそ6万字の漢字1つ1つに、コードを割りつける作業を進めた結果、このほど15年越しでようやく完了し、国際規格として登録されました。

この結果「日本語の壁」の1つが取り払われ、外字が使われた名前を正確に表示できたり、地名を含むビッグデータを正確に分析できたりするなどの効果が期待されています。

IPAの田代秀一参与は「日本人にとって、名前は大事なアイデンティティーで、戸籍では尊重されているがコンピューターが追いついていなかった。文字を正確に扱えるようにすることは、今後ますます重要になる」と話しています。
https://www3.nhk.or.jp/news/html/20171224/k1001127011...

返信する

※省略されてます すべて表示...
018 2017/12/29(金) 13:52:40 ID:RuC5mIdT06
姓の漢字で、本家と分家で違う漢字にしたというのもあるからな
崎だったら、つくりの字を少し変えたり、山を上に持って行ったり

返信する


▲ページ最上部

ログサイズ:9 KB 有効レス数:17 削除レス数:1





ニュースIT・科学掲示板に戻る 全部 前100 次100 最新50

スレッドタイトル:コンピューターで全漢字使用可に 6万字コード化

レス投稿

未ログイン (ログイン

↑画像ファイル(jpg,gif,png)