2ntブログ

なぜコンピュータの世界には全角文字と半角文字があるのか?

コンピュータは欧米で発明されたものなので、表示できる文字も英字だけでした。
コンピュータは絵でも文字でも全て「ドット」と言われる小さな四角の点の集まりで表示します。
英字は形が単純なので、縦8横4ドットで全てのアルファベットを表現する事ができました。
数字や一部の記号もそうです。
しかし日本語は漢字はもちろんのこと、ひらがなもカタカナも英字に比べて非常に複雑な形をしており、とても8×4ドットでは表現できません。
そこで表示できる文字数を犠牲にして、16×16ドットで表現する事にしました。
昔のパソコンやファミコンなどのゲーム機で、日本語の文字が英字に比べて縦2倍、横4倍の大きさで表示されるのはこのためです。

この8×4ドット(全角文字登場後は16×8ドット)で表現できる、表現している文字を「半角」文字、英語やそれに類似する文字以外の複雑な形をした日本語と一部の外国の文字(ハングルやアラビア文字など)、16×16ドットでないと表現できない文字を「全角」文字と言います。
ちなみにアルファベットや数字も、ワープロなどの文書で文字の大きさが違うと行が揃わないなどの問題が出るので「全角」文字が用意はされています。

なおコンピュータは文字をそのままグラフィックデータとして保存はしません。
文字には文字コードと呼ばれる番号が割り振ってあって、そのコード番号で保存しています。
この番号も半角文字は1バイトしか使いません。
アルファベットはA~Zまで26種類しかありません。
大文字・小文字両方でも52種類です。
それに数字や一部の「!」とか「?」とか「.」とかの英語の文章で使われる記号、あるいは計算記号などを入れても256種類未満です(1バイトは10進数で0~255までの256種類の数値が保存できるので)。
しかし全角文字は種類が多いのでとても1バイトには収まりません。
ひらがなだけでも「50音」と言われるようにアルファベットの大文字・小文字両方をあわせた並の種類があり、これに加えてカタカナがあり、そしてそれらより遥かに種類の多い「漢字」があります。
なので日本語の文字コードは2バイト使います。
表現するにも英数字の倍以上のドットを使い、データとして保存するにも英数字の2倍以上の容量を使う。
これがコンピュータの、プログラムの世界で日本語が使われ難い理由です。

この文章も英語で書けばぴったり1/2のデータ量にはならないにしても、確実に少ないデータ量になります。

コンピュータにはなぜ「半角」と「全角」の2種類の文字があるのかのお話しでした。

コメントの投稿

非公開コメント

カウンタ
プロフィール

ウホッ!いい男

Author:ウホッ!いい男
異世界転生を待ち続ける中高年のおっさん

最新記事
最新コメント
最新トラックバック
月別アーカイブ
カテゴリ
検索フォーム
RSSリンクの表示
リンク
ブロとも申請フォーム

この人とブロともになる

QRコード
QR