文字コード

コンピュータは(というかC++やC言語で文字を扱う場合は)、ある二進数を特定の文字だと思いこんで処理する約束になっている。このように,文字を表現するために文字と1対1で割り当てられた符号のことを文字コードと呼ぶ。

文字と符号の対応表のことを文字コード表と呼ぶ。使う文字種によってさまざまな文字コード表が存在するが、特にアルファベットと記号ではASCII(アスキー)コード表が使用される。

Fig. 1: アスキーコード表
00~1Fまでは、エスケープシーケンスが含まれている

<html> <hr size=1> <h2>制御符号(エスケープシーケンス)</h2> <div>

<tr><td width=25% valign=top> <ul> <li><b>NUL</b> ヌル(空文字) <li><b>SOH</b> ヘディング開始 <li><b>STX</b> テキスト開始 <li><b>ETX(^C)</b> テキスト終了 <li><b>EOT(^D)</b> 伝送終了 <li><b>ENQ</b> 問い合わせ <li><b>ACK</b> 肯定応答 <li><b>BEL(^G)</b> ベル <li><b>BS(^H)</b> バックスペース <li><b>HT(^I,&#x005c;t)</b> 水平タブ <li><b>LF/NL(^J,&#x005c;n)</b> 復帰/改行 <li><b>VT</b> 垂直タブ <li><b>FF</b> 改ページ <li><b>CR(^M,&#x005c;r)</b> 復帰 <li><b>SO</b> シフトアウト <li><b>SI</b> シフトイン <li><b>DLE</b> データリンクでの拡張 </ul> </td> <td width=25% valign=top> <ul> <li><b>DC1</b> 制御装置1 <li><b>DC2</b> 制御装置2 <li><b>DC3</b> 制御装置3 <li><b>DC4</b> 制御装置4 <li><b>NAC</b> 否定応答 <li><b>SYN</b> 同期文字 <li><b>ETB</b> 伝送ブロック終了 <li><b>CAN</b> 取消 <li><b>EM</b> 媒体終端 <li><b>SUB(^Z)</b> Windowsファイルの終端コード <li><b>ESC</b> (制御コード)拡張 <li><b>FS</b> ファイルセパレータ <li><b>GS</b> グループセパレータ <li><b>RS</b> レコードセパレータ <li><b>US</b> ユニットセパレータ <li><b>SP</b> (半角)スペース <li><b>DEL</b> 削除 </ul> </td></tr>

</html>