21xrx.com
2024-03-29 15:05:19 Friday
登录
  

HTML 编码(字符集)

为了正确的显示HTML页面,浏览器必须知道页面的字符集(编码).

什么是字符编码?

ASCII是第一个标准字符编码(也叫字符集).它定义了127个不同的字母或数字用于因特网.

ASCII编码支持数字(0-9),英文字母(A-Z),和其它一些特殊字符:! % + - ( ) @ < > .

ANSI(Windows-1252)是Windows系统的集成字符集.它支持256个不同的字符编码.

ISO-8859-1编码是HTML4的默认字符集.他也支持256个不同的字符编码.

因为ANSI和ISO都有限制,所以在HTML5里默认字符编码改为了UTF-8编码.

UTF-8(Unicode:统一码)几乎覆盖了世界上的所有字符和符号.

  
所有的HTML4解析器也支持UTF-8.

HTML字符集属性

为了正确的显示HTML页面,网页浏览器必须知道页面用的什么字符集.

在<meta>标签里指定页面用什么字符集:

HTML 4:

HTML 5:

  
如果浏览器在页面用的是ISO-8859-1编码,浏览器会默认为ANSI,因为ANSI和ISO-8859-1完全一样,除了ANSI有32个扩展字符.

数字所对应的字符:

数字字符
{{n}}{{String.fromCharCode(n)}}

ASCII字符集

ASCII用0-31(和127)用来作为控制字符

ASCII用32-126作为字母,数字和符号

ASCII不用128-255之间的数字

ANSI字符集(Windows-1252)

ANSI的0-127之间的值和ASCII完全一样.

ANSI从127到159之间的数字是专属字符集.

ANSI的160-255之间的值和UTF-8完全一样.

ISO-8859-1字符集

8859-1的0到127之间的字符和ASCII完全一样.

8859-1不用128到159之间的值

8859-1的160到255之间的字符和UTF-8完全一样.

UTF-8字符集

UTF-8的0-127之间的字符和ASCII完全一样.

UTF-8不用128到159之间的值.

UTF-8的160-255之间的字符和ANSI、8859-1完全一样.

UTF-8的256-10000有更多的不同的字符.

为了更好学习字符集,可以看我们完整的HTML字符集参考.

  
  

评论区

{{item['qq_nickname']}}
()
回复
回复
21技术    www.21xrx.com 备案号:蜀ICP备17043188号-2