之前学习前端中,对meta标签的了解仅仅只是这一句。
但是打开任意的网站,其head标签内都有一列的meta标签。比如我博客的。
但是自己却很不熟悉,于是把meta标签加入了寒假学习计划的最前方。
简介
在查阅w3school中,第一句话中的“元数据”就让我开始了Google之旅。然后很顺利的在英文版的w3school找到了想要的结果。(中文w3school说的是元信息,Google和百度都没有相关的词条。但元数据在Google就有详细解释。所以这儿采用英文版W3school的解释。)
The <meta> tag provides metadata about the HTML document. Metadata will not be displayed on the page, but will be machine parsable.
不难看出,其中的关键是metadata,中文名叫元数据,是用于描述数据的数据。它不会显示在页面上,但是机器却可以识别。这么一来meta标签的作用方式就很好理解了。
用处
Meta elements are typically used to specify page description, keywords, author of the document, last modified, and other metadata.
The metadata can be used by browsers (how to display content or reload page), search engines (keywords), or other web services
这句话对meta标签用处的介绍,简洁明了。翻译过来就是:meta常用于定义页面的说明,关键字,最后修改日期,和其它的元数据。这些元数据将服务于浏览器(如何布局或重载页面),搜索引擎和其它网络服务。
组成
meta标签共有两个属性,分别是http-equiv属性和name属性。
1. name属性
name属性主要用于描述网页,比如网页的关键词,叙述等。与之对应的属性值为content,content中的内容是对name填入类型的具体描述,便于搜索引擎抓取。meta标签中name属性语法格式是:
。
其中name属性共有以下几种参数。 (A-C为常用属性)
A. keywords(关键字)
说明:用于告诉搜索引擎,你网页的关键字。举例:
B. description(网站内容的描述)
说明:用于告诉搜索引擎,你网站的主要内容。举例:
C. viewport(移动端的窗口)
说明:这个概念较为复杂,具体的会在下篇博文中讲述。这个属性常用于设计移动端网页。在用bootstrap,AmazeUI等框架时候都有用过viewport。
举例(常用范例):
D. robots(定义搜索引擎爬虫的索引方式)
说明:robots用来告诉爬虫哪些页面需要索引,哪些页面不需要索引。content的参数有all,none,index,noindex,follow,nofollow。默认是all。
举例:
具体参数如下:
1.none : 搜索引擎将忽略此网页,等价于noindex,nofollow。
2.noindex : 搜索引擎不索引此网页。
3.nofollow: 搜索引擎不继续通过此网页的链接索引搜索其它的网页。
4.all : 搜索引擎将索引此网页与继续通过此网页的链接索引,等价于index,follow。
5.index : 搜索引擎索引此网页。
6.follow : 搜索引擎继续通过此网页的链接索引搜索其它的网页。
E. author(作者)
说明:用于标注网页作者举例:
F. generator(网页制作软件)
说明:用于标明网页是什么软件做的举例(不知道能不能这样写):
G. copyright(版权)
说明:用于标注版权信息举例:
//代表该网站为Lxxyx个人版权所有。
H. revisit-after(搜索引擎爬虫重访时间)
说明:如果页面不是经常更新,为了减轻搜索引擎爬虫对服务器带来的压力,可以设置一个爬虫的重访时间。如果重访时间过短,爬虫将按它们定义的默认时间来访问。举例:
I. renderer(双核浏览器渲染方式)
说明:renderer是为双核浏览器准备的,用于指定双核浏览器默认以何种方式渲染页面。比如说360浏览器。举例:
//默认webkit内核 //默认IE兼容模式 //默认IE标准模式
2. http-equiv属性
介绍之前,先说个小插曲。看文档和博客关于http-equiv的介绍时,有这么一句。
http-equiv顾名思义,相当于http的文件头作用。
一开始看到这句话的时候,我是迷糊的。因为我看各类技术名词,都会习惯性的去记住它的英文全称。equiv的全称是"equivalent",意思是相等,相当于。然后我脑子里出现了大大的迷惑:“HTTP相等?”
后来还准备去Segmentfault提问来着。结果在写问题的时候,突然反应出equivalent还有相当于的意思。意思就是相当于http的作用。至于文件头是哪儿出来的,估计是从其作用来分析的。我认为顾名思义并不能得出"相当于http的文件头作用"这个论断。
这个我所认为的http-equiv意思的简介。
相当于HTTP的作用,比如说定义些HTTP参数啥的。
meta标签中http-equiv属性语法格式是:
其中http-equiv属性主要有以下几种参数:
A. content-Type(设定网页字符集)(推荐使用HTML5的方式)
说明:用于设定网页字符集,便于浏览器解析与渲染页面举例:
//旧的HTML,不推荐 //HTML5设定网页字符集的方式,推荐使用UTF-8
B. X-UA-Compatible(浏览器采取何种版本渲染当前页面)
说明:用于告知浏览器以何种版本来渲染页面。(一般都设置为最新模式,在各大框架中这个设置也很常见。)举例:
//指定IE和Chrome使用最新版本渲染当前页面
C. cache-control(指定请求和响应遵循的缓存机制)
用法1.
说明:指导浏览器如何缓存某个响应以及缓存多长时间。这一段内容我在网上找了很久,但都没有找到满意的。最后终于在Google Developers中发现了我想要的答案。
举例:
共有以下几种用法:
-
no-cache: 先发送请求,与服务器确认该资源是否被更改,如果未被更改,则使用缓存。
-
no-store: 不允许缓存,每次都要去服务器上,下载完整的响应。(安全措施)
-
public : 缓存所有响应,但并非必须。因为max-age也可以做到相同效果
-
private : 只为单个用户缓存,因此不允许任何中继进行缓存。(比如说CDN就不允许缓存private的响应)
-
maxage : 表示当前请求开始,该响应在多久内能被缓存和重用,而不去服务器重新请求。例如:max-age=60表示响应可以再缓存和重用 60 秒。
用法2.(禁止百度自动转码)
说明:用于禁止当前页面在移动端浏览时,被百度自动转码。虽然百度的本意是好的,但是转码效果很多时候却不尽人意。所以可以在head中加入例子中的那句话,就可以避免百度自动转码了。举例:
D. expires(网页到期时间)
说明:用于设定网页的到期时间,过期后网页必须到服务器上重新传输。举例:
E. refresh(自动刷新并指向某页面)
说明:网页将在设定的时间内,自动刷新并调向设定的网址。举例:
//意思是2秒后跳转向我的博客
F. Set-Cookie(cookie设定)
说明:如果网页过期。那么这个网页存在本地的cookies也会被自动删除。
//格式 //具体范例
最后
暂时总结的就这么多了,meta标签的自定义属性实在太多了。所以只去找了常用的一些,还有像 Window-target
这样已经基本被废弃的属性,我也没有添加。
meta标签作用
META标签是HTML标记HEAD区的一个关键标签,提供文档字符集、使用语言、作者等基本信息,以及对关键词和网页等级的设定等,最大的作用是能够做搜索引擎优化(SEO)。
PS:便于搜索引擎机器人查找、分类,互联网应用应该要注意。
大网站都是怎么写?
在了解这个标签之前,我查找了各个主流网站他们的对于Meta的设置,如下:
京东首页的Meta设置:
淘宝首页的Meta设置:
youku首页的Meta设置:
斗鱼首页的Meta设置:
腾讯网首页的Meta设置:
起点小说网首页的Meta设置:
meta详解
meta标签可分为两大部分:http-equiv和name变量。
http-equiv
http-equiv相当于http的文件头作用,它可以向浏览器传回一些有用的信息,以帮助浏览器正确地显示网页内容。
值 | 描述 | 例子 |
content-type | 设定页面使用的字符集 | GB2312时,代表说明网站是采用的编码是简体中文; ISO-8859-1时,代表说明网站是采用的编码是英文; UTF-8时,代表世界通用的语言编码; PS:html5页面的做法是直接使用<meta charset="utf-8"/> |
X-UA-Compatible | IE8的专用标记,用来指定IE8浏览器去模拟某个特定版本的IE浏览器的渲染方式,以此来解决部分兼容问题。 | 以上代码IE=edge告诉IE使用最新的引擎渲染网页,chrome=1则可以激活Chrome Frame. PS:谷歌添加一个插件:Google Chrome Frame(谷歌内嵌浏览器框架GCF),这个插件可以让用户的IE浏览器外不变,但用户在浏览网页时,实际上使用的是Google Chrome浏览器内核,而且支持IE6、7、8等多个版本的IE浏览器。 |
expires | 设定网页的过期时间。 | PS:必须使用GMT的时间格式 |
refresh | 自动刷新并指向新页面。 | PS:2代表页面停留2秒后跳转到后面的网址上 |
set-cookie | 如果网页过期,那么自动删除本地cookie。 | PS:必须使用GMT的时间格式。 |
windows-target | 强制页面在当前窗口中以独立页面显示,可以防止自己的网页被别人当作一个frame页调用 | |
cache-control | 缓存机制 | Public:指示响应可被任何缓存区缓存。 Private:指示对于单个用户的整个或部分响应消息,不能被共享缓存处理。这允许服务器仅仅描述当用户的部分响应消息,此响应消息对于其他用户的请求无效。 no-cache:指示请求或响应消息不能缓存。 no-store:用于防止重要的信息被无意的发布。在请求消息中发送将使得请求和响应消息都不使用缓存。 max-age:指示客户机可以接收生存期不大于指定时间(以秒为单位)的响应。 min-fresh:指示客户机可以接收响应时间小于当前时间加上指定时间的响应。 max-stale:指示客户机可以接收超出超时期间的响应消息。如果指定max-stale消息的值,那么客户机可以接收超出超时期指定值之内的响应消息。 |
name
name属性主要用于描述网页,与之对应的属性值为content,content中的内容主要是便于搜索引擎机器人查找信息和分类信息用的。
值 | 描述 | 例子 |
author | 标注网页的作者 | |
keywords | 页面关键词,用于被搜索引擎收录 | |
description | 页面描述,用于搜索引擎收录 | |
viewport | 用于控制页面缩放 | |
renderer | 指定双核浏览器默认以何种方式渲染页面。 | //默认webkit内核 //默认IE兼容模式 //默认IE标准模式 PS:360浏览器支持 |
generator | 说明网站的采用的什么软件制作 | |
revised | 网页文档的修改时间 | |
robots | 用来告诉搜索机器人哪些页面需要索引,哪些页面不需要索引。 | 取值:all|none|index|noindex|follow|nofollow, 默认all all:文件将被检索,且页面上的链接可以被查询; none:文件将不被检索,且页面上的链接不可以被查询; index:文件将被检索; follow:页面上的链接可以被查询; noindex:文件将不被检索,但页面上的链接可以被查询; nofollow:文件将不被检索,页面上的链接可以被查询。 |
copyright | 网站版权信息 | |
总结
通过大网站对于meta的设置,可以看到常用的有,X-UA-Compatible、keywords、description。
参考文献
1.