HTML文档结构

147小编 次浏览

摘要:HTML文档,也被称为网页,包括头部和主体两大部分。头部主要描述浏览器和搜索引擎所需要的信息,浏览器不会将这些信息呈现给访问者;主体是文档的正文,是网页中真正要传达的信息,这些信息将在浏览器窗口的正文部分呈现给访问者。 HTML文档总是以 标签开始,以 标签结束,在 ... 标签之间的内容是头部信息,... 标签之间的内容是主体部分,即文档的正文。此外

HTML文档,也被称为网页,包括头部和主体两大部分。头部主要描述浏览器和搜索引擎所需要的信息,浏览器不会将这些信息呈现给访问者;主体是文档的正文,是网页中真正要传达的信息,这些信息将在浏览器窗口的正文部分呈现给访问者。

HTML文档总是以 标签开始,以 标签结束,在 ... 标签之间的内容是头部信息,... 标签之间的内容是主体部分,即文档的正文。此外,还要在文档的最开头,通过 声明这是一个HTML文档。如图 116 所示:

116 html文档结构

一个HTML文档由4个基本部分组成:

① 一个文档声明:

② 一个html标签对:

③ 一个head标签对:

④ 一个body标签对:

1.1.1

声明必须是HTML文档的第一行,位于 标签之前。该声明不是HTML标签,它是告诉浏览器该HTML文档的DTD类型(Document Type Definition,文档类型定义)。

在HTML5之前,有多种DTD类型,分别为Transitional类型、Strict类型、Frameset类型,而不同类型对文档标签严格程度的要求不同,并且的写法非常复杂,估计也没有人能够完全记住这些写法,这给开发带来了混乱。网站SEO

到HTML5之后,一切化繁为简,只需声明即可,它就告诉浏览器,该文档是一个HTML5文档。

1.1.2 HTML根元素

HTML文档的根元素是 html 元素,从 标签开始,到 标签结束。根元素的作用就是告诉浏览器,在 和 之间的内容是HTML类型,浏览器便按HTML进行解析其中的内容。

html 元素有两个属性,分别是 lang属性和 manifest 属性:

lang属性指定页面内容所使用的默认语言。指定文档所使用的语言,有助于语言合成工具选择发音语言,或者翻译工具选择翻译规则。如,,表示本文档使用中文。

manifest属性给出离线缓存文件的URL。HTML5 引入了应用程序缓存,这意味着 web 应用可被缓存,并可进行离线访问。如,,表示离线缓存文件为waibo.manifest。

1.1.3 HTML头部

head元素用于定义文档的头部信息,出现在 ... 标签之间的内容,是文档的头部信息。头部定义的内容不会在浏览器窗口的正文部分显示出来。

head元素比较特殊,只有一些特定的标签才允许放在 标签内,它们分别是 、、、、、,接下来对这些标签进行分别介绍。网站SEO

标签

标签的唯一作用,就是定义页面的标题,标题是对当前页面核心内容的一个简短的、概括性描述。如:

Hello world!

在大多数浏览器中,页面的标题被显示在浏览器窗口或标签页的标题栏,还会出现在访问者浏览历史列表和书签中。

更重要的是,搜索引擎会通过页面的标题来大致了解页面的内容,并将页面的标题作为搜索结果中每一个条目的链接文本,也是判断搜索结果中页面相关度的重要因素。因此,页面标题是SEO的重要内容,一个好的页面标题可以提升搜索引擎的结果排名,并能获得更好的用户体验。

标签

标签是一个单标签,它为页面上的所有链接规定默认地址和默认目标窗口,并通过 href 属性设置默认URL地址,通过 target 属性设置默认目标窗口。

规定默认地址或默认目标窗口后,点击页面上的任何链接时:对未带http的链接,浏览器会在地址前插入base中 href 设置的URL地址;对未设置 target 属性的链接,会按base中 target 设置的目标打开窗口。如:

标签的主要作用,是确保网页中所有的相对URL都可以被解析为正确的地址,以便在文档被移动的情况下,所有的相对URL都能够被正确解析。

标签

标签又叫元数据标签,是网页头部的一个辅助性标签,用于为网页定义元数据(metadata)信息,一般用来定义页面的关键字、页面的描述等。

标签提供的信息对用户不可见,也不会显示在页面上,但却对搜索引擎可见,可以方便搜索引擎蜘蛛搜索到这个页面上的信息。因此,这些信息都是SEO的重要内容,可以大大提高网站被搜索引擎搜索到的可能性。

标签共有两个重要属性,分别是 name 属性和 http-equiv 属性,并通过 name 或 http-equiv属性来指定元数据的类型,通过 content 来指定元数据的内容,不同的元数据实现了不同的网页功能。网站SEO

1、name属性

name属性的主要取值及功能见表 11:

11 name属性的取值及功能

2、http-equiv属性

顾名思义,http-equiv 就相当于HTTP头部的作用,用于向浏览器提供一些有用的信息,以帮助浏览器正确和精确地显示网页内容。

http-equiv属性主要用定义网页的编码字符集、刷新频率、网页的有效期等:

1)网页的编码字符集

在HTML4中,通过Content-Type属性值来指定文件的媒体格式类型(MIME类型)和所使用的编码字符集,浏览器将以此来决定以什么形式、什么编码来读取这个文件,并显示文件的内容。

HTML文件的MIME类型固定为text/html,而编码字符集可以根据需要来指定。如:

到了HTML5,一切化繁为简,只需在 meta 元素中,直接使用 charset 属性来定义网页所使用的编码字符集即可。如:

在HTML5中,上述两种方式均有效,但只能使用一种,不能同时混合使用两种方式。并且,推荐使用 utf-8 编码字符集。网站SEO

2)刷新频率Refresh

3)网页的有效期

通过Expires属性值来指定网页在缓存中的过期时间,一旦网页过期,必须从服务器上重新加载。时间必须使用GMT格式(格林威治时间格式)。如:

说明:

网页头部的这些元素中,title、keywords、description的作用非常重要,因为搜索引擎的机器人会自动检索页面的keywords和decription,并将其加入到自己的数据库,再根据关键词的密度对网站进行排序。

对于任何站长而言,可能都有同样的感受,无论网站做得再精彩,在浩如烟海的网络世界中,也如一叶扁舟,不为人知。

人们往往忙于在搜索引擎中提交自己的网站,或在知名网站加入自己网站的链接,或在各大论坛中发帖子宣传自己的网站,忙得不亦乐乎,却忽视了 标签的强大功效。

因此,要让网站获得很好的排名,必须充分利用 meta标签,设置好每个页面的 keywords 和 decription,来增加网站对各大搜索引擎的曝光率,提高网站的访问量,进而提升网站的收益。网站SEO

样式表

样式表,即CSS(Cascading Style Sheet层叠样式表),用它来控制网页的表现,如果要让网站看起来很吸引人,就离不开CSS。

在HTML文档的头部,可以通过两种方式来为网页定义样式:

(1) 使用link元素

在HTML文档的头部,可以通过link元素链接到外部样式表,让网页应用该外部样式表定义的样式规则。

在link 标签中,通过的 rel 属性来定义本HTML文档与被链接文档之间的关系,rel = "stylesheet" 表明引入的文件是样式表;通过href属性定义外部资源(即CSS文件)的URL地址,URL可以是相对路径,也可以是相对路径,相对路径是相对于本HTML文档而言的。

可以在一个HTML文档中添加多个 link 元素,让它们分别指向不同的样式文件,就可以给一个网页添加多个样式表。

由于 link 元素为空元素,它只有开始标签,没有结束标签,所以,要在开始标签的结尾处加上 / 来结束该元素。如:

上述代码表示,为本文档引入网站SEO文件名称为reset.css 的外部样式表,该样式表文件与本文档位于相同目录下。

(2) 使用style元素

可以在HTML文档的头部插入一个 style 元素,让网页应用该 style 元素中定义的样式规则。如:

body { background-color:yellow; }

p { color:blue; }

上述代码表示,指定本HTML文档的背景颜色为黄色(yellow)、本HTML文档中的所有段落的文本颜色为蓝色(blue)。

脚本

在HTML文档中,可以通过Javascript 脚本主要用来定义特殊的行为,但Javascript并不是必需的。

大多数情况下,Javascript 都是在由HTML和CSS 构建的核心体验的基础上,增强访问者的体验,主要用来增强页面的交互性,如实现表单验证、动态显示隐藏内容、加载数据并动态地更新页面、操作 audio 和 video 元素控件等等。

HTML文档中,有两个用于标识脚本的元素,它们是 script 元素和 noscript 元素:

1、script 元素

script 元素既可以直接在页面中嵌入Javascript脚本,也可以从外部文件加载脚本。

(1) 嵌入脚本

就是直接在 script 元素中书写Javascript代码。如:网站SEO

alert("Hello, world!");

一个HTML文档,也支持多个 script 元素。这种方式定义的脚本,只对本文档有效,并且脚本代码需要放在HTML文件,而不是脚本文件中,脚本通常会散落在多个地方,不便于维护,也容易出错。所以,不推荐使用这种方法。

(2) 加载外部脚本

通过 script 元素的 src 属性指定外部脚本文件的URL,可以把外部脚本加载到本HTML文档中。URL可以是绝对路径,也可以是相对路径。相对路径是相对本HTML文档而言的。

在一个HTML文档中,可以添加多个 script 元素,让它们分别指向不同的脚本文件,就可以为一个网页载入多个脚本文件。当加载外部脚本时,script 元素必须是空元素,即在开始和结束标签之间不得有任何内容。如:

上述代码表示,文档会载入外部脚本,脚本文件名称是engine.js,脚本文件与本HTML文档位于相同目录下。

2、noscript 元素网站SEO

noscript 元素是一个检测工具,当检测到 script 中的脚本内容无法执行时,即如果浏览器不支持Javascript或用户禁用了Javascript时,就会显示 noscript 元素中的文本。如:

您的浏览器不支持Javascript

注意:

默认情况下,浏览器会按照脚本在HTML中出现的顺序,依次对每个脚本进行下载(对于外部脚本)、解析和执行。

在处理脚本的过程中,浏览器既不会下载该 script 元素后面出现的内容,也不会呈现这些内容,这称为阻塞行为(blocking behavior)。

这条规则对嵌入脚本和外部脚本都有效。可以想象,阻塞行为会影响页面的呈现速度,影响的程度取决于脚本的大小和它执行的动作。

因此,建议最好在页面的最末尾加载脚本,即应该尽可能地将脚本元素放在的前面,而不是放在 head 元素中。

1.1.4 HTML主体

标签用于定义文档的正文内容,成对出现。在... 之间的内容即为页面的主体内容,可以是文本、图像、音频、视频、表单及其他交互式内容,它们才是真正要在浏览器中显示,并让访问者看到的内容。

由于HTML元素可以相互嵌套,通过元素层层嵌套,就构成了千变万化的网页。当一个元素包含另一个元素时,把外层元素称作父元素,内层元素称作子元素。子元素还可以再包含子元素,子元素中包含的任何元素,都是外层父元素的后代。如:网站SEO

在上述代码中,article 元素是 h1、h2、p 元素的父元素,h1、h2、p 元素是article 元素的子元素(也是后代)。p 元素是 em、a 元素的父元素。em、a 元素是 p 元素的子元素,是article 元素的后代(但不是子元素)。article 元素是 em、a 元素的祖先。

需要注意的是,当一个元素中包含其他元素时,每个元素都必须正确的嵌套,这些元素的开始标签和结束标签对,不允许相互交叉。如:

如果先开始 p,再开始 a,就必须先结束 a,再结束 p。而上述代码中,a 元素和 p 元素的标签对之间出现了交叉,就是不正确的嵌套。

举报/反馈

网站优化

随机内容