当前位置:主页HTML 教程

1. HTML 语言简介

文章来源:知付 更新时间:2022-05-28 23:07 热度:455
目录
  • 概述

  • 网页的基本概念

  • 标签

  • 元素

  • 块级元素,行内元素

  • 属性

  • 网页的基本标签

 - <!doctype>

 - <html>

 - <head>

 - <meta>

 - <title>

 - <body>
  • 空格和换行

  • 注释

概述

HTML 是网页使用的语言,定义了网页的结构和内容。浏览器访问网站,其实就是从服务器下载 HTML 代码,然后渲染出网页。

HTML 的全名是“超文本标记语言”(HyperText Markup Language),上个世纪90年代由欧洲核子研究中心的物理学家蒂姆·伯纳斯-李(Tim Berners-Lee)发明。它的最大特点就是支持超链接,点击链接就可以跳转到其他网页,从而构成了整个互联网。

1999年,HTML 4.01 版发布,成为广泛接受的 HTML 标准。2014年,HTML 5 发布,这是目前正在使用的版本。

浏览器的网页开发,涉及三种技术:HTML、CSS 和 JavaScript。HTML 语言定义网页的结构和内容,CSS 样式表定义网页的样式,JavaScript 语言定义网页与用户的互动行为。HTML 语言是网页开发的基础,CSS 和 JavaScript 都是基于 HTML 才能生效,即使没有这两者,HTML 本身也能使用,可以完成基本的内容展示。本教程只介绍 HTML 语言。

下面就是一个简单网页的 HTML 源码。

<!DOCTYPE html>
<html lang="zh-CN">
<head>
  <meta charset="utf-8">
  <title>网页标题</title>
</head>
<body>
  <p>Hello World</p>
</body>
</html>

上面这段代码,可以保存成文件 hello.html 。浏览器打开这个本地文件,就能看到文字“Hello World”。

浏览器右键菜单的“查看源码”(View page source),可以展示当前网页的 HTML 源码。

网页的基本概念

标签

网页的 HTML 代码由许许多多不同的标签(tag)构成。学习 HTML 语言,就是学习各种标签的用法。

下面就是标签的一个例子。

<title>网页标题</title>

上面代码中, <title></title> 就是一对标签。

标签用来告诉浏览器,如何处理这段代码。标签的内容就是浏览器所要渲染的、展示在网页上的内容。

标签放在一对尖括号里面(比如 <title> ),大多数标签都是成对出现的,分成开始标签和结束标签,结束标签在标签名之前加斜杠(比如 </title> )。但是,也有一些标签不是成对使用,而是只有开始标签,没有结束标签,比如上一节示例的 <meta> 标签。

<meta charset="utf-8">

上面代码中, <meta> 标签就没有结束标签 </meta>

这种单独使用的标签,通常是因为标签本身就足够完成功能了,不需要标签之间的内容。实际应用中,它们主要用来提示浏览器,做一些特别处理。

标签可以嵌套。

<div><p>hello world</p></div>

上面代码中, <div> 标签内部包含了一个 <p> 标签。

嵌套时,必须保证正确的闭合顺序,不能跨层嵌套,否则会出现意想不到的渲染结果。

<div><p>hello world</div></p>

上面代码就是错误的嵌套,闭合顺序不正确。

HTML 标签名是大小写不敏感,比如 <title><TITLE> 是同一个标签。不过,一般习惯都是使用小写。

另外,HTML 语言忽略缩进和换行。下面几种写法的渲染结果是一样的。

<title>网页标题</title>

<title>
  网页标题
</title>

<title>网页
标题</title>

进一步说,整个网页的 HTML 代码完全可以写成一行,浏览器照样解析,结果完全一样。所以,正式发布网页之前,开发者有时会把源码压缩成一行,以减少传输的字节数。

各种网页的样式效果,比如内容的缩进和换行,主要靠 CSS 来实现。

元素

浏览器渲染网页时,会把 HTML 源码解析成一个标签树,每个标签都是树的一个节点(node)。这种节点就称为网页元素(element)。所以,“标签”和“元素”基本上是同义词,只是使用的场合不一样:标签是从源码角度来看,元素是从编程角度来看,比如 <p> 标签对应网页的 p 元素。

嵌套的标签就构成了网页元素的层级关系。

<div><p>hello world</p></div>

上面代码中, div 元素内部包含了一个 p 元素。上层元素又称为“父元素”,下层元素又称为“子元素”,即 divp 的父元素, pdiv 的子元素。

块级元素,行内元素

所有元素可以分成两大类:块级元素(block)和行内元素(inline)。

块级元素默认占据一个独立的区域,在网页上会自动另起一行,占据 100% 的宽度。

<p>hello</p>
<p>world</p>

上面代码中, p 元素是块级元素,因此浏览器会将内容分成两行显示。

行内元素默认与其他元素在同一行,不产生换行。比如, span 就是行内元素,通常用来为某些文字指定特别的样式。

<span>hello</span>
<span>world</span>

上面代码中, span 元素是行内元素,因此浏览器会将两行内容放在一行显示。

属性

属性(attribute)是标签的额外信息,使用空格与标签名和其他属性分隔。

<img src="demo.jpg" width="500">

上面代码中, <img> 标签有两个属性: srcwidth

属性可以用等号指定属性值,比如上例的 demo.jpg 就是 src 的属性值。属性值一般放在双引号里面,这不是必需的,但推荐总是使用双引号。

注意,属性名是大小写不敏感的, onclickonClick 是同一个属性。

HTML 提供大量属性,用来定制标签的行为,详细介绍请看《元素的属性》一章。

网页的基本标签

符合 HTML 语法标准的网页,应该满足下面的基本结构。

<!DOCTYPE html>
<html lang="zh-CN">
<head>
  <meta charset="utf-8">
  <title></title>
</head>
<body>
</body>
</html>

不管多么复杂的网页,都是从上面这个基本结构衍生出来的。

前面说过,HTML 代码的缩进和换行,对于浏览器不产生作用。所以,上面的代码完全可以写成一行,渲染结果不变。上面这样分行写,只是为了提高可读性。

下面就依次介绍,这个基本结构的主要标签。它们构成了网页的骨架。

<!doctype>

网页的第一个标签通常是 <!doctype> ,表示文档类型,告诉浏览器如何解析网页。

一般来说,只要像下面这样,简单声明 doctypehtml 即可。浏览器就会按照 HTML 5 的规则处理网页。

<!doctype html>

有时,该标签采用完全大写的形式,以便区别于正常的 HTML 标签。因为 <!doctype> 本质上不是标签,更像一个处理指令。

<!DOCTYPE html>

<html>

<html> 标签是网页的顶层容器,即标签树结构的顶层节点,也称为根元素(root element),其他元素都是它的子元素。一个网页只能有一个 <html> 标签。

该标签的 lang 属性,表示网页内容默认的语言。

<html lang="zh-CN">

上面代码表示,网页是中文内容。如果是英文内容, zh-CN 要改成 en 。更详细的介绍,参见《元素的属性》一章。

<head>

<head> 标签是一个容器标签,用于放置网页的元信息。它的内容不会出现在网页上,而是为网页渲染提供额外信息。

<!doctype html>
<html>
  <head>
    <title>网页标题</title>
  </head>
</html>

<head><html> 的第一个子元素。如果网页不包含 <head> ,浏览器会自动创建一个。

<head> 的子元素一般有下面七个,后文会一一介绍。

  • <meta> :设置网页的元数据。

  • <link> :连接外部样式表。

  • <title> :设置网页标题。

  • <style> :放置内嵌的样式表。

  • <script> :引入脚本。

  • <noscript> :浏览器不支持脚本时,所要显示的内容。

  • <base> :设置网页内部相对 URL 的计算基准。

<meta>

<meta> 标签用于设置或说明网页的元数据,必须放在 <head> 里面。一个 <meta> 标签就是一项元数据,网页可以有多个 <meta><meta> 标签约定放在 <head> 内容的最前面。

不管什么样的网页,一般都可以放置以下两个 <meta> 标签。

<head>
  <meta charset="utf-8">
  <meta name="viewport" content="width=device-width, initial-scale=1">
  <title>Page Title</title>
</head>

上面例子中,第一个 <meta> 标签表示网页采用 UTF-8 格式编码,第二个 <meta> 标签表示网页在手机端可以自动缩放。

<meta> 标签有五个属性,下面依次介绍。

(1)charset 属性

<meta> 标签的 charset 属性,用来指定网页的编码方式。该属性非常重要,如果设置得不正确,浏览器可能无法正确解码,就会显示乱码。

<meta charset="utf-8">

上面代码声明,网页为 UTF-8 编码。虽然开发者可以使用其他的编码方式,但正确的做法几乎总是应该采用 UTF-8。

注意,这里声明的编码方式,应该与网页实际的编码方式一致,即声明了 utf-8 ,网页就应该使用 UTF-8 编码保存。如果这里声明了 utf-8 ,实际却是使用另一种编码(比如 GB2312),并不会导致浏览器的自动转码,网页可能会显示为乱码。

(2)name 属性,content 属性

<meta> 标签的 name 属性表示元数据的名字, content 属性表示元数据的值。它们合在一起使用,就可以为网页指定一项元数据。

<head>
  <meta name="description" content="HTML 语言入门">
  <meta name="keywords" content="HTML,教程">
  <meta name="author" content="张三">
</head>

上面代码包含了三个元数据: description 是网页内容的描述, keywords 是网页内容的关键字, author 是网页作者。

元数据有很多种,大部分涉及浏览器内部工作机制,或者特定的使用场景,这里就不一一介绍了。下面是一些例子。

<meta name="viewport" content="width=device-width, initial-scale=1">
<meta name="application-name" content="Application Name">
<meta name="generator" content="program">
<meta name="subject" content="your document's subject">
<meta name="referrer" content="no-referrer">

(3)http-equiv 属性,content 属性

<meta> 标签的 http-equiv 属性用来覆盖 HTTP 回应的头信息字段, content 属性是对应的字段内容。这两个属性与 HTTP 协议相关,属于高级用法,这里就不详细介绍了。

<meta http-equiv="Content-Security-Policy" content="default-src 'self'">

上面代码可以覆盖 HTTP 回应的 Content-Security-Policy 字段。

下面是另一些例子。

<meta http-equiv="Content-Type" content="Type=text/html; charset=utf-8">
<meta http-equiv="refresh" content="30">
<meta http-equiv="refresh" content="30;URL='http://website.com'">

<title>

<title> 标签用于指定网页的标题,会显示在浏览器窗口的标题栏。

<head>
  <title>网页标题</title>
</head>

搜索引擎根据这个标签,显示每个网页的标题。它对于网页在搜索引擎的排序,有很大的影响,应该精心安排,反映网页的主题。

<title> 标签的内部,不能再放置其他标签,只能放置无格式的纯文本。

<body>

<body> 标签是一个容器标签,用于放置网页的主体内容。浏览器显示的页面内容,都放置在它的内部。它是 <html> 的第二个子元素,紧跟在 <head> 后面。

<html>
  <head>
    <title>网页标题</title>
  </head>
  <body>
    <p>hello world</p>
  </body>
</html>

空格和换行

HTML 语言有自己的空格处理规则。标签内容的头部和尾部的空格,一律忽略不计。

<p>  hello world   </p>

上面代码中, hello 前面的空格和 world 后面的空格,浏览器一律忽略不计。

标签内容里面的多个连续空格(包含制表符 t ),会被浏览器合并成一个。

<p>hello      world</p>

上面代码中, helloworld 之间有多个连续空格,浏览器会将它们合并成一个。网页渲染的结果是, helloworld 之间只有一个空格。

浏览器还会将文本里面的换行符( n )和回车符( r ),替换成空格。

<p>hello

world
</p>

上面代码中, helloworld 之间有多个换行,浏览器会将它们替换成空格,然后再将多个空格合并成一个。网页渲染的结果是, helloworld 之间有一个空格。

这意味着,HTML 源码里面的换行,不会产生换行效果。

注释

HTML 代码可以包含注释,浏览器会自动忽略注释。注释以 <!-- 开头,以 --> 结尾,下面就是一个注释的例子。

<!-- 这是一个注释 -->

注释可以是多行的,并且内部的 HTML 都不再生效了。

<!--
  <p>hello world</p>
-->

上面代码是一个注释的区块,内部的代码都是无效的,浏览器不会解析,更不会渲染它们。

注释有助于理解代码的含义,复杂的代码块前面最好加上注释。

分享到:

#免责声明#

版权声明:《 1. HTML 语言简介 》为作者 知付 原创文章,转载请注明原文地址!
本站所有文章,如无特殊说明或标注,均为本站原创或整合发布。任何个人或组织,在未征得本站同意时,禁止复制、盗用、采集、发布本站内容到任何网站、书籍等各类媒体平台。如若本站内容侵犯了原著者的合法权益,可联系我们进行处理。
本文地址:https://www.yoppunion.com/HTML%20%E6%95%99%E7%A8%8B/136.html
同类推荐
评论列表
签到
    知付   沙发 发表于2022-10-09 23:20 @回复
    打卡成功,现在时间:23点20分记得每天坚持打卡哦![aru_22]

觉得文章有用就打赏一下文章作者

支付宝扫一扫打赏

支付宝扫一扫打赏

微信扫一扫打赏

微信扫一扫打赏