正所谓,知己知彼,百战不殆。我们爬虫的爬取对象,就是各式各样的网页,只有对网页的基本内容达到熟悉的程度,才能顺利的书写我们的爬虫程序。
-
HTML(HyperText Markup Language)是一种超文本标记语言;
-
CSS(Cascading Style Sheets)简称为层叠样式表。
大家如果只是看这两个名字的定义,估计仍然是一头雾水。这俩东西到底是干啥的?
我给大家举一个例子就明白了,大家应该都画过画吧,即使没有亲自画过应该也见过。毕竟吃猪肉和见猪跑你总得占一样吧。
在画画的时候,我们首先会拿画笔勾勒出图形的样式骨架,之后会涂上一些好看的颜色让画变的更美观。我们写网页的时候也是一样的道理,HTML 就相当于画笔,用于勾勒页面的骨架。CSS 则是好看的颜色,让页面的样式更加美观。
下面我们来认识一下页面的骨架 HTML:
Tips: 可以新建一个 txt 文件,将下面的代码复制进去,然后将文件的后缀名改为 .html ,然后使用浏览器打开就可以看到效果:
HTML 的标题
<!DOCTYPE html> <html> <head> <title>欢迎访问慕课网</title> <head> <body> <h>这是一个标题</h> <h3> <bold>这是一个加粗的标题</bold> </h3> <!-- 段落 --> <P>这是一个段落</P> <button>这是一个按钮</button> </body> </html>
HTML 中添加图片
<!DOCTYPE html> <html> <head> <title>欢迎访问慕课网</title> <head> <body> <h>这是一个标题</h> <h3> <bold>这是一个加粗的标题</bold> </h3> <!-- 段落 --> <P>这是一个段落</P> <button>这是一个按钮</button> <!-- 下面是慕课网图片 --> <img src="https://www.imooc.com/static/img/index/logo.png" alt="图片无法显示!"> <!-- 超链接 --> <a href="https://www.imooc.com/">慕课网</a> </body> </html>
有序列表和无序列表
<!DOCTYPE html> <html> <head> <title>欢迎访问慕课网</title> <head> <body> <h>这是一个标题</h> <h3> <bold>这是一个加粗的标题</bold> </h3> <!-- 段落 --> <P>这是一个段落</P> <br> <br> <br> <button>这是一个按钮</button> <!-- 下面是慕课网图片 --> <img src="https://www.imooc.com/static/img/index/logo.png" alt="图片无法显示!"> <img src="h" alt="图片无法显示!"> <!-- 属性 href --> <a href="https://www.imooc.com/">慕课网</a> <!-- 列表 --> <ul> <li>无序列表</li> <li>无序列表</li> <li>无序列表</li> <li>无序列表</li> <li>无序列表</li> </ul> <ol> <li>有序列表</li> <li>有序列表</li> <li>有序列表</li> <li>有序列表</li> <li>有序列表</li> <li>有序列表</li> </ol> </body> </html>
表格
<!DOCTYPE html> <html> <head> <title>欢迎访问慕课网</title> <head> <body> <h>这是一个标题</h> <h3> <bold>这是一个加粗的标题</bold> </h3> <!-- 段落 --> <P>这是一个段落</P> <br> <br> <br> <button>这是一个按钮</button> <!-- 下面是慕课网图片 --> <img src="https://www.imooc.com/static/img/index/logo.png" alt="图片无法显示!"> <img src="h" alt="图片无法显示!"> <!-- 属性 href --> <a href="https://www.imooc.com/">慕课网</a> <!-- 列表 --> <ul> <li>无序列表</li> <li>无序列表</li> <li>无序列表</li> <li>无序列表</li> <li>无序列表</li> </ul> <ol> <li>有序列表</li> <li>有序列表</li> <li>有序列表</li> <li>有序列表</li> <li>有序列表</li> <li>有序列表</li> </ol> <!-- 表格 --> <table> <thead> <tr> <td>a</td> <td>b</td> <td>c</td> </tr> </thead> <tbody> <tr> <td>001</td> <td>002</td> <td>003</td> </tr> </tbody> </table> </body> </html>
表单
<!DOCTYPE html> <html> <head> <title>欢迎访问慕课网</title> <head> <body> <h>这是一个标题</h> <h3> <bold>这是一个加粗的标题</bold> </h3> <!-- 段落 --> <P>这是一个段落</P> <br> <br> <br> <button>这是一个按钮</button> <!-- 下面是慕课网图片 --> <img src="https://www.imooc.com/static/img/index/logo.png" alt="图片无法显示!"> <img src="h" alt="图片无法显示!"> <!-- 属性 href --> <a href="https://www.imooc.com/">慕课网</a> <!-- 列表 --> <ul> <li>无序列表</li> <li>无序列表</li> <li>无序列表</li> <li>无序列表</li> <li>无序列表</li> </ul> <ol> <li>有序列表</li> <li>有序列表</li> <li>有序列表</li> <li>有序列表</li> <li>有序列表</li> <li>有序列表</li> </ol> <!-- 表格 --> <table> <thead> <tr> <td>a</td> <td>b</td> <td>c</td> </tr> </thead> <tbody> <tr> <td>001</td> <td>002</td> <td>003</td> </tr> </tbody> </table> <!-- 表单 --> <form> <div> <label>aaaa</label> <input type="text" name="ssss" placeholder="ssssss"> </div> <input type="submit" name="submit" value="提交"> </form> </body> </html>
我们知道 CSS 是负责页面的样式,让页面更加的美观,那么 CSS 到底是如何让页面更加的美观呢,我们一起来看一下:
首先,我会给大家一个没有添加任何样式的 HTML,然后,我们一步一步的添加不同的样式来展示层叠样式表的效果。
首先,我们需要给 HTML 添加样式,但是,HMTL 有那么多标签,怎么给指定的标签或者一组标签更改样式那。这就引入了选择器的概念。通过选择器我们可以定位到 HTML 里的任何一个元素。
<!DOCTYPE HTML> <html> <head> <title>CSS</title> </head> <body> <p>Hello world!</p> </body> </html>
可以看到页面中只有 Hello world!这样的文本,并没有任何样式,如下图所示。下面我们就来给 Hello world!增加一些样式。
使用选择器选择 p 标签
<!DOCTYPE HTML> <html> <head> <title>Example</title> <style type="text/css"> p { background: grey; //增加灰色背景 color:white; //改变字体颜色为白色 font-size: 10pt; //设置字体大小为10pt } //使用选择器选择p标签 </style> </head> <body> <p>hello world!</p> </body> </html>
代码块
我们通过选择器选择了 P 标签,然后给这个标签增加了灰色背景,字体为蓝色,字体大小为 10pt。
背景
<!DOCTYPE HTML> <html> <head> <title>Example</title> <style type="text/css"> p { background: grey; //添加灰色到背景颜色 } </style> </head> <body> <p>hello world!</p> </body> </html>
字体
<!DOCTYPE HTML> <html> <head> <title>Example</title> <style type="text/css"> p { background: grey; font-size: 30pt; //调大字体到30pt } </style> </head> <body> <p>hello world!</p> </body> </html>
颜色
<!DOCTYPE HTML>
<html>
<head>
<title>Example</title>
</head>
<body>
</body>
</html>
Tips:CSS,其实有很多内容。我只是列出了最常用的五个部分来讲,这些内容其实基本涵盖了我们几乎所有的爬虫课所需要的知识。其他的更多高级内容,请大家移步到慕课网的相关内容进行学习。
这一个小节,我们通过几个小例子,熟悉了 Html 和 CSS 的基本使用。读者朋友们可以按照上述步骤,在自己的本机进行练习,来观察页面的样式和字体的变化。