98.md

@author jackzhenguo
@desc 
@date 2019/8/8

98 爬取百度首页标题

import re
from urllib import request

#爬虫爬取百度首页内容
data=request.urlopen("http://www.baidu.com/").read().decode()

#分析网页,确定正则表达式
pat=r'<title>(.*?)</title>'

result=re.search(pat,data)
print(result) <re.Match object; span=(1358, 1382), match='<title>百度一下，你就知道</title>'>

result.group() # 百度一下，你就知道

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Expand file tree

98 爬取百度首页标题

Search code, repositories, users, issues, pull requests...

FilesExpand file tree

98.md

Latest commit

History

98.md

File metadata and controls

98 爬取百度首页标题

Expand file tree