问答文章1 问答文章501 问答文章1001 问答文章1501 问答文章2001 问答文章2501 问答文章3001 问答文章3501 问答文章4001 问答文章4501 问答文章5001 问答文章5501 问答文章6001 问答文章6501 问答文章7001 问答文章7501 问答文章8001 问答文章8501 问答文章9001 问答文章9501

如何用python把网页上的文本内容保存下来

发布网友 发布时间:2022-04-21 23:19

我来回答

6个回答

热心网友 时间:2022-04-18 03:26

1、了解Python如何获取网页内容。

2、导入 urllib.request模块。

3、使用urllib.request.urlopen( )获取对象。

4、urllib.request.urlopen()获取的是一个网页的http.client.HTTPResponse对象。

5、若要打印http.client.HTTPResponse对象的内容,可以继续使用read()方法。

热心网友 时间:2022-04-18 04:44

先说下基本原理和过程

原理:就是将可以打开的网页(这里不*为网站,本地网页文件也可以哦),加载到内存中,然后解析html,读取其中的文本内容或者储存到本地或者数据库中。

过程:

1、加载模块urllib,beautifulsoup。urllib提供网络服务解析,beautifullsoup提供对网页结构进行解析的功能。

2、加载网页

3、用beautifulsoup加载解析

下面给出实例:

import urllib.request   
from bs4 import BeautifulSoup
url="http://google.cn/"  
response=urllib.request.urlopen(url)    #返回文件对象
page=response.read()  
#直接将URL保存为本地文件:
import urllib.request  
url="http://www.xxxx.com/1.jpg"
urllib.request.urlretrieve(url,r"d:\temp\1.jpg")
#当然你可以将返回的对象交给soup处理
soup=BeautifulSoup(response)
#运行soup

热心网友 时间:2022-04-18 06:18

使用urllib就ok啊!建议搜索beautiful soup。python在抓取网页上可是非常牛*的

import urllib
a=urllib.urlopen("http://www.baidu.com").read()
print a

看看会有什么结果,一些html标签你就要用工具进行过滤了 beautifulsoup

热心网友 时间:2022-04-18 08:10

如果只需要网页内容,用urllib2就行,查询python的api,调用read方法获得网页内容。
如果需要解析的话,就用BeautifulSoup吧。

热心网友 时间:2022-04-18 10:18

此时用ajax访问这个试图返回的内容就是: 上面这种办法不是很好,建议先写一修改了一下就到了楼上的下面了,你也太没水准了。直接复制 =修改=

热心网友 时间:2022-04-18 12:42

具体实施请看他楼讲解
声明声明:本网页内容为用户发布,旨在传播知识,不代表本网认同其观点,若有侵权等问题请及时与本网联系,我们将在第一时间删除处理。E-MAIL:11247931@qq.com
父母离异的话,会不会导致孩子心智不成熟? 过节 公司给我们发的购物卡 这个怎么做分录 属于福利费吗 需要计提吗... 乡村振兴公务员和省考公务员有什么区别 ...小时候跟着爷爷学国画书法,小受家是农村的,小受姓夏或叶,他带着他... 瑞麒X1安全装置 瑞麒X1的舒适型和豪华型有什么区别?配置有哪些不同的地方?这5000块多在... 瑞麒X1的安全性能方面配置如何? 脚崴了 有大量於血 怎么样才能快速消肿 脚崴了外侧出现瘀血浮肿怎么消除? ...换了我喜欢的发型,但是穿了件有点透明的衣服,可以看到肩_百度... 高中数学必修二第一章知识点是什么 谷歌浏览器标签页里的字体模糊 高一数学必修二 directwrite字体渲染系统要不要开启 测试人员如何使用Python代码把自动化测试的数据保... 高中数学必修二预习重点 win10 怎么删除chrome浏览器内嵌框架 从数据库里python获取数据存到本地数据库 高中数学必修二讲了什么内容呢? firefox 字体问题 高中数学必修二讲得什么内容 高一数学必修一必修二总结 量化分析的量化投资策略 chrome浏览器win10下显示不清晰怎么办 高一数学必修一必修二各章知识点总结 怎么开启DirectWrite高清字体渲染支持 量化投资策略到底什么是量化投资 高中数学必修一、二的重点 快手官方背景资料 舌苔发白,两边有牙齿印是什么原因 chrome 字体发虚模糊是因为什么 高中数学怎么总结? 量化 python 数据怎么存 高中数学必修二有什么内容 如何解决搜狗浏览器6.0无法使用MacType进行字体渲染 怎么将Python的运行结果导出为csv格式? chrome 字体发虚模糊是因为什么? 用Python得到下面数据,请问怎么保存成不带括号也... 字体美化渲染神器MacType怎么使用 在python中怎样才能将爬去的内容保存下来txt? 如何保存python运行结果 win10安装的chrome字体显示模糊该怎么弄 怎么把python运行结果保存到log? Windows 下除了 MacType 还有什么字体渲染引擎 python循环结构数据 怎么以txt或者xls保存 为什么Google 浏览器有些网站的字体变细? mactype无法对chrome 38稳定版进行字体渲染 python怎么把数据输出到excel 函授本科毕业生登记表自我鉴定(精选3篇) 安卓系统,微信来信息没有提示音,该设置的都设置...