网站首页娱乐新闻焦点新闻历史秘闻社会百态技术文章科技资讯其他资讯女性专栏

首页 > 网络文摘 > 正文

BeautifulSoup解决中文网页乱码

浏览数：44 / 时间：2015年06月09日

以下代码，在执行结果中的中文出现乱码。

from bs4 import BeautifulSoup
import urllib2

request = urllib2.Request(‘http://www.163.com‘)
response = urllib2.urlopen(request)
html_doc = response.read()
soup = BeautifulSoup(html_doc)

print soup.find_all(‘a‘)

因为中文页面编码是gb2312，gbk，在BeautifulSoup构造器中传入from_encoding = "gb18030"参数可解决乱码问题。

注：在BeautifulSoup3中，from_encoding需修改为fromEncoding。

from bs4 import BeautifulSoup
import urllib2

request = urllib2.Request(‘http://www.163.com‘)
response = urllib2.urlopen(request)
html_doc = response.read()
soup = BeautifulSoup(html_doc, from_encoding = "gb18030")

print soup.find_all(‘a‘)

郑重声明：本站内容如果来自互联网及其他传播媒体，其版权均属原媒体及文章作者所有。转载目的在于传递更多信息及用于网络分享，并不代表本站赞同其观点和对其真实性负责，也不构成任何其他建议。

BeautifulSoup解决中文网页乱码

标签： class style 代码 com log html 问题 http la class style 代码 com log html 问题 http la

相关文章

随机文章

您可能还喜欢

您可能还喜欢

最新图文

更多

可爱穿搭很重要

可爱穿搭很重要

工藤美樱写真集

工藤美樱写真集

斯米兰海水是真不错

斯米兰海水是真不错

海边想拍氛围照

海边想拍氛围照

海岛度假

海岛度假

甜妹 ootd 穿搭

甜妹 ootd 穿搭

在大‮的理‬日‮就子‬是在‮海洱‬边发‬发呆

在大‮的理‬日‮就子‬是在‮海洱‬边发‬发呆

7080后儿时集体回忆插画

7080后儿时集体回忆插画

西安子午峪满山的白杜鹃太美了

西安子午峪满山的白杜鹃太美了

职业模特拍摄省事很多

职业模特拍摄省事很多

您可能还喜欢

更多

冯小刚24岁女儿近照曝光叼烟表情逗趣

冯小刚24岁女儿近照曝光叼烟表情逗趣

姚奠中书法

姚奠中书法

北影表演系花微博晒照：关之琳+杨幂合体

北影表演系花微博晒照：关之琳+杨幂合体

毛泽东和蒋介石的书法，你能区分不？

毛泽东和蒋介石的书法，你能区分不？

金曲奖红毯众星云集张学友陈奕迅角逐歌王

金曲奖红毯众星云集张学友陈奕迅角逐歌王

长春武僧严寒冬日苦练功夫

长春武僧严寒冬日苦练功夫

深圳孕妇当街产子路人组成人墙守护接生

深圳孕妇当街产子路人组成人墙守护接生

全球15万女性同秀旗袍挑战吉尼斯世界纪录

全球15万女性同秀旗袍挑战吉尼斯世界纪录

冷艳与纯真的美女艺术照

冷艳与纯真的美女艺术照

重庆街拍衣服买大了

重庆街拍衣服买大了

您可能还喜欢

更多

安倍在寿司店请奥巴马喝酒

安倍在寿司店请奥巴马喝酒

澳门赌场实拍美女

澳门赌场实拍美女

7080后儿时集体回忆插画

7080后儿时集体回忆插画

泰国地下女子裸体泰拳比赛照曝光

泰国地下女子裸体泰拳比赛照曝光

沈尹默书法

沈尹默书法

特斯拉电动车图集

特斯拉电动车图集

厦门旅游海边夜拍（2）

厦门旅游海边夜拍（2）

2014年Chinajoy精选

2014年Chinajoy精选

第十八届深港澳车展

第十八届深港澳车展

香港团体再次发起反水货客游行 33人被捕

香港团体再次发起反水货客游行 33人被捕