关于python:打开后保存的网页未显示任何内容

Saved web pages when opened shows nothing

我正在使用python抓取网页并将其保存。并且代码正常工作。但是当我打开网页时,它仅显示网站名称,即http://www.indiabix.com,而不显示实际内容。

您可以只访问该网站并保存其中一个页面,而不是主页,而是保存其他页面,例如http://www.indiabix.com/database/questions-and-answers/。并且当您打开它时,页面仅显示此

enter

1
2
3
4
5
6
def writeToFile(link, name, title):
    response = urllib2.urlopen(link)
    webContent = response.read()
    f = open(name + '/' + title, 'w')
    f.write(webContent)
    f.close

您只需传递链接,目录名称和文件标题。

我已经签入了Chrome,Firefox和Safari,并且都显示了相同的输出。如何解决此问题以完整显示整个保存的页面。

谢谢。


在浏览器中禁用Javascript,然后将其打开。


不可能。您可以通过右键单击网页并保存完整的Web文件来进行实验。然后使用浏览器打开.htm文件,您将得到相同的结果。而且,当您检查页面时,您会发现存在一些错误(找不到文件)。因此,我认为此网页中存在一些错误。

enter


您可以简化这样的事情。安装requests

1
2
3
4
5
6
import os
import requests

def write_to_file(link, name, title):
    with open(os.path.join(name, title),"w") as fp:
        fp.write(requests.get(link).content)