Pomocí modulu urllib
import urllib fp = urllib.urlopen('http://www.py.cz') data = fp.read() fp.close() # tisk a ulozeni print data s=file('pycz.html','w') s.write(data) s.close()
Pomocí modulu httplib
import httplib, os www="www.py.cz" souborNet="/HelpPage" # stazeni z Netu spojeni = httplib.HTTPConnection(www) spojeni.request("GET", souborNet) odpoved = spojeni.getresponse() print "Odpoved od www: ", odpoved.status, odpoved.reason data = odpoved.read() # do promenne data nacti cely soubor spojeni.close() # tisk a ulozeni print data souborLocal='HelpPage.html' f=file(souborLocal,'w') # otevri soubor f pro BINARNI zapis f.write(data) f.close() print "Soubor", souborLocal, "ulozen do", os.getcwd()
Více stránek pomocí httplib
Ukázka programu, který stáhne celou sérii článků z Programator.cz a uloží ji jako 1.html, 2.html atd. (úprava předchozího příkladu):
import httplib, os www="casopis.programator.cz" souborNetStart="/r-art.php?clanek=" spojeni = httplib.HTTPConnection(www) for x in range(1,177): # stazeni z Netu souborNet = souborNetStart + str(x) spojeni.request("GET", souborNet) odpoved = spojeni.getresponse() print "Odpoved od www: ", odpoved.status, odpoved.reason data = odpoved.read() # do promenne data nacti cely soubor # ulozeni na local souborLocal= str(x) + ".html" f=file(souborLocal,'w') # otevri soubor f pro zapis f.write(data) f.close() print "Soubor", souborLocal, "ulozen do", os.getcwd() spojeni.close() print "Vse stazeno!!!"