[python] parsovanie tagov

Tomy novella tomasnovella na gmail.com
Pondělí Únor 11 14:30:13 CET 2008


ahoj,
dakujem velmi pekne obom za pripomienky a rady :)

a co dodat na zaver? ze som sa nakoniec pridrzal leovho 6-teho bodu a
konecny program vyzera takto(musim sa predsa pochvalit, nie?;-]):

-----
#!/usr/bin/python

import urllib,re

wwwroot = 'http://minnie.tuhs.org/UnixTree/V7/usr/src/cmd/'
def downloadFile(filename = "index.html"):
	print ' Stahujem subor: "'  + wwwroot+filename + ' " '
	fp = urllib.urlopen(wwwroot+filename)
	data = fp.read()
	fp.close()

	s=file(filename,'w')	
	s.write(data)
	s.close()

def parseAndDownload():
	reg = re.compile(r"href=(?P<url>[.a-z]+)\.html")
	file = open('index.html','r')
	for line in file.readlines():
		res = reg.search(line)
		url = res.group('url')
		downloadFile(url)
	print "stahovanie uspesne dokoncene!"			
	file.close()

downloadFile()
parseAndDownload()
-----


Další informace o konferenci Python