[python] parsovanie tagov
Tomy novella
tomasnovella na gmail.com
Pondělí Únor 11 14:30:13 CET 2008
ahoj,
dakujem velmi pekne obom za pripomienky a rady :)
a co dodat na zaver? ze som sa nakoniec pridrzal leovho 6-teho bodu a
konecny program vyzera takto(musim sa predsa pochvalit, nie?;-]):
-----
#!/usr/bin/python
import urllib,re
wwwroot = 'http://minnie.tuhs.org/UnixTree/V7/usr/src/cmd/'
def downloadFile(filename = "index.html"):
print ' Stahujem subor: "' + wwwroot+filename + ' " '
fp = urllib.urlopen(wwwroot+filename)
data = fp.read()
fp.close()
s=file(filename,'w')
s.write(data)
s.close()
def parseAndDownload():
reg = re.compile(r"href=(?P<url>[.a-z]+)\.html")
file = open('index.html','r')
for line in file.readlines():
res = reg.search(line)
url = res.group('url')
downloadFile(url)
print "stahovanie uspesne dokoncene!"
file.close()
downloadFile()
parseAndDownload()
-----
Další informace o konferenci Python