[python] Problem s regularnym vyrazom
RMiklos na pss.sk
RMiklos na pss.sk
Pátek Únor 2 09:15:54 CET 2007
Predtym som cital (
http://www.onlamp.com/pub/a/python/2006/01/26/pyparsing.html ) o module
pyparsing ( http://pyparsing.wikispaces.com/), ale zial nemal som cas sa
s tym zaoberat. Doteraz parsujem vsetko iba regularnymi vyrazmi. Zda sa mi
to najrychlejsie riesenie - i ked nie najlepsie a ma to tiez svoje hranice
a uskalia.
Dik za info -o yapps-e som doteraz nepocul.
Nevidim dokumetaciu Yappsu na tej stranke. preto sa chcem spytat:
1. aky je vstup pre Yapps? Nejako zapisana gramatika?
2. pouzil si Yapps1 alebo Yapps2
3. Nemas nejaky kratky priklad ako si parsoval to SQL?
s pozdravom
Roman
Jan Janech <devel na atlas.sk>
Sent by: python-bounces na py.cz
01.02.2007 16:51
Please respond to
Konference PyCZ <python na py.cz>
To
Konference PyCZ <python na py.cz>
cc
Subject
Re: [python] Problem s regularnym vyrazom
Na taketo veci sa hodia skor parser-generatory ako regularne vyrazy. Ja
pouzivam YAPPS (http://theory.stanford.edu/~amitp/yapps/). Konkretne SQL
som s nim uz parsoval.
RMiklos na pss.sk wrote:
> Rad by som tymto oslovil odbornikov na regularne vyrazy.
>
> Extrahujem datove polia tabulky cez regularny vyraz takto:
> --------------------------- skript ---------------------------
> import sys,re
>
> sql_statement='''CREATE TABLE IBPDDB071/R004660V
> (PERSONNR DECIMAL (10, 0) NOT NULL WITH DEFAULT, LFDNR1
DECIMAL
> (3, 0) NOT NULL WITH DEFAULT, VOTYP CHARACTER (1) NOT
> NULL WITH DEFAULT, BSSTAMMNR DECIMAL (7, 0) NOT NULL WITH
> DEFAULT,BSVNR DECIMAL (2, 0) NOT NULL WITH DEFAULT );'''
> regexp_sql_create=\
> re.compile(r"^\s*CREATE\s+TABLE\s+"
> r"(?P<library>[A-Z0-9]+)\s*[/.]\s*(?P<file>[A-Z0-9]+)\s*"
> r"\((?P<tbl_field_def>.*)\)\s*")
>
> result=regexp_sql_create.search(sql_statement)
> if result == None:
> # CREATE TABLE statement not valid !
> print "SQL CREATE TABLE statement is not valid !!!"
> sys.exit()
> else:
> # Parse data from RegExp
> library=result.group('library')
> print "Library=%s" % library
> table=result.group('file')
> print "Table=%s" %table
> table_field_def=result.group('tbl_field_def')
> print "Field Definitions=%s" % table_field_def
> ------------------------ konec skriptu ------------------------
>
> Potom definicie dat. poli dalej pracovavam.
> Toto by fungovalo, az na to ze SQL-skript je vygenerovany a okrem CREATE
> TABLE (...); moze obsahovat aj LABEL ON (...);
> takze moze vyzerat takto:
>
> sql_statement='''CREATE TABLE IBPDDB071/R004660V
> (PERSONNR DECIMAL (10, 0) NOT NULL WITH DEFAULT, LFDNR1
DECIMAL
> (3, 0) NOT NULL WITH DEFAULT, VOTYP CHARACTER (1) NOT
> NULL WITH DEFAULT, BSSTAMMNR DECIMAL (7, 0) NOT NULL WITH
> DEFAULT,BSVNR DECIMAL (2, 0) NOT NULL WITH DEFAULT );
Label
> on IBPDDB071/R004660V(PERSONNR IS 'PERSONNR', LFDNR1 IS 'LFDNR1',
> VOTYP IS 'VOTYP', BSSTAMMNR IS 'BSSTAMMNR', BSVNR IS
> 'BSVNR');'''
>
> Vtedy mi horeuvedeny regexp matchuje (pretoze je greedy) vsetko, takze
> rozpozna vsetko od 'CREATE TABLE(' az po poslednu zatvorku ')' stringu
> t.j. '..); LABEL ON(..' ale ja potrebujem aby rozpoznal len to co je v
> tele CREATE TABLE.
>
> Vie mi niekto poradit ako napisat ten regularny vyraz aby robil co
> potrebujem?
> Mgr. Ing. Roman MIKLÓ©
> Prvá stavebná sporiteµňa a.s.
> Bajkalská 30, P. O. Box 48
> 829 48 Bratislava 25
> Tel.: +421/ 2 / 582 31 174
> Fax: +421/ 2 / 582 31 109
_______________________________________________
Python mailing list
Python na py.cz
http://www.py.cz/mailman/listinfo/python
Mgr. Ing. Roman MIKLÓ©
Prvá stavebná sporiteµňa a.s.
Bajkalská 30, P. O. Box 48
829 48 Bratislava 25
Tel.: +421/ 2 / 582 31 174
Fax: +421/ 2 / 582 31 109
Daląí informace o konferenci Python