online - regex python meaning




Qual è la differenza tra re-rex e regex normale? (4)

Ho notato che la regex sostitutiva di vim è leggermente diversa dalle altre regexp. Qual è la differenza tra loro?


"Espressione regolare" definisce veramente gli algoritmi, non una sintassi. Ciò significa che i diversi sapori delle espressioni regolari useranno caratteri diversi per indicare la stessa cosa; o prefisso alcuni caratteri speciali con barre inverse dove altri non lo fanno. In genere funzionano ancora allo stesso modo.

C'era una volta, POSIX ha definito la sintassi dell'espressione regolare di base (BRE), che Vim segue in gran parte. Molto presto è stata anche presentata una proposta di sintassi dell'ERE (Extended Regular Expression). La principale differenza tra i due è che BRE tende a trattare più personaggi come letterali - un "a" è un "a", ma anche un "(" è un "(", "non un carattere speciale - e quindi implica più barre retroverse a dargli un significato "speciale".

La discussione sulle differenze complesse tra Vim e Perl su un commento separato qui è utile, ma vale anche la pena di menzionare alcuni dei modi più semplici in cui Vim regexes differiscono dalla norma "accettata" (con la quale probabilmente si intende Perl.) Come accennato sopra, essi differiscono principalmente nel loro uso di una barra retroversa precedente.

Ecco alcuni esempi ovvi:

Perl    Vim     Explanation
---------------------------
x?      x\=     Match 0 or 1 of x
x+      x\+     Match 1 or more of x
(xyz)   \(xyz\) Use brackets to group matches
x{n,m}  x\{n,m} Match n to m of x
x*?     x\{-}   Match 0 or 1 of x, non-greedy
x+?     x\{-1,} Match 1 or more of x, non-greedy
\b      \< \>   Word boundaries
$n      \n      Backreferences for previously grouped matches

Questo ti dà un assaggio delle differenze più importanti. Ma se stai facendo qualcosa di più complicato delle basi, ti suggerisco sempre di pensare che Vim-regex sia diverso da Perl-regex o Javascript-regex e consulta qualcosa come il sito web di Vim Regex .



Prova la modalità regex molto magica di Vim. Si comporta più come la regex tradizionale, ma antepone il modello con \v . Vedi :help /\v per maggiori informazioni. Lo adoro.


Se per "normale regex" si intende PerR-Compatible Regular Expressions (PCRE), la guida di Vim fornisce un buon sommario delle differenze tra regex di Vim e Perl:

:help perl-patterns

Ecco cosa dice di Vim 7.2:

9. Compare with Perl patterns                           *perl-patterns*

Vim's regexes are most similar to Perl's, in terms of what you can do.  The
difference between them is mostly just notation;  here's a summary of where
they differ:

Capability                      in Vimspeak     in Perlspeak ~
----------------------------------------------------------------
force case insensitivity        \c              (?i)
force case sensitivity          \C              (?-i)
backref-less grouping           \%(atom\)       (?:atom)
conservative quantifiers        \{-n,m}         *?, +?, ??, {}?
0-width match                   atom\@=         (?=atom)
0-width non-match               atom\@!         (?!atom)
0-width preceding match         atom\@<=        (?<=atom)
0-width preceding non-match     atom\@<!        (?!atom)
match without retry             atom\@>         (?>atom)

Vim and Perl handle newline characters inside a string a bit differently:

In Perl, ^ and $ only match at the very beginning and end of the text,
by default, but you can set the 'm' flag, which lets them match at
embedded newlines as well.  You can also set the 's' flag, which causes
a . to match newlines as well.  (Both these flags can be changed inside
a pattern using the same syntax used for the i flag above, BTW.)

On the other hand, Vim's ^ and $ always match at embedded newlines, and
you get two separate atoms, \%^ and \%$, which only match at the very
start and end of the text, respectively.  Vim solves the second problem
by giving you the \_ "modifier":  put it in front of a . or a character
class, and they will match newlines as well.

Finally, these constructs are unique to Perl:
- execution of arbitrary code in the regex:  (?{perl code})
- conditional expressions:  (?(condition)true-expr|false-expr)

...and these are unique to Vim:
- changing the magic-ness of a pattern:  \v \V \m \M
   (very useful for avoiding backslashitis)
- sequence of optionally matching atoms:  \%[atoms]
- \& (which is to \| what "and" is to "or";  it forces several branches
   to match at one spot)
- matching lines/columns by number:  \%5l \%5c \%5v
- setting the start and end of the match:  \zs \ze




vim