Improving ast-Wikipedia
Remano funciones regex complexes en llistaos d'artículos, corrixendo espresiones mal formaes nel formatu wiki.

Plurales mal formados en 'us'.

python pwb.py ./scripts/replace.py -start:! -regex "\[\[\b([a-zA-ZáéíóúÁÉÍÓÚñÑ]+)(u\b)\]\]s\b" "[[\1u|\1os]]"

Exemplos:

  • [[viquingu]]s >> [[viquingu|viquingos]] => viquingos
  • [[arácnidu]]s >> [[arácnidu|arácnidos]] => arácnidos

Apostrof. en la segunda parte del enllaz:

python pwb.py ./scripts/replace.py -start:u -exceptinsidetag:template -exceptinsidetag:link -regex "\bde \[\[([^\]]*?\|[A|a|E|e|I|i|O|o|U|u|H|h].*?)\]\]" "d'[[\1]]"

Exemplos:

  • Natural de [[Provincia d'Ourense|Ourense]] >> Natural d'[[Provincia d'Ourense|Ourense]] => Natural d'Ourense
  • en forma de [[Ser vivu|organismos]] >> en forma d'[[Ser vivu|organismos]] => en forma d'organismos

python pwb.py ./scripts/replace.py -start:! -regex "([bcdfghjklmnpqrstvwxyz]+)o (I\]\]|V\]\]|X\]\]|I\ |V\ |X\ |I|II|III|IV|V|VI|VII|VIII|IX|X|XI|XII|XIII|XIV|XV|XVI|XVII|XVIII)\b" "\1u \2"

  • Busca tolos xxxxxxxo sacantes los que terminen en -ao, -eo, -io, -oo, -uo.
Menos dientro de los ficheros d'imáxenes
  • python pwb.py ./scripts/replace.py -page:prueba -exceptinsidetag:"\[\[Ficheru|Archivu\:(.*?)\|" -regex "([^aeiou]+)o (I\]\]|V\]\]|X\]\]|I\ |V\ |X\ |I|II|III|IV|V|VI|VII|VIII|IX|X|XI|XII|XIII|XIV|XV|XVI|XVII|XVIII)\b" "\1u \2"