Brug af grep (og egrep) med regulære udtryk

Using Grep With Regular Expressions



Denne vejledning beskriver, hvordan du bruger begge dele greb (og egrep) t o finde tekst i filer, i deres enkle form og når de kombineres med regulære udtryk. Den indeholder flere eksempler og øvelser , mere løsninger , for seeren at fuldføre.

Navnet greb kommer fra kommandoen ed (og vim) g/re/p, hvilket betyder globalt at søge efter et givet regulært udtryk og udskrive (vise) output.







Fast Udtryk

Hjælpeprogrammerne giver brugeren mulighed for at søge efter tekstfiler efter linjer, der matcher et regulært udtryk ( regexp ). Et regulært udtryk er en søgestreng, der består af tekst og et eller flere af 11 specialtegn. Et enkelt eksempel matcher starten af ​​en linje.



Prøvefil

Grundformen for greb kan bruges til at finde simpel tekst i en eller flere bestemte filer. For at prøve eksemplerne skal du først oprette prøvefilen.



Brug en editor som nano eller vim til at kopiere teksten herunder til en fil kaldet min fil .





xyz
xyzde
exyzd
dexyz
d? gxyz
xxz
xzz
x z
x*z
xz
x z
XYZ
XYYZ
xYz
xyyz
xyyyz
xyyyyz

Selvom du kan kopiere og indsætte eksemplerne i teksten (bemærk at dobbelte citater muligvis ikke kopieres korrekt), skal kommandoer indtastes for at lære dem korrekt.

Inden du prøver eksemplerne, skal du se prøvefilen:



$katmin fil

Enkel søgning

For at finde teksten 'xyz' i filen skal du køre følgende:

$grebxyz myfile

Brug af farver

For at vise farver skal du bruge –farve (en dobbelt bindestreg) eller blot oprette et alias. For eksempel:

$greb --farvexyz myfile

eller

$alias greb= ’greb--farve'
$grebxyz myfile

Muligheder

Almindelige muligheder, der bruges med greb kommandoen omfatter:

  • -jeg finder alle linjer uanset af sag
  • -c tælle hvor mange linjer der indeholder teksten
  • -n displaylinje tal af matchende linjer
  • -l kun display fil navne den kamp
  • -r rekursiv søgning i underkataloger
  • -v finde alle linjer IKKE der indeholder teksten

For eksempel:

$greb -jegxyz myfile# find tekst uanset sag

$greb -icxyz myfile# tæl linjer med tekst

$greb -ixyz myfile# vis linjenumre

Opret flere filer

Inden du prøver at søge efter flere filer, skal du først oprette flere nye filer:

$smed udxyz>myfile1
$smed ud -Ogxyz nxzz nXYZ>myfile2
$smed ud -Ogxxx nyåå>myfile3
$katmyfile1
$katmyfile2
$katmyfile3

Søg i flere filer

For at søge i flere filer ved hjælp af filnavne eller et jokertegn skal du indtaste:

$greb -icxyz myfile myfile1 myfile2 myfile3
$greb -ixyz min*
# match filnavne, der begynder med 'mit'

Øvelse I

  1. Tæl først, hvor mange linjer der er i filen /etc /passwd.
Tip: brugToilet -det /etc/passwd
  1. Find nu alle forekomster af teksten hvor i filen /etc /passwd .
  2. Find, hvor mange linjer i filen, der indeholder teksten
  3. Find ud af, hvor mange linjer der IKKE indeholder teksten hvor .
  4. Find posten til dit login i /etc/passwd

Træningsløsninger findes i slutningen af ​​denne artikel.

Brug af regulære udtryk

Kommandoen greb kan også bruges med regulære udtryk ved at bruge et eller flere af elleve specialtegn eller symboler til at forfine søgningen. Et regulært udtryk er en tegnstreng, der indeholder specialtegn for at tillade mønstertilpasning inden for værktøjer som f.eks greb , jeg kom og sed . Bemærk, at strengene muligvis skal være omsluttet af anførselstegn.

Tilgængelige specialtegn inkluderer:

^ Start på en linje
$ Slut på en linje
. Ethvert tegn (undtagen n ny linje)
* 0 eller mere af tidligere udtryk
Forud for et symbol gør det til en bogstavelig karakter

Bemærk, at *, som kan bruges på kommandolinjen til at matche et vilkårligt antal tegn, inklusive ingen, er ikke bruges på samme måde her.

Bemærk også brugen af ​​citater i de følgende eksempler.

Eksempler

Sådan finder du alle linjer, der starter med tekst ved hjælp af ^ -tegnet:

$greb'^Xyz' myfile

Sådan finder du alle linjer, der slutter med tekst ved hjælp af $ -tegnet:

$greb'Xyz $' myfile

Sådan finder du linjer, der indeholder en streng med både ^ og $ tegn:

$greb'^Xyz $' myfile

For at finde linjer ved hjælp af . for at matche enhver karakter:

$greb‘^X.z’ myfile

Sådan finder du linjer ved hjælp af * for at matche 0 eller mere i det foregående udtryk:

$greb'^Xy*z 'min fil

Sådan finder du linjer ved hjælp af.* For at matche 0 eller flere af et hvilket som helst tegn:

$greb'^ X.*z 'min fil

For at finde linjer ved hjælp af for at undslippe * karakteren:

$greb'^ X *z 'min fil

For at finde tegnet skal du bruge:

$greb'\' min fil

Udtryk grep - egrep

Det greb kommando understøtter kun en delmængde af de tilgængelige regulære udtryk. Men kommandoen egrep:

  • tillader fuld brug af alle regulære udtryk
  • kan samtidig søge efter mere end ét udtryk

Bemærk, at udtrykkene skal være indeholdt i et par anførselstegn.

Hvis du vil bruge farver, skal du bruge –farve eller igen oprette et alias:

$alias egrep='egrep -farve'

For at søge efter mere end én regex det egrep kommando kan skrives over flere linjer. Dette kan dog også gøres ved hjælp af disse specialtegn:

| Skifte, enten det ene eller det andet
(…) Logisk gruppering af en del af et udtryk
$egrep '(^root |^uucp |^mail)' /etc/passwd

Dette udtrækker de linjer, der begynder med root, uucp eller mail fra filen,. symbol betyder en af ​​mulighederne.

Følgende kommando vil ikke arbejde, selvom der ikke vises nogen meddelelse, da grundlæggende greb kommandoen understøtter ikke alle regulære udtryk:

$greb '(^root |^uucp |^mail)' /etc/passwd

Men på de fleste Linux -systemer er kommandoen grep -E er det samme som at bruge egrep :

$greb -OG '(^root |^uucp |^mail)' /etc/passwd

Brug af filtre

Rørføring er processen med at sende output fra en kommando som input til en anden kommando og er et af de mest kraftfulde Linux -værktøjer, der findes.

Kommandoer, der vises i en pipeline, omtales ofte som filtre, da de i mange tilfælde sigter igennem eller ændrer det input, der sendes til dem, før de sender den modificerede strøm til standardoutput.

I det følgende eksempel standard output fra ls -l sendes som standardindgang til greb kommando. Output fra greb kommandoen sendes derefter som input til mere kommando.

Dette viser kun mapper i /etc :

$ls -det /etc|greb'^D'|mere

Følgende kommandoer er eksempler på brug af filtre:

$ps -ef|grebcron

$WHO|grebkdm

Prøvefil

For at prøve gennemgåelsesøvelsen skal du først oprette følgende prøvefil.

Brug en editor som nano eller vim til at kopiere teksten herunder til en fil kaldet mennesker:

Personlig J.Smith 25000
Personlig E.Smith 25400
Uddannelse A.Brown 27500
Træning C.Browen 23400
(Admin) R.Bron 30500
Goodsout T.Smyth 30000
Personlig F.Jones 25000
uddannelse* C.Evans 25500
Goodsout W.Pave 30400
Stueetage T.Smythe 30500
Personlig J.Maler 33000

Øvelse II

  1. Vis filen mennesker og undersøge dens indhold.
  2. Find alle linjer, der indeholder strengen Smith i filen people.Hint: brug kommandoen grep, men husk, at det som standard er store og små bogstaver.
  3. Opret en ny fil, npeople, der indeholder alle linjer, der begynder med strengen Personlig i folkefilen.Hint: brug kommandoen grep med>.
  4. Bekræft indholdet af filen npeople ved at angive filen.
  5. Tilføj nu alle linjer, hvor teksten ender med strengen 500 i filen folk til filen npeople.Hint: brug kommandoen grep med >>.
  6. Igen, bekræft indholdet af filen npeople ved at liste filen.
  7. Find IP -adressen på den server, der er gemt i filen /etc/hosts .Tip: brug kommandoen grep med $ (værtsnavn)
  8. Brug egrep at udtrække fra /etc/passwd filkontolinjer, der indeholder lp eller din egen bruger ID .

Træningsløsninger findes i slutningen af ​​denne artikel.

Flere regulære udtryk

Et regulært udtryk kan betragtes som wildcards på steroider.

Der er elleve tegn med særlige betydninger: åbning og lukning af firkantede parenteser [], skråstreg , tegnet ^, dollartegnet $, punktum eller prik., Det lodrette bjælke- eller rørsymbol |, spørgsmålstegnet?, stjerne eller stjerne *, plustegnet + og åbning og lukning af beslag {}. Disse specialtegn kaldes også ofte metategn.

Her er det fulde sæt specialtegn:

^ Start på en linje
$ Slut på en linje
. Ethvert tegn (undtagen n ny linje)
* 0 eller mere af tidligere udtryk
| Skifte, enten det ene eller det andet
[…] Eksplicit sæt tegn, der skal matches
+ 1 eller flere af tidligere udtryk
? 0 eller 1 i tidligere udtryk
Forud for et symbol gør det til en bogstavelig karakter
{…} Eksplicit kvantificeringsnotation
(…) Logisk gruppering af en del af et udtryk

Standardversionen af greb har kun begrænset support til regulært udtryk. For at alle de følgende eksempler fungerer, skal du bruge egrep i stedet for eller grep -E .

For at finde linjer ved hjælp af | for at matche et af udtrykkene:

$egrep'Xxz|xzz 'min fil

Sådan finder du linjer ved hjælp af | Brug () for at matche begge udtryk i en streng:

$egrep'^ X(Yz|yz)'Min fil

Sådan finder du linjer med [] til at matche et hvilket som helst tegn:

$egrep'^ X[Åh]z 'min fil

Sådan finder du linjer med [] for IKKE at matche et tegn:

$egrep'^ X[^ Åh]z 'min fil

Sådan finder du linjer ved hjælp af * for at matche 0 eller mere i det foregående udtryk:

$egrep'^Xy*z 'min fil

Sådan finder du linjer ved hjælp af + for at matche 1 eller flere af det foregående udtryk:

$egrep‘^Xy+z’ myfile

For at finde linjer ved hjælp af? for at matche 0 eller 1 i det forrige udtryk:

$egrep‘^Xy? Z’ myfile

Opgave III

  1. Find alle linjer, der indeholder navnene Evans eller maler i filen mennesker.
  2. Find alle linjer, der indeholder navnene Smith, Smyth eller Smythe i filen mennesker.
  3. Find alle linjer, der indeholder navnene Brun, Browen eller Kilde i filen people.If du har tid:
  4. Find linjen, der indeholder strengen (admin), inklusive parenteserne i filerne.
  5. Find linjen, der indeholder tegnet * i filerne.
  6. Kombiner 5 og 6 ovenfor for at finde begge udtryk.

Flere eksempler

At finde linjer ved hjælp af . og * for at matche ethvert sæt tegn:

$egrep'^Xy.*z 'min fil

Sådan finder du linjer med {} til at matche N antal tegn:

$egrep'^Xy{3}z 'min fil
$egrep'^Xy{4}z 'min fil

Sådan finder du linjer, der bruger {} til at matche N eller flere gange:

$egrep'^Xy{3,}z 'min fil

Sådan finder du linjer, der bruger {} til at matche N -tider, men ikke mere end M -gange:

$egrep'^Xy{2,3}z 'min fil

Konklusion

I denne vejledning kiggede vi først på at bruge greb i sin enkle form til at finde tekst i en fil eller i flere filer. Vi kombinerede derefter den tekst, der skulle søges efter, med enkle regulære udtryk og derefter mere komplekse dem ved hjælp af egrep .

Næste skridt

Jeg håber, at du vil bruge den opnåede viden til god brug. Prøv greb kommandoer på dine egne data og husk, regulære udtryk som beskrevet her kan bruges i samme form i vi , sed og awk !

Træningsløsninger

Øvelse I

Tæl først, hvor mange linjer der er i filen /etc/passwd .
$ wc -l /etc/passwd
Find nu alle forekomster af teksten hvor i filen /etc /passwd.
$ grep var /etc/passwd
Find, hvor mange linjer i filen, der indeholder teksten hvor

greb -chvor/etc/passwd

Find ud af, hvor mange linjer der IKKE indeholder teksten hvor .

greb -cvhvor/etc/passwd

Find posten til dit login i /etc/passwd fil
grep kdm /etc/passwd

Øvelse II

Vis filen mennesker og undersøge dens indhold.
$ cat people
Find alle linjer, der indeholder strengen Smith i filen mennesker .
$ grep 'Smith' people
Opret en ny fil, mennesker , der indeholder alle linjer, der begynder med strengen Personlig i mennesker fil
$ grep '^Personal' people> npeople
Bekræft filens indhold mennesker ved at liste filen.
$ cat npeople
Tilføj nu alle linjer, hvor teksten ender med strengen 500 i filen mennesker til filen mennesker .
$ grep '500$' people>>npeople
Bekræft igen filens indhold mennesker ved at liste filen.
$ cat npeople
Find IP -adressen på den server, der er gemt i filen /etc/hosts .
$ grep $(hostname) /etc/hosts
Brug egrep at udtrække fra /etc/passwd filkontolinjer, der indeholder lp eller dit eget bruger -id.
$ egrep '(lp|kdm:)' /etc/passwd

Opgave III

Find alle linjer, der indeholder navnene Evans eller maler i filen mennesker .
$ egrep 'Evans|Maler' people
Find alle linjer, der indeholder navnene Smith , Smyth eller Smythe i filen mennesker .
$ egrep 'Sm(i|y)the?' people
Find alle linjer, der indeholder navnene Brun , Browen eller Kilde i filen mennesker.
$ egrep 'Brow?e?n' people
Find linjen, der indeholder strengen (admin), inklusive parenteserne i filen mennesker .

$egrep ' (Admin )'mennesker

Find den linje, der indeholder tegnet * i filen mennesker.
$ egrep '*' people
Kombiner 5 og 6 ovenfor for at finde begge udtryk.

$egrep ' (Admin ) | *'mennesker