20 awk eksempler

20 Awk Examples



Der findes mange værktøjer i Linux -operativsystemet til at søge og generere en rapport fra tekstdata eller filer. Brugeren kan let udføre mange typer søgning, udskiftning og rapportgenererende opgaver ved hjælp af kommandoer awk, grep og sed. awk er ikke bare en kommando. Det er et scriptsprog, der kan bruges fra både terminal- og awk -fil. Det understøtter variablen, betinget erklæring, array, loops osv. Som andre scriptsprog. Den kan læse ethvert filindhold linje for linje og adskille felterne eller kolonnerne baseret på en bestemt afgrænser. Det understøtter også regulært udtryk til søgning efter en bestemt streng i tekstindholdet eller filen og foretager handlinger, hvis der findes et match. Hvordan du kan bruge awk -kommando og script er vist i denne vejledning ved hjælp af 20 nyttige eksempler.

Indhold:

  1. awk med printf
  2. awk at dele på hvidt rum
  3. awk for at ændre grænsen
  4. awk med fanebaserede data
  5. awk med csv -data
  6. awk regex
  7. awk ufølsom regex
  8. awk med nf (antal felter) variabel
  9. awk gensub () -funktion
  10. awk med rand () funktion
  11. awk brugerdefineret funktion
  12. awk hvis
  13. awk variabler
  14. awk arrays
  15. awk loop
  16. awk for at udskrive den første kolonne
  17. awk for at udskrive den sidste kolonne
  18. ak med grep
  19. awk med bash script -filen
  20. ak med sed

Brug af awk med printf

printf () funktion bruges til at formatere alle output i de fleste programmeringssprog. Denne funktion kan bruges med awk kommando til at generere forskellige typer formaterede output. awk -kommando, der hovedsageligt bruges til enhver tekstfil. Opret en tekstfil med navnet medarbejder.txt med nedenstående indhold, hvor felter er adskilt af fane (‘ t’).







medarbejder.txt



1001 John sena 40000
1002 Jafar Iqbal 60000
1003 Meher Nigar 30000
1004 Jonny Liver 70000

Følgende awk -kommando læser data fra medarbejder.txt fil linje for linje, og udskriv den første arkiverede efter formatering. Her, %10s n betyder, at output vil være 10 tegn langt. Hvis værdien af ​​output er mindre end 10 tegn, tilføjes mellemrummene foran på værdien.



$ awk'{printf'%10s n', $ 1}'medarbejder.txt

Produktion:





Gå til indhold



awk at dele på hvidt rum

Standardordet eller feltseparatoren til opdeling af enhver tekst er hvidt mellemrum. kommandoen awk kan tage tekstværdi som input på forskellige måder. Inputteksten sendes fra smed ud kommando i det følgende eksempel. Teksten, ' Jeg kan godt lide at programmere 'Vil blive delt som standardseparator, plads , og det tredje ord udskrives som output.

$smed ud 'Jeg kan godt lide at programmere' | awk '{print $ 3}'

Produktion:

Gå til indhold

awk for at ændre grænsen

kommandoen awk kan bruges til at ændre afgrænseren for ethvert filindhold. Antag, at du har en tekstfil med navnet phone.txt med følgende indhold, hvor ‘:’ bruges som feltseparator for filindholdet.

phone.txt

+123: 334: 889: 778
+880: 1855: 456: 907
+9: 7777: 38644: 808

Kør følgende awk -kommando for at ændre afgrænsningen, ':' ved '-' til filens indhold, phone.txt .

$ kat telefon.txt
$ awk '$ 1 = $ 1' FS = ':' OFS = '-' phone.txt

Produktion:

Gå til indhold

awk med fanebaserede data

kommandoen awk har mange indbyggede variabler, der bruges til at læse teksten på forskellige måder. To af dem er FS og OFS . FS er inputfeltseparator og OFS er outputfeltseparatorvariabler. Anvendelsen af ​​disse variabler er vist i dette afsnit. Lave en fane adskilt fil navngivet input.txt med følgende indhold til at teste brugen af FS og OFS variabler.

Input.txt

Scriptsprog på klientsiden
Scriptssprog på serversiden
Databaseserver
Webserver

Brug af FS -variabel med fane

Den følgende kommando vil dele hver linje af input.txt fil baseret på fanen (‘ t’), og udskriv det første felt på hver linje.

$awk '{print $ 1}' FS='t'input.txt

Produktion:

Brug af OFS -variabel med fane

Følgende awk -kommando udskriver 9th og 5th felter af 'Ls -l' kommandoutput med faneudskiller efter udskrivning af kolonnenavnet Navn og Størrelse . Her, OFS variabel bruges til at formatere output med en fane.

$ls -det
$ls -det | awk -v OFS='t' 'BEGIN {printf'%s t%s n ',' Name ',' Size '} {print $ 9, $ 5}'

Produktion:

Gå til indhold

ak med CSV -data

Indholdet af enhver CSV -fil kan analyseres på flere måder ved hjælp af kommandoen awk. Opret en CSV -fil med navnet ' kunde.csv 'Med følgende indhold for at anvende awk -kommando.

kunde.txt

Id, navn, e -mail, telefon
1, Sophia, [email protected], (862) 478-7263
2, Amelia, [email protected], (530) 764-8000
3, Emma, ​​[email protected], (542) 986-2390

Læser enkelt felt i CSV -fil

'-F' indstilling bruges med kommandoen awk til at indstille afgrænseren for opdeling af hver linje i filen. Følgende awk -kommando udskriver navn felt af kunden. csv fil.

$katkunde.csv
$awk -F ',' '{print $ 2}'kunde.csv

Produktion:

Læsning af flere felter ved at kombinere med anden tekst

Følgende kommando udskriver tre felter med kunde.csv ved at kombinere titeltekst, Navn, e -mail og telefon . Den første linje i kunde.csv filen indeholder titlen på hvert felt. INGEN variabel indeholder filens linjenummer, når kommandoen awk analyserer filen. I dette eksempel, NR variabel bruges til at udelade den første linje i filen. Outputtet viser 2nd, 3rdog 4thfelter på alle linjer undtagen den første linje.

$awk -F ',' 'NR> 1 {print' Navn: '$ 2', E -mail: '$ 3', Telefon: '$ 4}'kunde.csv

Produktion:

Læser CSV -fil ved hjælp af et awk -script

awk -script kan udføres ved at køre awk -fil. Hvordan du kan oprette awk -fil og køre filen, er vist i dette eksempel. Opret en fil med navnet awkcsv.awk med følgende kode. BEGYNDE nøgleord bruges i scriptet til at informere awk -kommandoen til at udføre scriptet af BEGYNDE del først, før du udfører andre opgaver. Her, feltseparator ( FS ) bruges til at definere opdeling af afgrænsning og 2ndog 1stfelter udskrives i henhold til det format, der bruges i printf () -funktionen.

awkcsv.awk
BEGYNDE{FS= ','} { printf '% 5s (% s) n',$2,$1}

Løb awkcsv.awk fil med indholdet af kunden. csv fil med følgende kommando.

$awk -fawkcsv.awk kunde.csv

Produktion:

Gå til indhold

awk regex

Det almindelige udtryk er et mønster, der bruges til at søge efter en streng i en tekst. Forskellige former for kompliceret søgning og udskiftning af opgaver kan udføres meget let ved hjælp af det regulære udtryk. Nogle enkle anvendelser af det regulære udtryk med kommandoen awk vises i dette afsnit.

Matchende karaktersæt

Følgende kommando matcher ordet Nar eller bool eller Fedt nok med inputstrengen og udskriv, hvis ordet findes. Her, Dukke vil ikke matche og ikke udskrive.

$printf 'Narre nFedt nok nDukke nbool ' | awk '/[FbC] ool/'

Produktion:

Søger efter streng i starten af ​​linjen

'^' symbol bruges i det regulære udtryk til at søge efter et hvilket som helst mønster i starten af ​​linjen. ' Linux ' ord søges i starten af ​​hver linje i teksten i det følgende eksempel. Her starter to linjer med teksten, 'Linux ', Og disse to linjer vises i output.

$smed ud -Og 'Linux er gratis at bruge nDet er en open-source software nLinuxHint er
et populært blogsite '
| awk '/^Linux/'

Produktion:

Søger streng efter enden af ​​linjen

'$' symbol bruges i det regulære udtryk til at søge efter et mønster i slutningen af ​​hver linje i teksten. ' Manuskript ’Søges efter ord i det følgende eksempel. Her indeholder to linjer ordet, Manuskript i slutningen af ​​linjen.

$smed ud -Og 'PHP Script nJavaScript nVisuel programmering ' | awk '/Script $/'

Produktion:

Søgning ved at udelade et bestemt tegnsæt

'^' symbol angiver starten af ​​teksten, når den bruges foran et strengmønster (‘ / ^… /’) eller før et tegnsæt erklæret af ^ […] . Hvis '^' symbolet bruges inde i den tredje parentes, [^…] så udelades det definerede tegnsæt inde i parentesen på søgningstidspunktet. Følgende kommando søger efter ethvert ord, der ikke starter med 'F' men slutter med ' ool '. Fedt nok og bool udskrives i henhold til mønster og tekstdata.

$ printf 'Narre nFedt nok nDukke nbool ' |awk' / [^ F] ool /'

Produktion:

Gå til indhold

awk ufølsom regex

Som standard foretager regulært udtryk store og små bogstaver, når der søges efter et mønster i strengen. Etui ufølsom søgning kan udføres med awk -kommando med det regulære udtryk. I det følgende eksempel, at sænke() funktion bruges til at foretage store og små ufølsomme søgninger. Her vil det første ord i hver linje i inputteksten blive konverteret til små bogstaver ved hjælp af at sænke() funktion og match med det regulære udtryksmønster. toupper () funktion kan også bruges til dette formål, i dette tilfælde skal mønsteret defineres med alle store bogstaver. Teksten defineret i følgende eksempel indeholder søgeordet, 'Web 'I to linjer, der udskrives som output.

$smed ud -Og 'Webdesign nweb-udvikling nRammer ' | awk 'tolower ($ 0) ~ /^web /;'

Produktion:

Gå til indhold

awk med NF (antal felter) variabel

NF er en indbygget variabel af kommandoen awk, der bruges til at tælle det samlede antal felter i hver linje i inputteksten. Opret en tekstfil med flere linjer og flere ord. input.txt fil bruges her, som er oprettet i det foregående eksempel.

Brug af NF fra kommandolinjen

Her bruges den første kommando til at vise indholdet af input.txt fil og anden kommando bruges til at vise det samlede antal felter i hver fillinje vha NF variabel.

$ cat input.txt
$ awk '{print NF}' input.txt

Produktion:

Brug af NF i awk -fil

Opret en awk -fil med navnet count.awk med scriptet nedenfor. Når dette script udføres med eventuelle tekstdata, udskrives hvert linieindhold med samlede felter som output.

count.awk

{udskrive $0}
{Print'[I alt felter:'NF']'}

Kør scriptet med følgende kommando.

$awk -fcount.awk input.txt

Produktion:

Gå til indhold

awk gensub () -funktion

getub () er en substitutionsfunktion, der bruges til at søge efter streng baseret på en særlig afgrænsning eller et regulært udtryksmønster. Denne funktion er defineret i 'Gawk' pakke, der ikke er installeret som standard. Syntaksen for denne funktion er angivet nedenfor. Den første parameter indeholder det regulære udtryksmønster eller søgefelter, den anden parameter indeholder erstatningsteksten, den tredje parameter angiver, hvordan søgningen vil blive udført, og den sidste parameter indeholder den tekst, som denne funktion skal anvendes i.

Syntaks:

gensub(regexp, udskiftning, hvordan[, mål])

Kør følgende kommando for at installere gawk pakke til brug getub () funktion med awk -kommando.

$ sudo apt-get install gawk

Opret en tekstfil med navnet ' salesinfo.txt 'Med følgende indhold for at øve dette eksempel. Her er felterne adskilt af en fane.

salesinfo.txt

Min 700.000
Din 800000
Ons 750000
Saml 200.000
Fri 430000
Lør 820000

Kør følgende kommando for at læse de numeriske felter i salesinfo.txt fil og udskriv det samlede salgssum. Her angiver den tredje parameter, 'G' den globale søgning. Det betyder, at mønsteret søges i hele filens indhold.

$awk '{x = gensub (' t ',' ',' G ', $ 2); printf x '+'} END {print 0} 'salesinfo.txt| bc -det

Produktion:

Gå til indhold

awk med rand () funktion

række() funktion bruges til at generere et vilkårligt tal større end 0 og mindre end 1. Så det vil altid generere et brøknummer mindre end 1. Følgende kommando genererer et brøk tilfældigt tal og multiplicerer værdien med 10 for at få et tal mere end 1. Et brøknummer med to cifre efter decimaltegnet udskrives for at anvende funktionen printf (). Hvis du kører følgende kommando flere gange, får du forskellige output hver gang.

$awk 'BEGIN {printf' Number is =%. 2f n ', rand ()*10}'

Produktion:

Gå til indhold

awk brugerdefineret funktion

Alle funktioner, der bruges i de foregående eksempler, er indbyggede funktioner. Men du kan erklære en brugerdefineret funktion i dit awk-script til at udføre en bestemt opgave. Antag, at du vil oprette en brugerdefineret funktion til at beregne arealet af et rektangel. For at udføre denne opgave skal du oprette en fil med navnet ' area.awk 'Med følgende script. I dette eksempel navngives en brugerdefineret funktion areal() erklæres i scriptet, der beregner området baseret på inputparametrene og returnerer arealværdien. getline kommando bruges her til at tage input fra brugeren.

area.awk

# Beregn område
fungereareal(højde,bredde){
Vend tilbagehøjde*bredde
}

# Starter udførelsen
BEGYNDE{
Print'Indtast værdien af ​​højden:'
getline h< '-'
Print'Indtast værdien af ​​bredde:'
getline m< '-'
Print'Område ='areal(h,i)
}

Kør scriptet.

$awk -farea.awk

Produktion:

Gå til indhold

awk hvis eksempel

awk understøtter betingede udsagn som andre standard programmeringssprog. Tre typer if -sætninger vises i dette afsnit ved hjælp af tre eksempler. Opret en tekstfil med navnet items.txt med følgende indhold.

items.txt

HDD Samsung $ 100
Mus A4Tech
Printer HP $ 200

Enkelt hvis eksempel :

den følgende kommando vil læse indholdet af items.txt fil og tjek 3rd feltværdi i hver linje. Hvis værdien er tom, udskriver den en fejlmeddelelse med linjenummeret.

$awk '{if ($ 3 ==' ') print' Prisfelt mangler i linjen 'NR}'items.txt

Produktion:

if-else eksempel:

Følgende kommando udskriver varens pris, hvis 3rdfeltet findes i linjen, ellers udskriver det en fejlmeddelelse.

$ awk'{if ($ 3 ==' ') print' Prisfelt mangler '
ellers print 'varepris er' $ 3} '
genstande.txt

Produktion:

if-else-if eksempel:

Når følgende kommando udføres fra terminalen, tager den input fra brugeren. Inputværdien vil blive sammenlignet med hver if -betingelse, indtil betingelsen er sand. Hvis en betingelse bliver sand, udskriver den den tilsvarende karakter. Hvis inputværdien ikke matcher nogen betingelser, udskrives den ikke.

$awk 'BEGIN {print' Indtast mærket: '
getline mærke<'-'
hvis (mærke> = 90) udskrives 'A+'
ellers hvis (mark> = 80) udskriver 'A'
ellers hvis (mærke> = 70) udskriver 'B+'
ellers udskriv 'Fail'} '

Produktion:

Gå til indhold

awk variabler

Erklæringen om awk -variabel ligner deklarationen af ​​skalvariablen. Der er en forskel i at læse værdien af ​​variablen. '$' Symbol bruges sammen med variabelnavnet for skalvariablen til at læse værdien. Men det er ikke nødvendigt at bruge '$' med awk -variabel for at aflæse værdien.

Brug af en enkel variabel:

Følgende kommando erklærer en variabel med navnet 'Websted' og en strengværdi tildeles den variabel. Værdien af ​​variablen udskrives i den næste sætning.

$awk 'BEGIN {site =' LinuxHint.com '; print site} '

Produktion:

Brug af en variabel til at hente data fra en fil

Følgende kommando søger efter ordet 'Printer' i filen items.txt . Hvis en linje i filen starter med 'Printer 'Så gemmer den værdien af 1st , 2nd og 3rd felter i tre variabler. navn og pris variabler udskrives.

$ awk'/ Printer/ {navn = $ 1; mærke = $ 2; pris = $ 3; udskriv' varenavn = 'navn;
print 'item price =' price} '
genstande.txt

Produktion:

Gå til indhold

awk arrays

Både numeriske og tilhørende arrays kan bruges i awk. Array variabel erklæring i awk er den samme som andre programmeringssprog. Nogle anvendelser af arrays er vist i dette afsnit.

Associativ matrix:

Indekset for arrayet vil være en hvilken som helst streng for det associative array. I dette eksempel deklareres og udskrives et associeret array med tre elementer.

$awk 'BEGYNDE {
books ['Web Design'] = 'Lær HTML 5';
books ['Web Programming'] = 'PHP og MySQL'
books ['PHP Framework'] = 'Learning Laravel 5'
printf '%s n%s n%s n', bøger ['Webdesign'], bøger ['Webprogrammering'],
bøger ['PHP Framework']} '

Produktion:

Numerisk matrix:

Et numerisk array med tre elementer erklæres og udskrives ved at adskille fane.

$ awk'BEGYNDE {
nummer [0] = 80;
nummer [1] = 55;
nummer [2] = 76;

# print array -elementer
printf 'Arrayværdier: %d t%d t%d n', nummer [0], nummer [1], nummer [2]; } '

Produktion:

Gå til indhold

awk loop

Tre typer sløjfer understøttes af awk. Brugen af ​​disse sløjfer er vist her ved hjælp af tre eksempler.

Mens loop:

mens loop, der bruges i den følgende kommando, gentages i 5 gange og forlader loop for break -sætningen.

$ awk 'BEGYND {n = 1; mens (n ​​5) går i stykker; tryk n; n ++}} '

Produktion:

Til loop:

For loop, der bruges i følgende awk -kommando, beregnes summen fra 1 til 10 og udskriver værdien.

$awk 'BEGYNN {sum = 0; for (n = 1; n<= 10; n++) sum=sum+n; print sum }'

Produktion:

Do-while loop:

en do-while loop af følgende kommando udskriver alle lige numre fra 10 til 5.

$awk 'BEGYNN {tæller = 10; udfør {if (tæller%2 == 0) udskriv tæller; tæller--}
mens (tæller> 5)} '

Produktion:

Gå til indhold

awk for at udskrive den første kolonne

Den første kolonne i enhver fil kan udskrives ved hjælp af $ 1 variabel i awk. Men hvis værdien af ​​den første kolonne indeholder flere ord, udskrives kun det første ord i den første kolonne. Ved at bruge en bestemt afgrænser kan den første kolonne udskrives korrekt. Opret en tekstfil med navnet studerende.txt med følgende indhold. Her indeholder den første kolonne teksten med to ord.

Studerende.txt

Kaniz Fatema 30thparti
Abir Hossain 35thparti
John Abraham 40thparti

Kør kommandoen awk uden afgrænsning. Den første del af den første kolonne udskrives.

$awk '{print $ 1}'studerende.txt

Kør kommandoen awk med følgende afgrænser. Hele delen af ​​den første kolonne udskrives.

$awk -F '\ s \ s' '{print $ 1}'studerende.txt

Produktion:

Gå til indhold

awk for at udskrive den sidste kolonne

$ (NF) variabel kan bruges til at udskrive den sidste kolonne i enhver fil. Følgende awk -kommandoer udskriver den sidste del og hele delen af ​​den sidste kolonne af eleverne.txt fil.

$awk '{print $ (NF)}'studerende.txt
$awk -F '\ s \ s' '{print $ (NF)}'studerende.txt

Produktion:

Gå til indhold

ak med grep

grep er en anden nyttig kommando for Linux til at søge efter indhold i en fil baseret på ethvert regulært udtryk. Hvordan både awk og grep kommandoer kan bruges sammen, er vist i følgende eksempel. greb kommando bruges til at søge oplysninger om medarbejder -id'et, ' 1002 ' fra medarbejderen.txt fil. Outputtet fra grep -kommandoen sendes til awk som inputdata. 5% bonus tælles og udskrives baseret på lønnen til medarbejder -id'et, ' 1002 ' med awk -kommando.

$katmedarbejder.txt
$greb '1002'medarbejder.txt| awk -F 't' '{print $ 2' får $ '($ 3*5)/100' bonus '}'

Produktion:

Gå til indhold

awk med BASH -fil

Ligesom andre Linux -kommandoer kan kommandoen awk også bruges i et BASH -script. Opret en tekstfil med navnet kunder.txt med følgende indhold. Hver linje i denne fil indeholder oplysninger om fire felter. Disse er kundens id, navn, adresse og mobilnummer, som adskilles af '/ '.

kunder.txt

AL4934 / Charles M Brunner / 4838 Beeghley Street, Huntsville, Alabama / 256-671-7942
CA5455 / Virginia S Mota / 930 Bassel Street, VALLECITO, Californien / 415-679-5908
IL4855 / Ann A Neale / 1932 Patterson Fork Road, Chicago, Illinois / 773-550-5107

Opret en bash -fil med navnet item_search.bash med følgende script. Ifølge dette script vil tilstandsværdien blive taget fra brugeren og søgt ind kunderne.txt fil af greb kommando og videregivet til kommandoen awk som input. Awk -kommandoen læser 2nd og 4th felter på hver linje. Hvis inputværdien stemmer overens med en tilstandsværdi på kunder.txt fil, så udskriver den kundens navn og mobilnummer ellers udskriver det meddelelsen Ingen kunde fundet .

item_search.bash

#!/bin/bash
smed ud 'Indtast statens navn:'
Læsstat
kunder=``greb '$ stat'kunder.txt| awk -F '/' '{print' Kundenavn: '$ 2',
Mobilnummer: '$ 4}'
``
hvis [ '$ kunder' !='' ];derefter
smed ud $ kunder
andet
smed ud 'Ingen kunde fundet'
være

Kør følgende kommandoer for at vise output.

$katkunder.txt
$bashitem_search.bash

Produktion:

Gå til indhold

ak med sed

Et andet nyttigt søgeværktøj til Linux er sed . Denne kommando kan bruges til både søgning og udskiftning af tekst i enhver fil. Følgende eksempel viser brugen af ​​awk -kommando med sed kommando. Her vil sed -kommandoen søge i alle medarbejdernavne, der starter med ' J 'Og videregives til kommandoen awk som input. awk vil udskrive medarbejder navn og ID efter formatering.

$katmedarbejder.txt
$sed -n '/J/p'medarbejder.txt| awk -F 't' '{printf'%s (%s) n ', $ 2, $ 1}'

Produktion:

Gå til indhold

Konklusion:

Du kan bruge kommandoen awk til at oprette forskellige typer rapporter baseret på tabellformede eller afgrænsede data efter at have filtreret dataene korrekt. Håber, du vil være i stand til at lære, hvordan kommandoen awk fungerer, efter at have øvet eksemplerne vist i denne vejledning.