Tehnopolis

Četvrtak, 28.09.2006.

16:24

PHP kurs: Uvod u regularne izraze

Bez obzira na prirodu projekta na kome radite, pre ili kasnije doći ćete u situaciju da morate manipulisati nekim tekstualnim podacima. Bilo da je u pitanju jednostavna validacija forme ili pak parsovanje podataka sa nekog live sajta, regularni izrazi (eng. Regular Expressions) su oruđe kojim morate ovladati da bi ste bili uspešni u tome.

Autor: Dragan Dinić

Nivo teksta: Srednji

O važnosti regularnih izraza dovoljno govori činjenica da je podrška za njih prisutna u svim modernim programskim jezicima (u Perlu su čak deo samog jezika), a možete ih koristiti i u većini naprednih tekst editora, alatima za pretragu itd.

Potpuno ovladavanje regularnim izrazima nije nešto što možete "odraditi" preko noći, šta više, tema je toliko opširna da je o njoj napisano i nekoliko knjiga. Cilj ovog tutorijala je da vas upozna sa osnovnim mogućnostima regularnih izraza kako biste bili u mogućnosti da ih efikasno koristite.

Šta su to regularni izrazi

Regularni izraz praktično predstavlja poseban skup znakova (string) u kome se odgovarajućom sintaksom (eng. pattern) taj niz upoređuje sa nekim drugim skupom znakova. Može se koristiti za pretragu unutar nekog teksta, izvlačenje određenog podstringa, validaciju (e-maila na primer) i sl. Možda sve ovo zvuči komplikovano, ali će stvar biti mnogo jasnija, čim krenemo sa nekoliko primera.

PHP podržava takozvane POSIX kao i Perl Kompatibilne regularne izraze. Iako među njima postoje izvesne razlike, osnovna sintaksa je u suštini ista, tako da ćemo sintaksu predstavljenu ovde koristiti i sa posix i sa perl kompatibilnim funkcijama. Inače, iako su primeri u PHP-u, oni se uz manje izmene mogu prilagoditi i drugim programskim jezicima, jer je sintaksa regularnih izraza manje više ista.

Sintaksa Regularnih Izraza

Prva dva specijalna karaktera sa kojima ćemo početi su '^' i '$'. Oni označavaju početak, odnosno kraj stringa. Tako na primer:

"^foo" - proverava da li string počinje sa "foo"
"foo$' - proverava da li se string završava sa "foo"

Recimo ako imamo string "Mali Perica uci PHP", rečnikom PHP-a to bi izgledalo ovako:

<code>
<?php

$string = "Mali Perica uci PHP";

// Vraca true ako se string "Perica" nalazi u promenljivoj $string
ereg("Perica", $string);

// Vraca true ako $string pocinje sa "Mali"
ereg("^Mali", $string);

// Vraca true ako se $string zavrsava sa "PHP"
ereg("PHP$", $string);

// Vraca true ako string sadrzi tacnu frazu "Mali Perica uci PHP"
ereg("^Mali Perica uci PHP$", $string);
?>
</code>

U kodu gore koristili smo ereg f-ju, koja spada u grupu Posix kompatibilnih f-ja. Obratite pažnju da je ona 'case-senzitivna' (za case-insensitive koristite funkciju eregi).

Simboli '?', '+', '*' i {} označavaju broj pojavljivanja nekog karaktera u stringu:

? - Karakter koji prethodi znaku '?' može se pojaviti jednom ili nijednom

(za pattern "ab?" odgovaralo bi "a","ab")

* - Karakter koji prethodi znaku '*' može se pojaviti <strong>nijednom</strong> ili više puta (za pattern "ab*" odgovaralo bi "a", "ab", "abb", "abbb", ...)

+ - Karakter koji prethodi znaku '+' može se pojaviti <strong>jedanput</strong> ili više puta
(za pattern "ab*" odgovaralo bi "ab", "abb", "abbb", ...)

{n} - Karakter koji prethodi znaku {n} može se pojaviti tačno n puta
(za pattern "ab{3}" odgovaralo bi "abbb")

{n, } - Karakter koji prethodi znaku {n, } može se pojaviti najmanje n puta
(za pattern "ab{3,}" odgovaralo bi "abbb", "abbbb", "abbbb", ...)

{n,m} - Karakter koji prethodi znaku {n,m} može se pojaviti n do m puta.
(za pattern "ab{2,4}" odgovaralo bi "abb", "abbb", "abbbb")

Pored broja pojavljivanja, mozemo definisati i tačan skup znakova koje string sme da sadrži. Na primer:

'.' - Bilo koji karakter
[abc] - Samo slova a, b i c
[a-z] - Sva mala slova od a do z
[A-Z] - Sva velika slova od A do Z
[a-zA-z] - Sva slova, mala ili velika
[0-9] - Svi brojevi od 0 - 9
[a-zA-Z0-9] Svi alfanumericki karakteri

Unutar zagrada [] simbol '^' koristimo kao negaciju, tako na primer, ako želimo da naš string ne sadrži brojeve koristili bi nešto poput:
[^0-9].

Pored skupova znakova koje sami definišemo, postoje već predefinisani skupovi znakova, a to su:

[[:alnum:]] - Bilo koji alfanumerički karakter (isto što i [a-zA-Z0-9])
[[:alpha:]] - Bilo koje slovo (isto što i [a-zA-Z])
[[:upper:]] - Bilo koje veliko slovo (isto što i [A-Z])
[[:lower:]] - Bilo koje malo slovo (isto što i [a-z])
[[:blank:]] - Tab i space karakter (isto što i [\t ])
[[:space:]] - Bilo koji space karakter
[[:digit:]] - Bilo koji broj (isto što i [0-9])
[[:xdigit:]] - Bilo koji heksadecimalan broj
[[:punct:]] - Bilo koji od znakova ".,"'?!;:"
[[:print:]] - Svi printabilni karakteri
[[:graph:]] - Svi printabilni karakteri (osim spaceova)

I poslednje ali ne i najmanje bitno, izbor od <string>tačno
jednog</string> elementa iz definisanog skupa:
(string1|string2|...|stringn)
Na primer za pattern "(a|b)cde" stringovi "acde" i "bcde" bi bili
odgovarajući. Takođe, zagrade možemo koristiti za pravljenje
"subpatterna", poput "ba(na)+" ("bana","banana","bananana", ...).

Toliko o teoriji, a sada da vidimo kako regularne izraze upotrebiti u
praksi, za recimo validaciju forme.

<code>
<?php

// validacija korisnickog imena
// dozvoljavamo samo korisnicko ime koje sadrzi alfanum i donju crtu
// minimum 6, max 20 karaktera
$found = preg_match("/^[a-zA-Z0-9_]{6,20}$/", $username);

if(!$found)
{
   echo "Korisnicko ime nije validno";
}

// validacija telefona
// prihvatamo samo brojeve i karaktere iz skupa [+/()]
//obratite paznju na koriscenje escape karaktera "\" za '.', '/', '(' i ')'
$found = preg_match("/^[0-9+\-\.\/ ]{6,30}$/", $phonenum);

if(!$found)
{
   echo "Telefon nije validan";
}

//validacija datuma u mysql formatu (YYYY-MM-DD)
$found = preg_match("/^[0-9]{4}-[0-9]{2}-[0-9]{2}$/", $datum);

if(!$found)
{
   echo "Datum nije validan";
}

// validacija usa zip koda
// USA zipocode je u formatu xxxxx ili xxxxx-xxxx
// gde je x bilo koji ceo broj
// na primer 12345 ili 12345-1234

$found = preg_match("/^([0-9]{5}|([0-9]{5}-[0-9]{4}))$/", $datum);

if(!$found)
{
   echo "Zipcode nije validan";
}

// jednostavna validacija emaila
$found = preg_match("/^[a-zA-Z0-9\.\-]+@[a-zA-Z0-9\.\-]+$/", $datum);

if(!$found)
{
   echo "e-mail nije validan";
}
?>
</code>

Uskoro sledi nastavak, sa objašnjenjem na praktičnom primeru. Konkretno, bićete u prilici da pročitate case study na temu parsiranja srpskih blogova.

Dragan Dinić je 32-godišnji Web programer sa preko 5 godina iskustva u razvoju LAMP based aplikacija. U slobodno vreme Dragan vodi svoj blog ili diskutuje o Internet tehnologijama na raznim Web forumima.

Ovo je arhivirana verzija originalne stranice. Izvinjavamo se ukoliko, usled tehničkih ograničenja, stranica i njen sadržaj ne odgovaraju originalnoj verziji.

Komentari 3

Pogledaj komentare

3 Komentari

Možda vas zanima

Istočni front

Rat – dan 1.546: Rusija gađala Naftogaz; Tramp poslao poruku o Putinu; Pokrovsk totalno okupiran FOTO/VIDEO

Rat u Ukrajini ušao je u 1.545. dan, a američki predsednik Donald Tramp negirao je medijske izveštaje da je kineski lider Si Đinping rekao da bi ruski lider Vladimir Putin na kraju mogao da zažali zbog invazije na Ukrajinu.

23:57

19.5.2026.

1 d

Partizan eliminisao Zvezdu; Penjaroja: "Teško je dobiti četiri derbija zaredom"; Bizaran potez Saše Obradovića

148 B92.sport

ABA

uživo Partizan eliminisao Zvezdu; Penjaroja: "Teško je dobiti četiri derbija zaredom"; Bizaran potez Saše Obradovića

Košarkaši Partizana pobedili su Crvenu zvezdu 2-0 u polufinalnoj seriji ABA lige.

22:38

21.5.2026.

4 min

Istočni front

Budimpešta ima važan uslov za Kijev; Ukrajina žestoko napala Rusiju; "Odgovorićemo" FOTO/VIDEO

Rat u Ukrajini – 1.547 dan. Ukrajina je nastavila napade na rusku naftnu infrastrukturu. Portparol Kremlja Dmitrij Peskov rekao je da moguć susret ruskog predsednika Vladimira Putina i njegovog američkog kolege Donalda Trampa u Kini na jesen.

23:40

20.5.2026.

23 h

Pobuna tenisera na Rolan Garosu – odlaze posle 15 minuta

20 B92.sport

Zaoštrava se sukob

Pobuna tenisera na Rolan Garosu – odlaze posle 15 minuta

Bitka igrača i Grend slemova se zaoštrava. Teniseri nisu zadovoljni udelom u prihodima i traže da Grend slem turniri budu kao ATP i WTA. Prvi protesti su zakazani na Rolan Garosu.

16:00

20.5.2026.

1 d

29 B92.sport

Tenis

Novak Đoković ima novog trenera

Novak Đoković se priprema za nastup na Rolan Garosu i napad na željeni 25. grend slem u karijeri, a sve to sa novim trenerom.

10:30

20.5.2026.

1 d

Najnovije

148 B92.sport

ABA

uživo Partizan eliminisao Zvezdu; Penjaroja: "Teško je dobiti četiri derbija zaredom"; Bizaran potez Saše Obradovića

Košarkaši Partizana pobedili su Crvenu zvezdu 2-0 u polufinalnoj seriji ABA lige.

22:38

21.5.2026.

1 min

Aktuelno

Sudije otkrile imena najboljeg i najlošijeg takmičara u današnjem zadatku

Sudije "MasterChef Srbija" donele su važnu odluku nakon kuvanja.

22:38

21.5.2026.

3 min

Aktuelno

Takmičarka sudije MasterChef Srbija oborila sa nogu: "Budite ponosni na sebe"

Sudije "MasterChef Srbija" nisu krile koliko su oduševljene jelom jednog od takmičara.

22:34

21.5.2026.

7 min

"Niko nije iznad zakona"

Vučić: "Telo kod Inđije je najverovatnije Aleksandar Nešović"; "To su uradili monstrumi, ne ljudi"

Predsednik Srbije Aleksandar Vučić bio je gost emisije "Četvrtkom u 9" u 21.00 sat na Radio-televiziji Srbije.

22:33

21.5.2026.

7 min

Politika

Milioni legli, pa krenule blokade; Evo koliko je Bjelogrlić zaradio od države Srbije

Opšte je poznato da Dragan Bjelogrlić sebe smatra delom bogate elite, ali kada se bolje pogleda, bez iste te države koju danas napada gde god stigne, ne bi imao ni centa, piše 24sedam.

22:31

21.5.2026.

10 min

Pogledaj sve

Info

"Niko nije iznad zakona"

Vučić: "Telo kod Inđije je najverovatnije Aleksandar Nešović"; "To su uradili monstrumi, ne ljudi"

Predsednik Srbije Aleksandar Vučić bio je gost emisije "Četvrtkom u 9" u 21.00 sat na Radio-televiziji Srbije.

22:33

21.5.2026.

10 min

Politika

Milioni legli, pa krenule blokade; Evo koliko je Bjelogrlić zaradio od države Srbije

Opšte je poznato da Dragan Bjelogrlić sebe smatra delom bogate elite, ali kada se bolje pogleda, bez iste te države koju danas napada gde god stigne, ne bi imao ni centa, piše 24sedam.

22:31

21.5.2026.

10 min

"Zvaćemo ih na dijalog"

Vučić: "Izbori će biti u periodu od septembra do novembra"; "Boriću se za ujedinjenu Srbiju"

Predsednik Srbije Aleksandar Vučić izjavio je da će se izbori u Srbiji održati u periodu od kraja septembra do sredine novembra.

22:21

21.5.2026.

22 min

Politika

Vučić: "Nemam ništa protiv Crne Gore, u Tivat idem na poziv Ursule"; "Ništa im nažao nismo učinili"

Predsednik Srbije Aleksandar Vučić izjavio je da u Tivat ide na razgovore sa evropskim zvaničnicima isključivo na poziv Ursule fon der Lajen, uz poruku da Srbija nije učinila ništa loše Crnoj Gori i da danas ekonomski napreduje brže od susedne države.

22:07

21.5.2026.

35 min

O poseti Kini

Vučić: "Postoji mogućnost da dobijem najviši orden od Sija"; "Dogovorene milijarde u investicijama"

Predsednik Srbije Aleksandar Vučić izjavio je da će predstojeća poseta Kini biti od izuzetnog značaja za Srbiju.

21:58

21.5.2026.

42 min

Život

Aktuelno

Sudije otkrile imena najboljeg i najlošijeg takmičara u današnjem zadatku

Sudije "MasterChef Srbija" donele su važnu odluku nakon kuvanja.

22:38

21.5.2026.

3 min

Aktuelno

Takmičarka sudije MasterChef Srbija oborila sa nogu: "Budite ponosni na sebe"

Sudije "MasterChef Srbija" nisu krile koliko su oduševljene jelom jednog od takmičara.

22:34

21.5.2026.

7 min

Aktuelno

Ljubica Komlenić dobila pojačanje u kuhinji: Evo sa kim će ocenjivati takmičare

Sudija Ljubica Komlenić dobila je pojačanje u kuhinji u trenutku kada je trebalo da oceni takmičare "MasterChef Srbija".

22:30

21.5.2026.

12 min

Aktuelno

Sudija Ljubica prišla takmičaru, a on počeo da se trese: "Šta vam je?"

Sudija Ljubica prišla je Pavlu tokom pripreme jela, a tada je primetila da se takmičar trese.

22:18

21.5.2026.

25 min

Aktuelno

Takmičarka priznala da joj nije dobro zbog novog zadatka Ljubice Komlenić: "Kad sam čula..."

Sudija Ljubica Komlenić otkrila je takmičarima današnji zadatak, a nekima od njih ovo se nikako nije svidelo.

Zvaničnica Koalicije za inovacije u pripremljenosti za epidemije (CEPI) Džejn Halton izjavila je danas da se procenjuje da slučajevi koji su do sada identifikovani u epidemiji ebole u Kongu predstavljaju samo vrh ledenog brega.

Džon Travolta ostvario je niz zapaženih uloga u filmskim klasicima poput "Briljantina" i "Petparačkih priča", a u glumačkoj industriji je aktivan više od 50 godina. Međutim, njegov rediteljski debi nije naišao na pozitivne reakcije.

Šampioni zimskog EBL-a su blizu nove titule.

17:37

15.5.2026.

6 d

English

Executions in Iran are on the rise: Human rights organizations are speaking out more loudly

Iran has executed four men, including Kurdish activists and Iraqi nationals, without informing their families and following what human rights organizations describe as disputed trials, according to reports from rights groups.

15:15

21.5.2026.

7 h

English

Chaos in Belgrade: Shooting at a well-known restaurant; One person injured; Attacker arrested

In a well-known restaurant in Belgrade, the owner of the establishment was injured in a shooting. Police stated that they have arrested D.M. (24), who is suspected of carrying out the attack.

15:09

21.5.2026.

7 h

Alert in the Baltics

NATO scrambled fighter jets in an emergency response; Citizens warned: "Take cover immediately" PHOTO/VIDEO

An unidentified drone entered Latvian airspace today, marking the third such incident in the past three days.

15:00

21.5.2026.

7 h

Djokovic set to avoid Sinner until the Roland Garros final!

0 B92.sport

English

Djokovic set to avoid Sinner until the Roland Garros final!

The draw for this year’s Roland Garros has been held in Paris.

14:44

21.5.2026.

7 h

English

An EU proposal on membership of the Western Balkans under new rules has arrived; Merz's letter published

German Chancellor Friedrich Merz has proposed to EU officials that Ukraine be granted the status of an associate member of the European Union, while Western Balkan countries, including Serbia, would receive observer status in all relevant EU institutions.

Gejming scena je upravo dobila vest godine: češki Warhorse Studios, koji stoji iza ultra-popularnog serijala Kingdom Come: Deliverance, radi na novoj igri smeštenoj u Tolkinovu Srednju zemlju.

Škoda Auto predstavila je novi električni krosover Epiq, model koji će imati važnu ulogu u širenju ponude električnih vozila ovog češkog proizvođača.

12:05

21.5.2026.

10 h

PHP kurs: Uvod u regularne izraze

Šta su to regularni izrazi

Sintaksa Regularnih Izraza

Komentari 3

3 Komentari

Možda vas zanima

B92 na društvenim mrežama

Najnovije

Info

Život

Zdravlje

Kultura

eSports

English

Tehnopolis

Automobili