Kaip rašyti ir išbandyti „Google Analytics“ reguliaraus žodžio filtrus (su pavyzdžiais)

Reguliarūs reiškiniai „Regex“ „Google Analytics“ filtrai

Kaip ir daugelyje mano straipsnių čia, aš atlieku keletą tyrimų klientui ir tada rašau apie tai čia. Jei atvirai, yra kelios priežastys, kodėl… pirmiausia tai, kad turiu siaubingą atmintį ir dažnai ieškoju informacijos savo svetainėje. Antra - padėti kitiems, kurie taip pat gali ieškoti informacijos.

Kas yra reguliarusis posakis (regex)?

„Regex“ yra kūrimo metodas, skirtas ieškoti ir nustatyti teksto simbolių šabloną, kad jis atitiktų arba pakeistų tekstą. Visos šiuolaikinės programavimo kalbos palaiko reguliarias išraiškas.

Man patinka reguliarūs posakiai (reguliariai), tačiau jie gali šiek tiek nuvilti ar įsiutinti mokantis ir išbandant. „Google Analytics“ turi keletą nuostabių galimybių ... kur galite kurti įprasto posakio rodinius arba filtruoti duomenis reguliariose išraiškose.

Pavyzdžiui, jei norėčiau pamatyti tik srautą savo žymos puslapiuose, galėčiau filtruoti / tag / savo nuolatinės nuorodos struktūroje naudodamas:

/tag\/

Sintaksė yra kritinė. Jei aš tiesiog naudočiau „tag“, gaučiau visus puslapius, kuriuose būtų terminas tag. Jei naudosiu „/ tag“, bus įtrauktas bet koks URL, prasidedantis žyma, pvz., / tag-management nes „Google Analytics“ pagal numatytuosius nustatymus po reguliaraus reiškinio įtraukia bet kokį simbolį. Taigi, turiu įsitikinti, kad turiu šį brūkšnį ... bet jame turi būti pabėgimo simbolis.

puslapio filtro regex

„Regex“ sintaksės pagrindai

sintaksės aprašymas
^ Prasideda
$ Baigiasi
. Visų simbolių pakaitos simbolis
* Ankstesnio elemento nulis arba daugiau
.* Atitinka visus simbolius
? Ankstesnio elemento nulis arba vienas kartas
+ Vienas ar keli ankstesnio elemento kartai
| ARBA operatorius
[abc] A, b arba c (gali būti bet koks simbolių skaičius)
[az] Diapazonas nuo a iki z (gali būti bet koks simbolių skaičius)
[AZ] Diapazonas nuo A iki Z (didžiosiomis raidėmis)
[0-9] Diapazonas nuo 0 iki 9 (gali būti bet koks skaičius)
[a-zA-Z] Diapazonas nuo a iki Z arba nuo A iki Z
[a-zA-Z0-9] Visi raidiniai ir skaitiniai simboliai
1 {} Tiksliai 1 egzempliorius (gali būti bet koks skaičius)
{1–4} Diapazonas nuo 1 iki 4 egzempliorių (gali būti bet koks skaičius)
{1,} 1 ar daugiau atvejų (gali būti bet koks skaičius)
() Grupuokite savo taisykles
\ Pabėk iš specialiųjų personažų
\d Skaitmeninis simbolis
\D Neženklis simbolis
\s balta vieta
\S Ne balta erdvė
\w Word
\W Ne žodis (skyryba)

„Regex“ pavyzdžiai, skirti „Google Analytics“

Taigi pateikime keletą pavyzdžių Individualūs filtrai. Vienas iš mano kolegų paprašė manęs padėti nustatyti vidinį puslapį, kurio kelias yra /indeksas be visų tinklaraščio įrašų, kurie nuolatinėje nuorodoje buvo parašyti su metais:

Mano pasirinktas filtro modelis filtro lauke Užklausos URL:

^/(index|[0-9]{4}\/)

Tai iš esmės nurodo ieškoti / indeksuoti ARBA bet kurį 4 skaitmenų skaitmeninį kelią, pasibaigiantį pasviruoju pasviruoju brūkšniu. Sukūriau „Analytics“ rodinį ir pridėjau tai kaip filtrą:

„Google Analytics“ rodinio filtras

Štai dar keli pavyzdžiai:

  • Jūs turite tinklaraštį, kurio URL nuolatinio ryšio kelyje yra metai, ir norite filtruoti sąrašą pagal bet kuriuos metus. Taigi noriu bet kokių 4 skaitmenų, po kurių eina pasvirasis brūkšnys. Prašyti URl filtro modelio:

^/[0-9]{4}\/

  • Norite palyginti visus savo puslapius, kuriuose yra pavadinimas sertifikatas or pažymėjimas į jį. Puslapio pavadinimo filtro raštas:

(.*)certificat(.*)

  • Norite palyginti du nukreipimo puslapius pagal jų kampanijos terpę, perduodamą „Google Analytics“ kampanijos URL kaip utm_medium = tiesioginis paštas or mokama paieška.

(direct\smail|paid\ssearch)

  • Pagal URL kelią norite palyginti visus produktus, kurie yra vyriški marškiniai. Prašyti URl filtro modelio:

^/mens/shirt/(.*)

  • Norite palyginti visus puslapius, sunumeruotus URL keliu, kuris baigiasi skaičiumi. Prašyti URl filtro modelio:

^/page/[1-9]*/$

  • Norite išskirti IP adresų diapazoną. Išskirkite IP adreso filtro modelį:

123\.456\.789\.[0-9]

  • Norite įtraukti „thankyou.html“ puslapį, kuriame pateikimas buvo sėkmingas, remiantis užklausos eilute sėkmė = tiesa. Prašyti URl filtro modelio:

thankyou\.html\?success=true

Kaip patikrinti „Regex“ išraiškas

Vietoj „Google Analytics“ bandymų ir klaidų, aš tiesiog pereinu prie regex101, fantastinis įrankis, skirtas tikrinti įprastas išraiškas. Tai netgi suskaido jūsų sintaksę už jus ir pateikia išsamią informaciją apie įprastą išraišką:

reguliarūs posakiai regex101

Kurkite, išbandykite ir derinkite „Regex“

Ką manote?

Ši svetainė naudoja "Akismet", kad sumažintų šlamštą. Sužinokite, kaip apdorojamas jūsų komentaras.