Semalt rækir í URLitor - Mjög flott vefskrap og gagnaflutningstæki

URLitor er nýtt en áhrifaríkt vefskrap og gagnaflutningstæki. Til að nota URLitor þarftu bara að bæta við lista yfir allar slóðir sem innihaldið sem þú vilt skafa á netinu í sniðmátinu sem fylgir. Síðan sem þú þarft að tilgreina HTML frumefnið sem þú vilt draga úr vefsíðunum og smella á senda hnappinn. Það er eins auðvelt og það. Með þessu tól þarftu ekki að gera afrit eða líma úr vafranum.

xPath er tungumál sem er notað til að leita að upplýsingum í XML skrám. Það notar ákveðnar orðasambönd til að velja hnútasett eða hnúta í XML skrám. Tjáningin sem XPath skilur eru nokkuð svipuð og notuð eru með venjulegum tölvuskrám eða skjölum.

Þó XPath sé notað með nokkrum forritunarmálum hefur þetta tól verið smíðað fyrir notendur sem ekki hafa neina forritunarþekkingu. Svo þú þarft ekki að vera forritari til að nýta það. Með þessu tæki geturðu dregið út gögn frá nokkrum HTML og XML síðum.

Til að auðvelda notkun hafa nokkrir oft notaðir XPath-orðasambönd verið skilgreindir í fellivalmyndina þannig að notendur þurfa aðeins að velja eitthvað af þeim eftir markmiði. Hins vegar hafa mjög reyndir notendur XPath frelsi til að nota sérsniðna tjáningu hvenær sem þeir vilja.

Tólið hefur verið hannað með afkastagetu 100 slóðar í einni skrapaðgerð og það tekur að hámarki 10 tjáningu í einu. Með öðrum orðum, það getur skafið gögn úr að hámarki 100 slóðum í einu.

Nokkur mikilvæg XPath orðatiltæki sem hægt er að breyta eða bæta við hafa verið lýst hér að neðan:

1. // div [2] - Þessi tjáning velur annan div stigveldislega;

2. // hlekkur [@ rel = 'canonical'] / @ href - Þessi tjáning velur staðsetningu (tilvísun) merkisins sem er notað til að stilla rel eigindina jafna við kanónískan;

3. / html / head / meta [@ name = 'lýsing'] / @ innihald - Þessi tjáning er notuð til að velja efni;

4. // * [@ class = 'class-name'] - Þú getur notað þessa tjáningu til að velja alla þætti með 'class-name' sem CSS flokk;

5. // h2 | // title - Þessa tjáningu er hægt að nota til að velja bæði fyrsta H2 og titil síðunnar;

6. // * [name () = 'h1' eða name () = 'title'] - Þessi tjáning virkar nákvæmlega eins og hér að ofan. Hins vegar er tjáningin sem kynnt er hér að ofan betri þar sem hún er styttri;

7. // * [inniheldur (@ flokkur, 'þumalfingur')] - Þessi tjáning velur hvert atriði sem er með CSS flokk og inniheldur einnig 'þumalfingur' til útdráttar;

8. // foreldri :: * [text () = 'Velkomin'] - Þessi tjáning velur foreldri hvers frumefnis sem hefur textann 'Velkomin';

Þetta tól er Beta útgáfa og gæti samt unnið með nokkrar villur. En það er samt frábært tæki fyrir notendur með litla sem enga forritunarþekkingu þar sem öll oft notuð orðasambönd hafa verið skilgreind fyrirfram í valmynd eins og áður segir.