Brix tal-Web Spjegat Minn Espert Semalt

Brix tal-Web huwa sempliċement il-proċess li tiżviluppa programmi, robots, jew bots li jistgħu jestrattaw kontenut, dejta, u stampi minn websajts. Filwaqt li l-brix tal-iskrin jista 'biss jikkopja pixel murija fuq l-iskrin, il -brix tal-web tkaxkru l-kodiċi HTML kollha bid-dejta kollha maħżuna f'database. Imbagħad tista 'tipproduċi replika tal-websajt x'imkien ieħor.
Din hija r-raġuni għaliex il-brix tal-web issa qed jintuża f'negozji diġitali li jeħtieġu l-ħsad tad-dejta. Uħud mill-użi legali ta 'barraxa tal-web huma:
1. Ir-riċerkaturi jużawha biex jestrattaw dejta mill-midja soċjali u mill-forums.
2. Il-kumpaniji jużaw bots biex jiġbdu l-prezzijiet mill-websajts tal-kompetituri għat-tqabbil tal-prezzijiet.
3. Search engine bots jitkaxkru siti regolarment għall-iskop tal-klassifikazzjoni.
Għodda tal-barraxa u bots

L-għodod tal-brix tal-Web huma softwer, applikazzjonijiet u programmi li jiffiltraw permezz ta 'bażijiet tad-dejta u jiġbdu ċerta dejta. Madankollu, ħafna barraxa huma mfassla biex jagħmlu dan li ġej:
- Estratt dejta mill-APIs
- Issejvja dejta estratt
- Ittrasforma dejta estratt
- Identifika l-istrutturi uniċi tas-siti HTML
Peress li l-bots leġittimi u malizzjużi jservu l-istess skop, ħafna drabi huma identiċi. Hawn huma ftit modi biex tiddifferenzjaw wieħed mill-ieħor.
Il-barraxa leġittimu jista 'jiġi identifikat ma' l-organizzazzjoni li tippossjedihom. Pereżempju, il-bots tal-Google jindikaw li jappartjenu lil Google fl-intestatura HTTP tagħhom. Min-naħa l-oħra, bots malizzjużi ma jistgħux ikunu marbuta ma 'ebda organizzazzjoni.
Bots leġittimi jikkonformaw mal-fajl robot.txt tas-sit u ma jmorrux lil hinn mill-paġni li jitħallew jinbarax. Iżda l-bots malizzjużi jiksru l-istruzzjonijiet tal-operatur u jinbarax minn kull paġna tal-web.
L-operaturi għandhom bżonn jinvestu ħafna riżorsi fis-servers biex ikunu jistgħu jinbarax ammont kbir ta 'dejta u jipproċessawha wkoll. Dan hu għaliex xi wħud minnhom spiss jirrikorru għall-użu ta ’botnet. Ħafna drabi jinfettaw sistemi mferrxa ġeografikament bl-istess malware u jikkontrollawhom minn post ċentrali. Dan huwa kif huma kapaċi jinbarax ammont kbir ta 'dejta bi spiża ħafna inqas.
Brix tal-prezzijiet
Kull min iwettaq dan it-tip ta 'brix malizzjuż juża botnet li minnu jintużaw programmi ta' barraxa biex jinbarax il-prezzijiet tal-kompetituri. L-għan ewlieni tagħhom hu li jwaqqgħu l-kompetituri tagħhom peress li l-ispejjeż aktar baxxi huma l-iktar fatturi importanti kkunsidrati mill-klijenti. Sfortunatament, il-vittmi ta 'brix tal-prezzijiet se jkomplu jiltaqgħu ma' telf ta 'bejgħ, telf ta' klijenti, u telf ta 'dħul filwaqt li dawk li jwettquhom se jkomplu jgawdu aktar patrunaġġ.
Brix tal-Kontenut
Il-brix tal-kontenut huwa brix fuq skala kbira illegali ta 'kontenut minn sit ieħor. Il-vittmi ta 'dan it-tip ta' serq huma normalment kumpaniji li jiddependu fuq katalgi ta 'prodotti onlajn għan-negozju tagħhom. Websajts li jmexxu n-negozju tagħhom b'kontenut diġitali huma wkoll suxxettibbli għal brix ta 'kontenut. Sfortunatament, dan l-attakk jista 'jkun devastanti għalihom.
Protezzjoni tal-Brix tal-Web
Huwa pjuttost inkwetanti li t-teknoloġija adottata minn dawk li jwettqu l-brix malizzjuż irreferiet għal ħafna miżuri ta 'sigurtà ineffettivi. Sabiex itaffu l-fenomenu, inti trid tadotta l-użu ta 'Imperva Incapsula biex tiżgura l-websajt tiegħek. Dan jiżgura li l-viżitaturi kollha tas-sit tiegħek huma leġittimi.
Hawn hu kif taħdem Imperva Incapsula
Jibda l-proċess tal-verifika bl-ispezzjoni granulari tal-intestaturi HTML. Dan l-iffiltrar jiddetermina jekk viżitatur huwiex bniedem jew bot u jiddetermina wkoll jekk il-viżitatur huwiex sigur jew malizzjuż.

Ir-reputazzjoni tal-IP tista 'tintuża wkoll. Id-dejta tal-IP tinġabar mill-vittmi tal-attakk. Żjarat minn kwalunkwe IP huma suġġetti għal aktar skrutinju.
Ix-xejra ta 'mġieba hija metodu ieħor biex tidentifika bots malizzjużi. Huma dawk li jidħlu fir-rata kbira ħafna tat-talba u l-mudelli ta 'browsing umoristiċi. Ħafna drabi jagħmlu sforzi biex imiss kull paġna ta 'websajt f'perjodu qasir ħafna. Dan it-tip ta 'mudell huwa suspettuż ħafna.
L-isfidi progressivi li jinkludu l-appoġġ tal-cookies u l-eżekuzzjoni tal-JavaScript jistgħu jintużaw ukoll biex jiffiltraw il-bot. Ħafna kumpaniji jirrikorru għall-użu ta ’Captcha biex jaqbdu l-bot li jippruvaw jimpersonjaw il-bnedmin.