Semalt: როგორ გამოვიყენოთ ვებ Scrapper Chrome გაფართოება

ქსელის საშუალებით უამრავი მონაცემი არსებობს. მონაცემების კოპირება უშუალოდ საიტის გარეთ, შეიძლება შრომითი ინტენსიური პროცესია. ამრიგად, ვებ – გვერდის მონაცემების ამოსაღებად ვებ – სკრეპირების მეთოდის გამოყენებით შეგიძლიათ დაზოგოთ თქვენი დრო, ენერგია და ფული.

ვებ – სკრაპინგი, რომელიც ასევე ცნობილია როგორც ვებ – მონაცემთა მოპოვება ან ვებ – დალაგება, არის საიტების მონაცემების ამოსაღებად ბოტის გამოყენების პროცესი. ვებ – სკრიპტები ნავიგაციას უწევს საიტს, აფასებს მის შინაარსს და შემდეგ აიღეთ და განათავსეთ ცხრილების ან მონაცემთა ბაზაში.

არსებობს უამრავი ვებ ქსელური ხელსაწყოები , რომლებიც ბაზარზე არსებობს, მაგრამ ისინი საკმაოდ ძვირია და არცთუ ადვილი გამოსაყენებელია არატექნოლოგიური საზრიანი ადამიანებისთვის. ამასთან, ვებ Scraper Chrome Extension უფასო და ადვილად გამოსაყენებელია. ამ გაფართოებით, თქვენ შეგიძლიათ კიდევ შეაჩეროთ პროცესი მისი მუშაობის შუაში.

შეგიძლიათ ჩამოტვირთოთ Web Scraper Chrome Extension პროგრამა Google Chrome Web Store. ერთადერთი უარყოფითი მხარე ის არის, რომ თქვენ საიტის ხელით უნდა გადახვიდეთ და ეს არც ისე ადვილი პროცესია. ასევე, თქვენ არ შეგიძლიათ შეასრულოთ ჯართის დადება რეგულარულად ინტერვალებით პროგრამულად.

ვებ სკაწერის Chrome გაფართოების ინსტალაცია

  • გახსენით Google Chrome ბრაუზერი;
  • ეწვიეთ Chrome ვებ-მაღაზიას და მოძებნეთ ვებ სკრიპტერის გაფართოება;
  • დაამატეთ ინსტრუმენტი Chrome- ს;
  • ახლა თქვენ მზად ხართ, რომ დაიწყოთ ვებ – გვერდების გაფართოება თქვენი Chrome ბრაუზერის გამოყენებით.

სკატერის დამონტაჟების შემდეგ დააჭირეთ F12- ს, რომ გახსნათ Google Chrome- ის დეველოპერული ხელსაწყოები. ალტერნატიულად, თქვენ შეგიძლიათ დააჭიროთ ეკრანს და დააჭიროთ "ინსპექტირების ელემენტს". დეველოპერის ხელსაწყოების გახსნის შემდეგ, ნახავთ ჩანართს, რომელსაც ეწოდება "Web Scraper".

ახლა შეიტყვეთ როგორ გამოვიყენოთ ეს პირდაპირ გვერდზე. წარმოვიდგინოთ, რომ გვინდა Awesomegifs ვებსაიტის გადაკვრა და მისგან გარკვეული შინაარსის და მონაცემების ამონაწერი. გახსენით საიტი. რა არის პირველი, რაც ხედავთ? სურათები ლაზურად არის დატვირთული, არა?

ვებ – გვერდის გახსნის შემდეგ, თქვენ უნდა ამოიღოთ gif გამოსახულების URL. ეს ნიშნავს, რომ თქვენ უნდა დაადგინოთ CSS სელექტორი, რომელიც შეესაბამება სურათებს. ვებსაიტს აქვს დაახლოებით 130 გვერდი გამოსახულებებით; და გვერდებს შორის გადართვისთვის საჭიროა შეცვალოთ იმ გვერდის ნომერი, რომელიც ამჟამად 125. ამის გაკეთების ყველაზე მარტივი გზაა ახალი საიტის რუკა და დაამატოთ საწყისი URL ველი. ამ გზით, ვებ სკრიპერს მოგთხოვთ, რომ მუდმივად გახსნათ URL, რითაც ამარცხებთ საბოლოო მნიშვნელობას პროცესში. ის გახსნის პირველ გვერდს, მეორე გვერდს, მესამე გვერდს… სანამ არ მიაღწევს 125 – ე გვერდს.

ნაკაწრების პროცესის დასაწყებად, გახსენით საიტის რუკა და დააჭირეთ ღილაკს "ჯართი". ინსტრუმენტი დაიწყებს საჭირო მონაცემების გაფანტვას. იმ შემთხვევაში, თუ გსურთ შეაჩეროთ ჯართის დამუშავება შუაზე, უბრალოდ დახურეთ ფანჯარა და გადადით საიტის რუქაზე, მოპოვებული მონაცემების CSV ფაილში ექსპორტისთვის.