Semalt: كيفية مسح صفحة ويب باستخدام ملحق Google Chrome

مكشطة الشاشة هي برنامج نصي يقرأ المواقع ويستخرج معلومات مفيدة من الويب. سكرين الشاشة هو الحل النهائي للحصول على بيانات حقيقية من مواقع الويب وصفحات الويب إلى Microsoft Excel. أداة Google Chrome Extension Scraper هي أداة فعالة لتقطيع الشاشة تعمل على نظامي التشغيل Windows و Mac OS.

لماذا مكشطة تمديد جوجل كروم؟

مكشطة ملحق Google Chrome هي أداة قوية لتجريد الشاشة متاحة مجانًا على سوق Chrome الإلكتروني. يتم تثبيت أداة الكشط هذه في متصفح Chrome كمكوِّن إضافي. يسمح المكون الإضافي للمدونين والمسوقين باسترداد البيانات من صفحات الويب عن طريق النقر بزر الماوس الأيمن على عنصر. يجب أن يظهر "Scrape مماثلة" على الشاشة إذا قمت بالنقر بزر الماوس الأيمن فوق عنصر.

مقدمة في XPaths

XPath هي لغة برمجة تستخدم للعثور على معلومات مهمة في هياكل XML. يعد ملف HTML مثالاً ممتازًا لبنية XML. يستخدم XPath بشكل شائع لتحديد العقد المستهدفة. في هذا السياق ، سيتم استخدام XPaths لتحديد النص الذي سيتم استخراجه على صفحة الويب. سيساعد XPaths أيضًا في تحديد أسماء الأحزاب وأرقام هواتف النواب السويديين.

باستخدام مكشطة Google Chrome للوصول إلى تفاصيل العنوان لـ 349 نائبًا سويديًا

باستخدام Chrome's Scraper ، لا يعد استخراج المعلومات من صفحة الويب أمرًا بسيطًا فحسب ، بل رائع أيضًا. ستستمتع بالعملية والتقنية نفسها.

يسرد الموقع جميع الأعضاء السويديين وعناوينهم. للبدء ، انقر بزر الماوس الأيمن على أي MP وحدد "Scrape مماثلة". يجب أن ترى العرض التالي على الشاشة.

دليل خطوة بخطوة حول كيفية فحص صفحة الويب كشط

إذا نقرت بزر الماوس الأيمن على MP واحد واخترت "Inspect element" ، فسيتم إنشاء قائمة أبجدية ضمن فئة "grid_6 alpha omega حاوية حاوية نتائج البحث". سيتم استخدام خطوتين لكشط صفحة الويب هذه. وستتضمن الخطوة الأولى تحديد العلامات التي تتكون من بيانات MPs مع XPath. ستشمل الخطوة الثانية اختيار أجزاء معينة من البيانات مثل أسماء الأطراف والأسماء ورقم الهاتف وتنظيم البيانات في أعمدة.

الخطوة 1

التعمق في بنية HTML والحفاظ على العناصر سليمة. أشر بالعلامات لتحديد عدد العلامات المطابقة للعناصر الموجودة في الهيكل الخاص بك. حدد العلامة الأخيرة التي تحتوي على البيانات المستهدفة. قم بإجراء اختبار XPath على الهيكل بالنقر فوق "Scrape".

سيتم عرض قائمة تتكون من 349 صفًا على الشاشة. 349 يمثلون العدد الإجمالي للنواب السويديين.

الخطوة 2

تقسيم البيانات المقدمة إلى أعمدة. افحص رمز HTML على صفحة الويب التي تستخدمها. في هذه الحالة ، يتم تمييز القطع التي سيتم استخراجها في هذه اللحظة باللون الأصفر. أدخل XPaths في حقل الأعمدة الذي تم إنشاؤه وانقر على "Scrape" لتشغيل المكون الإضافي.

إذا كانت لديك معرفة أساسية بـ XPaths ، فلن يكون فهم البرمجة مهمة صعبة بالنسبة لك. ترشدك الخطوات الموضحة أعلاه إلى كيفية فحص صفحة الويب. إذا كنت تعمل على إلغاء عدة صفحات ويب ، فأنت بحاجة إلى مهارات البرمجة.

mass gmail