Um WebScrapingAPI nutzen zu können, müssen wir ein Konto erstellen und unseren privaten Zugangsschlüssel erhalten, der zur Authentifizierung bei der API dient. Keine Sorge, die Kontoerstellung ist kostenlos und du musst weder deine Kreditkarte noch andere persönliche Daten angeben.
Nach der Anmeldung werden wir zum Dashboard weitergeleitet. Hier sehen wir unseren Zugangsschlüssel, den wir in wenigen Augenblicken verwenden werden. Bewahren Sie ihn gut auf, aber wenn Sie glauben, dass Ihr privater Schlüssel kompromittiert wurde, können Sie ihn jederzeit zurücksetzen, indem Sie auf die Schaltfläche „Reset API Key“ klicken.
Weitere Details zur Funktionsweise von WebScrapingAPI und zur Integration in Ihr Projekt finden Sie in der Dokumentation. Um die API zu testen, hilft Ihnen der API Playground dabei, die Ergebnisse noch besser zu visualisieren!
Genug der Einführung, schauen wir uns nun an, wie wir WebScrapingAPI nutzen können, um mithilfe von Sitemaps Daten zu scrapen.
In diesem Beispiel verwenden wir NodeJS als Programmiersprache, aber du kannst jede Programmiersprache verwenden, mit der du vertraut bist. Anschließend scrapen wir die Sitemap und parsen ihre Produkt-URLs, scrapen die Produktseiten und speichern die Daten in einer CSV-Datei. Auf diese Weise kannst du mit WebScrapingAPI massenhaft Daten scrapen, aber wenn du nur bestimmte Seiten scrapen möchtest, kannst du auch spezifische Anfragen stellen.