Author Profile
Ștefan Răcilă
Full-Stack-Entwickler
Stefan Racila ist DevOps- und Full-Stack-Entwickler bei WebScrapingAPI, wo er Produktfunktionen entwickelt und die Infrastruktur wartet, die für die Zuverlässigkeit der Plattform sorgt.

Published Articles
9
Scrapy Splash Tutorial: JavaScript-Seiten rendern
TL;DR: Scrapy Splash verbindet die schnelle Crawling-Engine von Scrapy mit dem Headless-Browser Splash, um JavaScript-lastige Seiten zu rendern. Dieses Scrapy-Splash-Tutorial führt Sie durch die Docker-Einrichtung, die Konfiguration des Scrapy-Projekts, die Grundlagen von SplashRequest, Lua-Skripte zum Scrollen und Klicken, die Proxy-Integration und die Behebung der häufigsten Fehler, auf die Sie stoßen werden.
Read article
Die 11 besten Tipps, um beim Web-Scraping nicht blockiert oder mit einer IP-Sperre belegt zu werden
Lernen Sie Web-Scraping, ohne gesperrt zu werden! Befolgen Sie die Tipps zur Einhaltung der Nutzungsbedingungen, zur Verwendung von Proxys und zur Vermeidung von IP-Sperren. Extrahieren Sie Daten auf ethische und legale Weise.
Read article
Wie man Proxies mit Python-Requests verwendet: Von der Basis bis zur Produktion
TL;DR: Dieser Leitfaden zeigt Ihnen, wie Sie Proxies mit Python Requests von Anfang bis Ende nutzen können: ein funktionierendes Proxies-Dict, authentifizierte URLs, Umgebungsvariablen, Session Reuse, SOCKS5 ohne DNS-Lecks und ein Rotationspool mit Wiederholungen und einem Circuit Breaker. Am Ende werden Sie wissen, wann eine verwaltete API einem DIY-Pool vorzuziehen ist.
Read article
So erstellen Sie einen Webcrawler mit Python – Ein Leitfaden für Anfänger
In diesem Tutorial wird gezeigt, wie man mit Python das Web crawlt. Web-Crawling ist eine leistungsstarke Methode, um Daten aus dem Web zu sammeln, indem alle URLs einer oder mehrerer Domains ermittelt werden.
Read article
Was ist Browser-Automatisierung? Ein praktischer Leitfaden
TL;DR: Browser-Automatisierung ist die Praxis der Steuerung eines echten oder Headless-Webbrowsers aus dem Code, so dass er in Ihrem Namen klickt, tippt, navigiert und Seiten liest. Dieser Leitfaden erklärt, was Browser-Automatisierung unter der Haube ist, vergleicht Selenium, Playwright, Puppeteer und Cypress und zeigt, wann man nicht nach einem vollständigen Browser greifen sollte.
Read article
Web Scraping vs. Data Mining: Unterschiede, Pipelines und wann man sie einsetzt
TL;DR: Web Scraping sammelt Rohdaten von öffentlichen Webseiten. Beim Data Mining werden strukturierte Daten analysiert, um Muster, Vorhersagen und Segmente zu ermitteln. Es handelt sich um verschiedene Phasen desselben Lebenszyklus, und die meisten Produktionssysteme kombinieren sie in einer Pipeline aus Scrapen, Normalisieren und Mining.
Read article
Beste Web Scraping Kurse für Entwickler
TL;DR: Die besten Web-Scraping-Kurse hängen von Ihrer Sprache, Ihrem Niveau und dem angestrebten Anwendungsfall ab. Dieser Leitfaden vergleicht fünf kostenpflichtige Kurse von Udemy, Coursera, DataCamp und Packt, verweist auf kostenlose Ergänzungen wie offizielle Dokumente und zeigt, wie man vom Abschluss eines Kurses zum Betrieb von Produktions-Scrapern übergeht.
Read article
Die 11 besten Tipps, um beim Web-Scraping nicht blockiert oder mit einer IP-Sperre belegt zu werden
Mit diesen 11 Top-Tipps erfahren Sie, wie Sie Web-Scraping betreiben, ohne auf die schwarze Liste zu geraten. Keine Fehlermeldungen mehr!
Read article
CSS-Selektoren-Spickzettel – Tipps und Tricks zum Web-Scraping
Nutze dieses CSS-Selektoren-Spickzettel, wenn du das Web wie ein Profi durchforsten möchtest
Read article