Einblicke & Technik

Ein tiefer Einblick in die Infrastruktur von Webdaten, Extraktionstechniken und die Zukunft strukturierter Daten in großem Maßstab.

Neueste Artikel

Wie man Daten von Idealista abgreift: Ein Spielbuch für 2026

TL;DR: Idealista ist der größte Immobilienmarktplatz in Spanien, Italien und Portugal, aber es sitzt hinter einem ernsthaften Anti-Bot-Stack, der naive Scraper schnell blockiert. Dieser Leitfaden zeigt Ihnen, wie Sie Daten von Idealista durchgängig in Python scrapen können. Er umfasst Site Mapping, Selenium mit undetected-chromedriver, DataDome-Behandlung, Proxy-Rotation und saubere Exporte, mit Produktionshärtung, die Konkurrenten normalerweise überspringen.

Raluca Penciuc14 min read
May 8, 2026

Wie man Yelp mit Python scrappt: Bewertungen, Listen und LLM-fähige Datenpipelines

TL;DR: Dieser Leitfaden führt Sie durch den Aufbau einer kompletten Yelp Scraper in Python, Abdeckung Suchergebnisse, Business-Details, und Bewertungen mit Arbeits-Code. Sie werden auch lernen, wie man Anti-Bot-Schutz zu behandeln, exportieren Daten zu CSV oder JSON, und füttern gescrapte Bewertungen in einem LLM für Sentiment-Analyse, etwas, das keine andere Yelp Scraping-Tutorial abdeckt.

Raluca Penciuc13 min read
Apr 28, 2026

10 Fragen zum Scraping, die jedes Datenteam beantworten sollte, bevor es einen Scraper schreibt

TL;DR: Ein Web-Scraping-Projekt scheitert an der Planung, lange bevor es am Code scheitert. Diese zehn Scraping-Fragen führen Sie durch Legalität, API-Alternativen, Anti-Bot-Verteidigung, Kosten, Aktualisierungskadenz, Datenqualität und Governance, damit Sie den Arbeitsumfang festlegen, den richtigen Stack auswählen und die Fehlermodi vermeiden, die Scraper in der Produktion stillschweigend töten.

Mihai Maxim11 min read
May 8, 2026