XPath vs. CSS-Selektoren: Die Wahl des richtigen Selektors

Q: Kann ich sowohl XPath- als auch CSS-Selektoren im selben Selenium-Test verwenden?

Ja. Selenium unterstützt beide Selektortypen über By.CSS_SELECTOR und By.XPATH , und Sie können sie innerhalb einer einzelnen Testdatei oder sogar einer einzelnen Testmethode frei kombinieren. Der Wechsel zwischen den beiden hat keine negativen Auswirkungen auf die Leistung, verwenden Sie also den Typ, der für die jeweilige Element-Suche am besten geeignet ist.

Q: Ersetzen moderne CSS-Selektoren wie :has() XPath bei der Auswahl von übergeordneten Elementen?

Teilweise. Mit der :has() Pseudoklasse ermöglicht es Ihnen, ein übergeordnetes Element anhand seiner untergeordneten Elemente auszuwählen, was das häufigste Szenario der Auswahl von übergeordneten Elementen abdeckt. Sie unterstützt jedoch keine vollständige Durchquerung der Vorfahren über mehrere Ebenen hinweg, keine Logik für vorangehende Geschwisterelemente oder bedingte Ketten, wie sie durch die XPath-Achsen ermöglicht werden. Stellen Sie sich :has() abdeckt etwa 60 % der Fälle, die zuvor XPath für die Navigation nach oben erforderten.

Q: Wird XPath in Puppeteer und Playwright unterstützt?

Ja, beide unterstützen XPath. Puppeteer stellt es über die $x() Methode (oder page.evaluate mit document.evaluate ). Playwright unterstützt XPath nativ in seinem locator() und $() APIs. In beiden Tools sind CSS-Selektoren die Standardeinstellung und werden häufiger verwendet, aber XPath steht zur Verfügung, wenn Sie dessen Traversierungsfunktionen benötigen.

Kurz gesagt: Sowohl XPath- als auch CSS-Selektoren dienen dazu, DOM-Elemente zu lokalisieren, lösen jedoch unterschiedliche Probleme. CSS-Selektoren sind bei einfachen Auswahlen schneller und besser lesbar. XPath ist die bessere Wahl, wenn Sie das DOM in beliebiger Richtung durchlaufen, Textinhalte abgleichen oder komplexe bedingte Logik verarbeiten müssen. Bei den meisten Produktionsprojekten ist es vorteilhaft, beide strategisch einzusetzen.

Jedes Web-Scraping-Skript, jeder Browser-Automatisierungs-Workflow und jeder End-to-End-Test hat eine grundlegende Anforderung gemeinsam: das Auffinden von Elementen im DOM. Die Frage nach XPath- oder CSS-Selektoren stellt sich früh in jedem Projekt, und die Wahl des falschen Ansatzes kann zu langsamerer Ausführung, instabilen Lokalisatoren und mühsamer Wartung führen.

XPath (XML Path Language) ist eine Abfragesprache, die entwickelt wurde, um in XML- und HTML-Dokumenten zu navigieren und Knoten auszuwählen. CSS-Selektoren sind Musterzeichenfolgen, die ursprünglich für die Gestaltung von HTML entwickelt wurden, aber in Test- und Scraping-Frameworks weit verbreitet für die Elementauswahl eingesetzt werden. Beide führen Sie zu denselben Elementen, aber der Weg, den sie nehmen (und die damit verbundenen Kompromisse), unterscheiden sich erheblich.

Dieser Leitfaden erläutert die Syntax, die Leistungsmerkmale, die Framework-Unterstützung und das Verhalten in Randfällen der einzelnen Ansätze, damit Sie eine sichere und fundierte Entscheidung für Ihr Projekt treffen können.

XPath vs. CSS-Selektoren auf einen Blick

Sowohl XPath- als auch CSS-Selektoren identifizieren Elemente innerhalb eines HTML- oder XML-Dokuments, stammen jedoch aus unterschiedlichen Bereichen. XPath wurde für die Navigation in XML-Dokumenten entwickelt und unterstützt bidirektionale Durchquerung, was bedeutet, dass Sie sich ebenso einfach von einem untergeordneten Element zu einem übergeordneten bewegen können wie umgekehrt. CSS-Selektoren haben ihren Ursprung in Stylesheets und bewegen sich nur in eine Richtung: von übergeordneten zu untergeordneten Elementen (oder Geschwistern).

Hier ist das kurze Fazit: Wenn Ihre Auswahlanforderungen einfach sind (IDs, Klassen, Attribute, Kombinatoren), sind CSS-Selektoren die schnellere und besser lesbare Wahl. Wenn Sie nach oben navigieren, Textinhalte abgleichen oder komplexe bedingte Filter anwenden müssen, ist XPath die einzige Option, die Sie ans Ziel bringt.

Dimension	CSS-Selektoren	XPath
Richtung	Nur von Eltern zu Kindern	Bidirektional (beliebige Achse)
Geschwindigkeit	Im Allgemeinen schneller (native Engine)	Langsamer in Browsern
Textabgleich	Nicht unterstützt	`text()`, `contains()`
Lesbarkeit	Prägnant, vertraut	Ausführlich, steilere Kurve
Dokumenttypen	Nur HTML	HTML und XML

So funktioniert XPath

XPath, kurz für XML Path Language, ist eine Ausdruckssprache zum Navigieren und Abfragen von XML-Dokumenten, einschließlich HTML. Es behandelt das Dokument als einen Baum aus Knoten und ermöglicht es Ihnen, Pfadausdrücke zu schreiben, die einen oder mehrere dieser Knoten auswählen.

Absolute vs. relative Pfade. Ein absoluter XPath beginnt am Dokumentstamm und gibt jeden Schritt genau an: /html/body/div[1]/ul/li[3]. Er ist anfällig, da jede strukturelle Änderung ihn unbrauchbar macht. Ein relativer XPath beginnt mit // und findet Knoten unabhängig von ihrer Position im Baum: //li[@class='active']. Relative Pfade sind in der Praxis fast immer das, was Sie wollen.

Bei den Achsenmethoden zeigt XPath seine wahre Stärke. Methoden wie parent::, ancestor::, following-sibling::und preceding-sibling:: ermöglichen es Ihnen, sich von einem Kontextknoten aus in jede Richtung zu bewegen. Zum Beispiel //span[@id='price']/parent::div wählt den übergeordneten div eines bestimmten span, was CSS-Selektoren einfach nicht können.

Wichtige Funktionen wie contains(), starts-with()und text() fügen bedingte Filterung hinzu. Sie können ein Element finden, dessen sichtbarer Text eine Teilzeichenfolge enthält (//a[contains(text(), 'Next Page')]), ohne sich dabei auf Attribute zu verlassen.

Ein wichtiger Vorbehalt: Die meisten Browserumgebungen unterstützen nach wie vor nur XPath 1.0, das 1999 vom W3C veröffentlicht wurde. XPath 2.0 und 3.0 führten leistungsstarke Funktionen wie reguläre Ausdrücke und umfangreichere Typsysteme ein, doch in der browserbasierten Automatisierung werden Sie diesen selten begegnen. Bibliotheken wie lxml (Python) bieten zwar Unterstützung für XPath 2.0, daher hängt die verfügbare Version von Ihrer Toolchain ab.

So funktionieren CSS-Selektoren

Ein CSS-Selektor ist eine Musterzeichenfolge, die HTML-Elemente anhand ihres Tag-Namens, ihrer ID, ihrer Klasse, ihrer Attribute, ihrer Position oder ihres Zustands anspricht. Ursprünglich für die Anwendung von Stilen in Stylesheets konzipiert, sind CSS-Selektoren in den meisten modernen Automatisierungs- und Scraping-Frameworks zur Standardmethode für die Elementauswahl geworden.

Die Grundlagen sind jedem Frontend-Entwickler bekannt. #main wählt ein Element anhand seiner ID aus. .card passt auf Elemente mit einer bestimmten Klasse. div > p wählt direkte p Kinder eines div. Attributselektoren wie input[type="email"] und Positions-Pseudoklassen wie :nth-child(2) ermöglichen es Ihnen, Ihre Auswahl weiter einzugrenzen.

Moderne Pseudoklassen schließen die Lücke zu XPath. Der :has() Selektor, der mittlerweile weit verbreitet ist, ermöglicht es Ihnen, ein übergeordnetes Element anhand seiner untergeordneten Elemente auszuwählen: div:has(> img.hero) wählt jedes div , das direkt ein img mit der Klasse hero. Der :is() und :where() Pseudoklassen vereinfachen die Gruppierung, und :not() die Ausschließung. Diese Ergänzungen bedeuten, dass CSS-Selektoren einige Szenarien bewältigen können, für die zuvor XPath erforderlich war.

Allerdings können CSS-Selektoren Textknoten nicht direkt auswählen und sind weiterhin auf die Vorwärtsdurchquerung (von Eltern zu Kindern) beschränkt. Außerdem funktionieren sie nur mit HTML-Dokumenten; wenn Sie rohes XML oder Nicht-HTML-Feeds abfragen müssen, ist XPath Ihre einzige Option.

Syntaxvergleich im direkten Vergleich

XPath- und CSS-Selektoren nebeneinander zu betrachten, ist der schnellste Weg, ihre Unterschiede zu verinnerlichen. Die folgende Tabelle ordnet gängige Auswahlziele beiden Syntaxen zu und zielt dabei auf dieselben hypothetischen Seitenelemente ab.

Auswahlziel	CSS-Selektor	XPath
Nach ID	`#username`	`//*[@id='username']`
Nach Klasse	`.card`	`//*[contains(@class,'card')]`
Nach Attribut	`a[href^="https"]`	`//a[starts-with(@href,'https')]`
Direktes Kind	`ul > li`	`//ul/li`
N-tes Kind	`li:nth-child(3)`	`//li[3]`
Nach Textinhalt	Nicht möglich	`//a[text()='Login']`
Elternteil des Elements	`div:has(> span.icon)` (CSS4)	`//span[@class='icon']/parent::div`
Nachfolgendes Geschwisterelement	`h2 ~ p`	`//h2/following-sibling::p`
Vorgänger	Nicht möglich	`//span/ancestor::form`

Ein paar Dinge fallen sofort ins Auge. Bei der Auswahl von IDs, Klassen und Attributen ist CSS deutlich kürzer und leichter zu lesen. Sobald man jedoch Textabgleich oder Vorfahren-Traversierung benötigt, ist XPath die einzige Lösung. Die CSS- :has() verringert diese Lücke bei der Auswahl von Elternelementen, kann jedoch das vollständige Achsen-System von XPath nicht ersetzen.

Aus Sicht der Lesbarkeit fühlen sich CSS-Selektoren für jeden natürlich an, der schon einmal ein Stylesheet geschrieben hat. Die pfadbasierte Syntax von XPath ist ausführlicher, aber diese Ausführlichkeit verschafft Ihnen Präzision bei komplexen Abfragen. Wenn Ihr Team Frontend-Entwickler umfasst, die mit CSS vertraut sind, werden sie sich viel schneller in CSS-Selektoren einarbeiten als in XPath-Ausdrücke.

Leistung und Geschwindigkeit

Es gilt die allgemeine Annahme, dass CSS-Selektoren in Browserumgebungen schneller sind als XPath, und in der Praxis trifft dies im Allgemeinen zu. Browser verfügen über hochoptimierte native CSS-Selektor-Engines, da das CSS-Matching ein zentraler Bestandteil der Rendering-Pipeline ist. Die XPath-Auswertung hingegen findet außerhalb dieses schnellen Pfades statt und verursacht in der Regel mehr Overhead.

Allerdings gibt es keine weithin zitierten, standardisierten öffentlichen Benchmarks, die den genauen Leistungsunterschied zwischen XPath und CSS-Selektoren quantifizieren. Der Unterschied ist real, aber oft vernachlässigbar, es sei denn, Sie führen Zehntausende von Selektorauswertungen pro Seite durch. Bei den meisten Scraping- und Test-Workflows ist die Geschwindigkeit der Selektoren selten der Engpass; Netzwerklatenz und Seitenrendering dominieren die Ausführungszeit.

Außerhalb des Browsers sieht die Situation anders aus. Bibliotheken wie lxml kompilieren XPath-Ausdrücke zu optimiertem C-Code, wodurch die XPath-Auswertung für serverseitiges Scraping in Python extrem schnell wird. Scrapy-Nutzer beispielsweise werden praktisch keinen Geschwindigkeitsunterschied zwischen XPath- und CSS-Selektoren feststellen, da beide unter der Haube über lxml ausgewertet werden.

Erweiterte Filterung, Traversierung und Lesbarkeit

Die bidirektionale Traversierung von XPath ist sein größter technischer Vorteil. Durch die Verwendung von Achsen wie parent::, ancestor::, following-sibling::und preceding-sibling::können Sie den DOM-Baum von jedem Startknoten aus in jede Richtung durchlaufen. Dies ist unverzichtbar, wenn das Element, das Sie auswählen müssen, kein eindeutiges Attribut besitzt, aber eine vorhersehbare Beziehung zu einem Geschwister- oder Vorfahrenelement hat, das ein solches Attribut aufweist.

CSS-Selektoren sind nur vorwärtsgerichtet. Sie können vom übergeordneten zum untergeordneten Element (>) oder von einem vorangehenden Geschwisterelement zu einem nachfolgenden (~, +), aber nicht nach oben. Die :has() Pseudoklasse schließt diese Lücke teilweise: Sie ermöglicht es Ihnen, ein übergeordnetes Element bedingt anhand seiner Nachkommen auszuwählen. Dennoch :has() bietet sie keine vollständige Vorfahren-Durchquerung, und ihre Browserunterstützung ist zwar wachsend, in älteren Umgebungen jedoch noch nicht universell.

Die Auswahl von Textknoten ist ein weiterer klarer Vorteil von XPath. Ausdrücke wie //td[contains(text(), 'Total')] ermöglichen es Ihnen, Elemente anhand ihres sichtbaren Inhalts zu finden, was beim Scraping von Seiten, auf denen Elemente keine aussagekräftige Klasse oder ID tragen, von unschätzbarem Wert ist. CSS bietet hierfür keine Entsprechung.

Die Lernkurve verdient bei der Bewertung von XPath- und CSS-Selektoren für Ihr Team eine Erwähnung. CSS-Selektoren profitieren von einer weit verbreiteten Vertrautheit; die meisten Entwickler haben sie schon lange vor dem Einsatz von Automatisierung in Stylesheets geschrieben. XPath-Ausdrücke, insbesondere solche, die mehrere Achsen oder verschachtelte Prädikate verwenden, stellen eine höhere kognitive Belastung dar. Diese Komplexität lohnt sich, wenn Sie sie benötigen, ist aber bei einfacheren Auswahlen unnötiger Mehraufwand.

Kompatibilität mit Frameworks und Bibliotheken

Nicht jedes Framework behandelt XPath- und CSS-Selektoren gleich. Bevor Sie sich auf eine Selektorstrategie festlegen, prüfen Sie, was Ihre Toolchain tatsächlich unterstützt.

Framework / Bibliothek	CSS-Selektoren	XPath
Selenium (alle Sprachen)	Ja	Ja
Playwright	Ja	Ja
Puppenspieler	Ja	Ja (über `$x()`)
Scrapy (Python)	Ja (über parsel)	Ja (über parsel/lxml)
lxml (Python)	Ja (über cssselect)	Ja (nativ)
BeautifulSoup (Python)	Ja	Nein (lxml-Backend verwenden)
Cheerio (Node.js)	Ja	Nein

Ein paar erwähnenswerte Feinheiten. Puppeteer stellt XPath über eine separate $x() Methode statt über die Haupt- $() Selektor-API, sodass die Integration etwas weniger nahtlos ist. BeautifulSoup enthält keine integrierte XPath-Engine; wenn Sie XPath mit BeautifulSoup benötigen, müssen Sie es mit einem lxml-Parser-Backend kombinieren. Cheerio ist von Grund auf nur für CSS ausgelegt.

Für Selenium-Nutzer, die XPath- und CSS-Selektoren vergleichen: Beide Typen sind über By.CSS_SELECTOR und By.XPATH. Playwright unterstützt ebenfalls beide, was es zu einer guten Wahl macht, wenn Sie die Flexibilität wünschen, Selektor-Strategien innerhalb einer einzigen Testsuite oder Daten-Parsing-Pipeline zu kombinieren.

Randfälle: Shadow DOM, Iframes und dynamische Inhalte

Seiten in der Praxis sind selten so übersichtlich wie Beispiele in Tutorials, und die Entscheidung zwischen XPath- und CSS-Selektoren wird komplexer, wenn Shadow DOM, Iframes und dynamisch eingefügte Inhalte ins Spiel kommen.

Shadow DOM. CSS-Selektoren können standardmäßig keine geschlossene Shadow-Root durchdringen. Playwright bietet als Workaround das Präfix css=pierce/ Präfix als Workaround an, aber Standard-CSS-Engines in Browsern halten an der Shadow-Grenze an. Auch XPath hilft hier nicht weiter; es verfügt überhaupt nicht über ein natives Konzept für Shadow DOM. In beiden Fällen benötigen Sie in der Regel frameworkspezifische APIs (wie Playwrights locator() mit Piercing), um Shadow-Elemente zu erreichen.

Iframes. Weder XPath noch CSS-Selektoren überschreiten von sich aus Iframe-Grenzen. Sie müssen zunächst den Treiber oder Kontext auf das Dokument des Iframes umstellen (driver.switchTo().frame() in Selenium frame.contentFrame() in Playwright) und dann Ihren Selektor innerhalb dieses Bereichs ausführen.

Dynamischer Inhalt. Single-Page-Anwendungen, die das DOM bei der Navigation neu schreiben, stellen eine andere Herausforderung dar. CSS-Selektoren, die auf stabile Attribute wie data-testid oder aria-label sind hier in der Regel robuster als klassenbasierte Selektoren, die sich zwischen verschiedenen Builds ändern können. An Textinhalte gebundene XPath-Ausdrücke können ebenfalls zuverlässig sein, vorausgesetzt, der sichtbare Text bleibt konsistent.

Robuste Selektoren schreiben

Unabhängig davon, wie Sie sich in der Debatte um XPath- vs. CSS-Selektoren positionieren: Das Schreiben von Selektoren, die DOM-Änderungen überstehen, ist wichtiger als die gewählte Sprache. Instabile Locators sind die Hauptursache für unzuverlässige Tests und fehlerhafte Scraper.

Bewährte Vorgehensweisen für beide Arten:

Bevorzugen Sie stabile Attribute. Verwenden Sie data-testid, aria-labeloder andere semantische Attribute anstelle von automatisch generierten Klassennamen oder Positionsindizes.
Halten Sie Selektoren kurz. Ein CSS-Selektor wie [data-testid="submit-btn"] ist robuster als div.form-wrapper > div:nth-child(3) > button.btn-primary. Das Gleiche gilt für XPath: //button[@data-testid='submit-btn'] ist besser als ein fünfstufiger absoluter Pfad.
Vermeiden Sie absolute XPaths. Selektoren, die mit /html/body/... , funktionieren nicht mehr, sobald sich ein übergeordnetes Element ändert. Verwenden Sie immer relativen XPath, der mit //.

Häufige Anti-Patterns, die es zu vermeiden gilt:

Verkettung von mehr als drei Ebenen von Nachkommen-Kombinatoren in CSS
Verwendung von XPath position() oder indexbasierte Auswahl (div[4]), wenn ein semantisches Attribut vorhanden ist
Verlassen auf dynamisch generierte Klassennamen (üblich in CSS-in-JS-Frameworks) für beide Selektortypen

Wenn Sie im Vorfeld in eine Selektor-Strategie investieren, stabile Anker wählen und Ihre Konventionen dokumentieren, sparen Sie bei der Skalierung Ihres Projekts erheblich Zeit beim Debuggen.

Wann sollte man XPath, CSS-Selektoren oder beides verwenden?

In der Debatte um XPath vs. CSS-Selektoren gibt es keinen universellen Sieger. Die richtige Wahl hängt davon ab, was Sie entwickeln.

Verwenden Sie standardmäßig CSS-Selektoren, wenn Ihre Selektionen IDs, Klassen, Attribute oder positionelle Pseudoklassen beinhalten. Sie sind in Browsern schneller, leichter zu lesen und werden überall unterstützt. Für einfache Web-Scraping-Aufgaben und die meisten Frontend-Testautomatisierungen decken CSS-Selektoren 80 % oder mehr Ihrer Lokalisierungsanforderungen mit weniger Code ab.

Greifen Sie auf XPath zurück, wenn Sie nach oben navigieren müssen (Auswahl von Eltern- oder Vorfahrenelementen), Textinhalte abgleichen oder komplexe bedingte Filter anwenden möchten, die mehrere Prädikate verketten. XPath ist auch die bessere Wahl, wenn Sie mit Nicht-HTML-XML-Dokumenten arbeiten oder wenn den Zielelementen nützliche Attribute fehlen.

Verwenden Sie beides, wenn Ihr Projekt dies rechtfertigt. In Selenium oder Playwright entstehen keinerlei Kosten für die Kombination By.CSS_SELECTOR und By.XPATH in derselben Testdatei zu kombinieren. Ein hybrider Ansatz ermöglicht es Ihnen, CSS für einfache, schnelle Selektionen und XPath für die wenigen Sonderfälle zu nutzen, die dies erfordern.

Checkliste zur schnellen Entscheidungsfindung

Verwenden Sie diese Checkliste, um die Einschränkungen Ihres Projekts dem richtigen Selektortyp zuzuordnen:

Geschwindigkeit hat oberste Priorität und Sie führen den Test in einem Browser aus: Verwenden Sie CSS-Selektoren.
Sie benötigen eine Durchquerung von übergeordneten Elementen oder Vorfahren: Verwenden Sie XPath.
Sie müssen anhand des sichtbaren Textinhalts abgleichen: Verwenden Sie XPath.
Ihr Framework unterstützt nur einen Typ (z. B. Cheerio nur CSS): Verwenden Sie das, was verfügbar ist.
Sie scrapen XML-Feeds oder Nicht-HTML-Daten: Verwenden Sie XPath.
Dein Team besteht hauptsächlich aus Frontend-Entwicklern: Verwende standardmäßig CSS-Selektoren für eine schnellere Einarbeitung.
Das DOM ändert sich häufig und du möchtest robuste Locators: Verwende den Typ, der data-testid oder aria-label (beide bewältigen dies gut).

Wichtige Erkenntnisse

CSS-Selektoren sind in Browserumgebungen im Allgemeinen schneller und bei Standardauswahlen (ID, Klasse, Attribut, Position) besser lesbar.
XPath ist die einzige Option, wenn Sie bidirektionale DOM-Durchquerung, Textinhaltsabgleich oder Vorfahrenauswahl benötigen.
Moderne CSS-Pseudoklassen wie :has() verringern die Funktionslücke, ersetzen jedoch das Achsen-System von XPath nicht vollständig.
Die Framework-Unterstützung variiert: Cheerio und BeautifulSoup (ohne lxml) unterstützen nur CSS, während Selenium und Playwright beide Selektor-Typen gleichermaßen unterstützen.
Beim Vergleich von XPath- und CSS-Selektoren ist die wichtigste Entscheidung, robuste Selektoren zu schreiben, die auf stabile Attribute abzielen, anstatt auf instabile Positions- oder generierte Klassen-Lokatoren.

FAQ

Kann ich sowohl XPath- als auch CSS-Selektoren im selben Selenium-Test verwenden?

Ja. Selenium unterstützt beide Selektortypen über By.CSS_SELECTOR und By.XPATH, und Sie können sie innerhalb einer einzelnen Testdatei oder sogar einer einzelnen Testmethode frei kombinieren. Der Wechsel zwischen den beiden hat keine negativen Auswirkungen auf die Leistung, verwenden Sie also den Typ, der für die jeweilige Element-Suche am besten geeignet ist.

Ersetzen moderne CSS-Selektoren wie :has() XPath bei der Auswahl von übergeordneten Elementen?

Teilweise. Mit der :has() Pseudoklasse ermöglicht es Ihnen, ein übergeordnetes Element anhand seiner untergeordneten Elemente auszuwählen, was das häufigste Szenario der Auswahl von übergeordneten Elementen abdeckt. Sie unterstützt jedoch keine vollständige Durchquerung der Vorfahren über mehrere Ebenen hinweg, keine Logik für vorangehende Geschwisterelemente oder bedingte Ketten, wie sie durch die XPath-Achsen ermöglicht werden. Stellen Sie sich :has() abdeckt etwa 60 % der Fälle, die zuvor XPath für die Navigation nach oben erforderten.

Welcher Selektortyp ist für dynamische Single-Page-Anwendungen zuverlässiger?

Keiner ist von Natur aus zuverlässiger. Die Zuverlässigkeit hängt davon ab, woran Sie Ihren Selektor verankern, nicht von der Selektorsprache selbst. Selektoren, die auf data-testid oder aria-label Attribute bleiben bei der Neu-Rendering des Frameworks stabil, unabhängig davon, ob sie in CSS oder XPath geschrieben sind. Vermeiden Sie Selektoren, die auf automatisch generierten Klassennamen oder tiefen Positionsindizes beruhen.

Wird XPath in Puppeteer und Playwright unterstützt?

Ja, beide unterstützen XPath. Puppeteer stellt es über die $x() Methode (oder page.evaluate mit document.evaluate). Playwright unterstützt XPath nativ in seinem locator() und $() APIs. In beiden Tools sind CSS-Selektoren die Standardeinstellung und werden häufiger verwendet, aber XPath steht zur Verfügung, wenn Sie dessen Traversierungsfunktionen benötigen.

Fazit

Die Frage „XPath oder CSS-Selektoren?“ lässt sich nicht eindeutig beantworten, da es sich um komplementäre Werkzeuge handelt, die sich überschneidende, aber unterschiedliche Probleme lösen. CSS-Selektoren sollten aus Gründen der Geschwindigkeit, Lesbarkeit und Einfachheit Ihre Standardwahl sein. XPath sollte Ihre erste Wahl sein, wenn Sie bei der vorwärtsgerichteten Durchquerung an Grenzen stoßen, textbasierte Übereinstimmungen benötigen oder mit Nicht-HTML-Dokumentformaten arbeiten.

Die Selektorsprache ist weniger wichtig als die Qualität des Selektors. Verankern Sie Ihre Locators an stabilen, semantischen Attributen. Halten Sie sie kurz. Dokumentieren Sie Ihre Konventionen, damit der nächste Entwickler (oder Ihr zukünftiges Ich) nicht zurückverfolgen muss, warum ein bestimmter XPath-Ausdruck existiert.