Ergebnis 1 bis 8 von 8

Thema: Suchindex Erstellung hängt

  1. #1
    Contao-Nutzer
    Registriert seit
    10.08.2009.
    Beiträge
    65

    Standard Suchindex Erstellung hängt

    Hallo Forum,

    ich habe eine neue Installation 5.2.6 mit PHP 8.1.25 und dem Theme 01. Theme Ver. 2.2.2 ohne Fehlermeldung installiert. Sonst keine weiteren Erweiterungen.
    https://neu.ub-march.de/ bei Ionos Provider.
    Bei Neuaufbau der Links und dem Suchindex mittels Systemwartung bleibt Crawler hängen. D.h. Anzahl der Seiten steigt immer mehr, Tabelle tl_crawl_queue wir immer größer.
    Auch nch Stunden kein Ende in Sicht.

    Crawler_1.jpg
    Crawler_2.jpg
    Geändert von hpt (18.11.2023 um 10:25 Uhr)

  2. #2
    Community-Moderator
    Wandelndes Contao-Lexikon
    Avatar von Spooky
    Registriert seit
    12.04.2012.
    Ort
    Scotland
    Beiträge
    34.114
    Partner-ID
    10107

    Standard

    Vermutlich hast du Filter- oder Pagination-Links via Query Parameter auf deiner Seite. Das erhöht die Anzahl der URL-Kandidaten exponentiell.

    Wenn du weißt, dass du jegliche URL mit Query Parameter nicht unbedingt im Suchindex brauchst (auch nicht bei anderen Suchmaschinen), kannst du folgendes zu den robots.txt Einstellungen im Startpunkt der Website hinzufügen:
    Code:
    user-agent: *
    disallow: /*?*
    Das wird dann die Anzahl der URLs dramatisch reduzieren.

    Stelle außerdem sicher, dass du den Canonical Tag im Startpunkt der Website aktiviert hast.
    » sponsor me via GitHub or PayPal or Revolut

  3. #3
    Contao-Nutzer
    Registriert seit
    10.08.2009.
    Beiträge
    65

    Standard

    Vielen Dank für die schnelle Antwort.
    Canonical Tag habe ich auf der Startseite aktiviert,
    in den robots.txt Einstellungen die Code Einträge eingefügt.

    Leider noch keine Veränderung!

    Die Aussage Filter- oder Pagination-Links via Query Parameter sagt mir gar nichts. Kann es sein, das das Theme solche Filter verwendet?
    Was sind Query Parameter, wo sind sie in Contao zu finden?

  4. #4
    Community-Moderator
    Wandelndes Contao-Lexikon
    Avatar von Spooky
    Registriert seit
    12.04.2012.
    Ort
    Scotland
    Beiträge
    34.114
    Partner-ID
    10107

    Standard

    Hattest du auch "Nach defekten Links suchen" aktiviert? Falls ja: bewusst? Denn auch das kann die Anzahl der URLs dramatisch erhöhen.
    » sponsor me via GitHub or PayPal or Revolut

  5. #5
    Community-Moderator
    Wandelndes Contao-Lexikon
    Avatar von Spooky
    Registriert seit
    12.04.2012.
    Ort
    Scotland
    Beiträge
    34.114
    Partner-ID
    10107

    Standard

    Mit der aktualisierten robots.txt und ohne Broken Link Checker sieht es bei deiner Domain jetzt jedenfalls so aus:

    Angehängte Grafiken Angehängte Grafiken
    » sponsor me via GitHub or PayPal or Revolut

  6. #6
    Community-Moderator
    Wandelndes Contao-Lexikon
    Avatar von Spooky
    Registriert seit
    12.04.2012.
    Ort
    Scotland
    Beiträge
    34.114
    Partner-ID
    10107

    Standard

    Zitat Zitat von hpt Beitrag anzeigen
    Was sind Query Parameter, wo sind sie in Contao zu finden?
    Hier hast du z.B. sehr viele Query Parameter Kombinationen: https://neu.ub-march.de/events.html
    » sponsor me via GitHub or PayPal or Revolut

  7. #7
    Contao-Nutzer
    Registriert seit
    10.08.2009.
    Beiträge
    65

    Standard

    Hat sich gearde mit der vorgehenden Antwort überschnitten! Nun ist es mir klar! Die Events sind das Problem im Theme!

    Bisher habe ich bei allen anderen meiner Contao Installation immer auch defekte Links aktiviert gehabt und dabei keine Probleme damit erlebt.
    Wenn ich nur "Den Suchindex aktualisieren" aktiviere, funktioniert Contao nun wie gewünscht!
    Crawler_3.jpg

    werde nun Kontakt zu https://pdir.de/ aufnehmen. Villeicht kann da das Problem mit den Links erläutert werden.
    Danke!

  8. #8
    Community-Moderator
    Wandelndes Contao-Lexikon
    Avatar von Spooky
    Registriert seit
    12.04.2012.
    Ort
    Scotland
    Beiträge
    34.114
    Partner-ID
    10107

    Standard

    Zitat Zitat von hpt Beitrag anzeigen
    Werde nun Kontakt zu https://pdir.de/ aufnehmen. Villeicht kann da das Problem mit den Links erläutert werden.
    Danke!
    Das ist nicht wirklich ein Problem des Themes. Die erwähnte Seite ist nur eine Beispiel-Seite des Themes. Durch die dort eingesetzten Module kommt es quasi zu unendlich vielen URL-Kombinationen, die der Broken-Link-Checker dann alle prüfen würde. Der Broken-Link-Checker scheint hier die robots.txt Anweisungen zu ignorieren (verwirft aber aufgrund der robots.txt Anweisungen später dann die eigentliche Prüfung). Das ist also eher etwas, dass du als Issue in Contao melden solltest.
    » sponsor me via GitHub or PayPal or Revolut

Aktive Benutzer

Aktive Benutzer

Aktive Benutzer in diesem Thema: 1 (Registrierte Benutzer: 0, Gäste: 1)

Lesezeichen

Lesezeichen

Berechtigungen

  • Neue Themen erstellen: Nein
  • Themen beantworten: Nein
  • Anhänge hochladen: Nein
  • Beiträge bearbeiten: Nein
  •