Contao-Camp 2024
Ergebnis 1 bis 9 von 9

Thema: Crawler in Contao 4.9 indexiert nicht.

  1. #1
    Contao-Nutzer
    Registriert seit
    09.09.2010.
    Ort
    Berlin
    Beiträge
    77

    Frage Crawler in Contao 4.9 indexiert nicht.

    Hallo,

    ich habe eine Contao Neuistallation (Manager) und habe die Installation über eine Testdomain aufgebaut. Jetzt ist die Seite unter der endgültigen URL zu finden. Leider funktioniert jetzt der Crawler nicht mehr.
    Code:
    Broken link! Could not request properly: Couldn't resolve host name for "https://xyz.de/be.html"..
    BE ist hierbei der Alias vom Root-Element. Wenn ich es manuell öffne werde ich automatisch auf die Startseite weitergeleitet.
    Der Crawler findet keine Inhalte.
    Der Startpunkt der Seite hat im BE den Domainnamen eingetragen.

    Hat jemand ne Idee an was das liegen könnte?

    Danke!
    Geändert von mimamuxx (17.09.2020 um 10:45 Uhr)

  2. #2
    Contao-Nutzer Avatar von mokaki
    Registriert seit
    19.12.2009.
    Ort
    Bayern
    Beiträge
    180

    Standard

    schau mal ob

    Seitenstruktur > Startseite
    HTTPS verwenden - angeklickt ist...

  3. #3
    Contao-Nutzer
    Registriert seit
    09.09.2010.
    Ort
    Berlin
    Beiträge
    77

    Standard

    ja, ist aktiviert!

  4. #4
    Contao-Nutzer
    Registriert seit
    09.09.2010.
    Ort
    Berlin
    Beiträge
    77

    Frage

    irgend Jemand eine Idee?

  5. #5
    Contao-Fan Avatar von MrLumbergh
    Registriert seit
    11.01.2012.
    Ort
    Hamburg
    Beiträge
    368

    Standard

    Habe genau das gleiche Problem. Hat jemand ne Idee?

  6. #6
    Contao-Nutzer
    Registriert seit
    18.03.2010.
    Beiträge
    63

    Standard

    Bei uns war es einen htaccess-Datei mit Passwort-Schutz - dann kann der Crawler natürlich die Seiten nicht aufrufen.

  7. #7
    Contao-Nutzer
    Registriert seit
    30.01.2014.
    Beiträge
    8

    HTML Nach wie vor reproduzierbar *solved*

    Bei mir tritt ebenfalls das gleiche Problem auf, in Contao 4.9.16.

    Sowohl der Broken Link Checker als auch der der Crawler fangen an, als erstes https://www.meine-domain.com/mein-startpunkt-alias.html durchsuchen zu wollen, verbuchen es als 404 und machen dann einfach nicht weiter sondern brechen beide mit einem Fehler ab. Die einzige Message des einzigen Eintrags im Log lautet entsprechend "Broken link! HTTP Status Code: 404."
    Ich habe sowohl die Domain eingetragen als auch den Haken bei "https verwenden" gesetzt.

    Das ist echt fatal, die Suchfunktion ist essentiell für unseren Kunden und auf dem Testserver lief auch alles.
    Hat wirklich niemand hier eine Idee, woran das liegen könnte?

    Und bevor jemand unter Bezug auf den Post vor Diesem fragt: Nein, natürlich hat die Seite keinen Basic-Auth-Verzeichnisschutz, die soll ja öffentlich erreichbar sein (und ist es auch).

    EDIT: Hat sich erledigt.

    So seltsam es scheinen mag: Es scheint, dass die Ursache des Problems war, dass der Server beim Crawling-Vorgang wohl über einen DNS gelaufen ist, der ihn nicht wieder zu sich selbst geführt hat, sondern unter der zu crawlenden Adresse noch die alte IP gefunden hat, obwohl der Domain-Transfer bereits erfolgreich vollzogen war. Es klingt wirklich absurd, dass der Crawler nicht realisiert, dass die aufgelöste IP-Adresse nicht seine eigene ist, aber das muss die Ursache gewesen sein. Ein Äquivelent zum Startpunkt gab es auf der alten Website halt nicht und ohne einen Einstiegspunkt hat der Crawler natürlich keine Links gefunden, um von da aus weiterzusuchen. Einen Tag später hatten sich die meisten DNS-Caches dann geleert und der Crawling-Prozess lief erfolgreich durch. Alles, was es nach einem frischen Domain-Umzug benötigt, ist also ein wenig Geduld. Daher mein Tipp: Suchfunktion für die ersten zwei Tage nach Go-Live via Domain-Zuweisung (vor allem bei einem Umzug von einem anderen Server/Anbieter) ausblenden, warten bis so ziemlich alle DNS-Einträge überall erneuert sind und dann erst crawlen und die Suche wieder anzeigen.
    Geändert von Sigmus (06.07.2021 um 23:48 Uhr)

  8. #8
    Contao-Fan Avatar von Birden
    Registriert seit
    15.01.2011.
    Beiträge
    768

    Standard

    Zitat Zitat von Sigmus Beitrag anzeigen
    https://www.meine-domain.com/mein-startpunkt-alias.html
    Soll das die Startseite sein, oder ist es eine Untersteite?

  9. #9
    Community-Moderator
    Wandelndes Contao-Lexikon
    Avatar von Spooky
    Registriert seit
    12.04.2012.
    Ort
    Scotland
    Beiträge
    34.059
    Partner-ID
    10107

    Standard

    Laut der Beschreibung ist das der Alias des Website Roots.
    » sponsor me via GitHub or PayPal or Revolut

Aktive Benutzer

Aktive Benutzer

Aktive Benutzer in diesem Thema: 1 (Registrierte Benutzer: 0, Gäste: 1)

Lesezeichen

Lesezeichen

Berechtigungen

  • Neue Themen erstellen: Nein
  • Themen beantworten: Nein
  • Anhänge hochladen: Nein
  • Beiträge bearbeiten: Nein
  •