Contao-Camp 2024
Ergebnis 1 bis 5 von 5

Thema: robots.txt gibt ungewollt "Disallow: /" aus!

  1. #1
    Contao-Nutzer Avatar von mandrael
    Registriert seit
    29.06.2009.
    Ort
    Salzburg, Austria
    Beiträge
    224

    Standard robots.txt gibt ungewollt "Disallow: /" aus!

    Hallo,
    seit dem Update auf v4.12 blockiert Contao alle Suchmaschinen mit
    User-agent: *
    Disallow: /
    (zumindest ist es mir heute aufgefallen und ich vermute zumindest, dass das Update damit zu tun hat)

    Es ist nichts im Seitenbaum bei robots eingetragen, ich habe den prod-cache gelöscht und auch die entsprechenden Einträge in der Systemwartung. Auch den Cloudflare-Cache.
    Ebenfalls habe ich manuell eine korrigierte robots.txt in /web zu kopiert.

    Es ist also ein SEO Worst-Case-Szenario.
    Woran könnte das liegen und wie kann ich die robots.txt beeinflussen? Habe ich da etwas übersehen?

    Vielen Dank und liebe Grüße, Michael

  2. #2
    Community-Moderator
    Wandelndes Contao-Lexikon
    Avatar von Spooky
    Registriert seit
    12.04.2012.
    Ort
    Scotland
    Beiträge
    34.059
    Partner-ID
    10107

    Standard

    Kann ich nicht bestätigen. By default gibt die /robots.txt Route folgendes aus:
    Code:
    user-agent:*
    disallow:/contao/
    
    sitemap:https://example.com/sitemap.xml
    Sicher dass du keine eigene robots.txt im web/ bzw. public/ Ordner liegen hast?
    » sponsor me via GitHub or PayPal or Revolut

  3. #3
    Contao-Nutzer Avatar von mandrael
    Registriert seit
    29.06.2009.
    Ort
    Salzburg, Austria
    Beiträge
    224

    Standard

    Liebe Spooky,
    danke für die rasche Antwort! Wenn ich
    https://www.domain.tld/preview.php/robots.txt
    aufrufe, bekomme ich genau deine Ausgabe, also wie es sein sollte.

    Rufe ich allerdings https://www.domain.tld/robots.txt auf, kommt eine custom robots.txt mit dem problematischen Eintrag.
    Alle mir bekannten Caches habe ich gelöscht...

    In /web ist keine robots.txt

    Es ist mir also ein Rätsel, wo die modifizierte robots.txt herkommt. Ich habe auch mit browserling.com ausgeschlossen, dass es an meinem Rechner liegt :-/

    Liebe Grüße, Michael

  4. #4
    Contao-Nutzer Avatar von mandrael
    Registriert seit
    29.06.2009.
    Ort
    Salzburg, Austria
    Beiträge
    224

    Standard

    Nach einem Klick auf "Debug Mode: Activate" ging die ganze Seite nicht mehr. Nach dem Klick auf Deactivate im Contao Manager ist der auch nicht mehr erreichbar.

    Letztes Lebenszeichen:
    "ERROR 524
    HTTP-Anfrage für "DELETE api/contao/jwt-cookie" fehlgeschlagen.
    Der Server hat eine Antwort mit Status-Code 524 gesendet.
    <!DOCTYPE html>"

    Heute ist wohl nicht mein Tag :-/

  5. #5
    Contao-Nutzer Avatar von mandrael
    Registriert seit
    29.06.2009.
    Ort
    Salzburg, Austria
    Beiträge
    224

    Standard

    Okay, für den Fall, dass noch jemand dieses seltene Problem hat:

    Es sieht aus, das ganze Problem hatte mit Cloudflare zu tun, nicht mit Contao an sich. Die Subdomains (nicht in Cloudflare) zeigten stets die richtige robots-Datei und nachdem Contao auf der Hauptdomain in die Knie ging, konnte ich sowohl das Backend als auch den Manager auf den Subdomains aufrufen. Nur www.domain.tld wurde von Cloudflare gecached. Ich habe Cloudflare für diese Domain deaktiviert.
    Danach gab es ein "DNS_PROBE_FINISHED_NXDOMAIN"-Problem, das mit dem NGINX-Server zusammenhing (cpnginx). Nach "rebuild vhosts" und "restart" war auch dieses Problem behoben. Contao läuft nun wieder normal auf der Hauptdomain und es wird die korrekte robots.txt ausgegeben.

    Vielen Dank nochmal für die rasche Reaktion und einen schönen Abend :-D
    LG Michael

Aktive Benutzer

Aktive Benutzer

Aktive Benutzer in diesem Thema: 1 (Registrierte Benutzer: 0, Gäste: 1)

Lesezeichen

Lesezeichen

Berechtigungen

  • Neue Themen erstellen: Nein
  • Themen beantworten: Nein
  • Anhänge hochladen: Nein
  • Beiträge bearbeiten: Nein
  •