Contao-Camp 2024
Ergebnis 1 bis 8 von 8

Thema: Robots-Tag "noindex, nofollow" & die "Nicht durchsuchen" Funktion sind unklar

  1. #1
    Contao-Fan
    Registriert seit
    08.03.2010.
    Beiträge
    451

    Frage Robots-Tag "noindex, nofollow" & die "Nicht durchsuchen" Funktion sind unklar

    Hallo,
    ich werde nicht ganz schlau aus diesen beiden Einstellungen. So wie es in der Contao Doku beschrieben ist funktioniert es bei mir nicht genau.

    Ich verstehe es so: Die Robots-Tag einstellungen bestimmt wie Suchmaschinen wie z.B. Google die Seiten indizieren oder eben auch nicht. Die "Nicht durchsuchen" bestimmt ob die interne Contao Suchmaschine die Seiten indizieren soll oder eben auch nicht. Wenn ich aber alle Seiten auf "noindex, nofollow" stelle dann indiziert mir aber auch der interne Contao Crawler nicht die Seiten. Das steht dann sogar auch so im debug.log drin:
    Do not request because the URI was disallowed to be followed by either rel="nofollow" or robots.txt hints.


    oder auch bei manchen Seiten:
    Forwarded to the search indexer. Did not index because of the following reason: No JSON-LD found.
    das verstehe ich auch nicht was genau damit gemeint ist.

    Auch wenn ich die robots.txt auf Disallow: / stelle wird nichts mehr vom Crawler indiziert.

    Ich verstehe das Zusammenspiel dieser beiden Einstellungen nicht, und ob ich vielleicht anderswo einen Fehler gemacht habe und es deswegen nicht funktioniert.
    danke!

  2. #2
    Community-Moderator
    Wandelndes Contao-Lexikon
    Avatar von Spooky
    Registriert seit
    12.04.2012.
    Ort
    Scotland
    Beiträge
    33.897
    Partner-ID
    10107

    Standard

    Der Robots Meta Tag gilt für alle Crawler, egal ob von Google, Bing, oder der eigene Crawler von Contao.

    Die Einstellung Nicht durchsuchen ist unabhängig vom Crawler und definiert für den Search Indexer nur, ob der Inhalt der Seite in den Suchindex aufgenommen werden sollte oder nicht, unabhängig davon, von wem die Seite aufgerufen wurde.
    » sponsor me via GitHub or PayPal or Revolut

  3. #3
    Contao-Fan
    Registriert seit
    08.03.2010.
    Beiträge
    451

    Frage

    Wenn ich das jetzt richtig verstehe kommt die Nicht durchsuchen Funktion nur dann zum tragen wenn ein Besucher die Seite aufruft. In dem Fall würde die Seite nicht indiziert werden. Aber wenn ich vorab unter Systemwartung Den Suchindex aktualisieren auswähle kommt nur die Robots-Tag Einstellung zum tragen und die Nicht durchsuchen Einstellung wird ignoriert?!

    Wenn dem so ist hiesse es aber auch das es keine Kombination gibt eine interne Suche anzubieten und gleichzeitig Google und Bing auszuschliessen, oder verstehe ich das falsch. Und wenn ja, wie wäre dann in meinem Fall die optimale Einstellungskombination?

    Danke schonmal für die Hinweise!

  4. #4
    Community-Moderator
    Wandelndes Contao-Lexikon
    Avatar von Spooky
    Registriert seit
    12.04.2012.
    Ort
    Scotland
    Beiträge
    33.897
    Partner-ID
    10107

    Standard

    Zitat Zitat von atomfried Beitrag anzeigen
    Wenn ich das jetzt richtig verstehe kommt die Nicht durchsuchen Funktion nur dann zum tragen wenn ein Besucher die Seite aufruft.
    Wenn die Seite aufgerufen wird generell, ja (nicht nur von einem Besucher aus Fleisch & Blut ).


    Zitat Zitat von atomfried Beitrag anzeigen
    Aber wenn ich vorab unter Systemwartung Den Suchindex aktualisieren auswähle kommt nur die Robots-Tag Einstellung zum tragen und die Nicht durchsuchen Einstellung wird ignoriert?!
    Nein, das wird nicht ignoriert.



    Zitat Zitat von atomfried Beitrag anzeigen
    Wenn dem so ist hiesse es aber auch das es keine Kombination gibt eine interne Suche anzubieten und gleichzeitig Google und Bing auszuschliessen, oder verstehe ich das falsch. Und wenn ja, wie wäre dann in meinem Fall die optimale Einstellungskombination?
    Jein. Die betroffenen URLs werden in diesem Fall dann zwar nicht durch den Aufruf von Google, Bing oder dem Contao Crawler in den Suchindex aufgenommen, aber trotzdem, wenn die Seite anderweitig aufgerufen wird.

    Evt. solltest du dies auf GitHub zur Diskussion stellen, also dass man über den Contao Crawler trotzdem Seiten in den Suchindex aufnehmen lassen kann, auch wenn sie für alle anderen Crawler auf noindex sind.
    Geändert von Spooky (24.08.2021 um 15:07 Uhr)
    » sponsor me via GitHub or PayPal or Revolut

  5. #5
    Contao-Fan
    Registriert seit
    08.03.2010.
    Beiträge
    451

    Daumen hoch

    Das werde ich wohl so machen. Wird mein erster Github post werden aber dann wenigstens mit einem richtigen Feature-Wunsch.

    In meinem Fall wäre dann die kurzfristige Lösung einfach nach und nach alle Seiten einmal selbst aufzurufen. Dummerweise sind es aktuell 435 Seiten. Da werde ich mir wohl ein kleines script schreiben müssen oder einen Linkchecker raussuchen. Danach muss ich nur peinlichst genau darauf achten niemals den Suchindex mehr zu löschen.

  6. #6
    Community-Moderator
    Wandelndes Contao-Lexikon
    Avatar von Spooky
    Registriert seit
    12.04.2012.
    Ort
    Scotland
    Beiträge
    33.897
    Partner-ID
    10107

    Standard

    Du könntest aber auch die Seite auf noindex belassen, dafür aber die Einstellung bzw. Ausgabe dynamisch ändern, je nach User-Agent (der Contao Crawler schickt einen spezifischen User-Agent mit).
    » sponsor me via GitHub or PayPal or Revolut

  7. #7
    Contao-Fan
    Registriert seit
    08.03.2010.
    Beiträge
    451

    HTML

    Interessanter Gedanke. Nur würde ich in dem Fall eher das Ausschließ- anstatt das Einschließverfahren wählen. Wenn ein Besucher (Fleisch & Blut) auf die Seite geht dann darf der Contao Crawler liebend gerne die Seite indizieren (das wäre ohnehin schon vorher über die Systemwartung passiert, was gefühlt mehr als ne halbe Stunde dauert). Ich müsste dann nur die User-Agents von Google usw. aussperren.

    ich werde den Feature-Wunsch kommunizieren, alleine schon deswegen weil ich glaube nicht der einzige zu sein der diese Funktion gerne hätte, auch wenn es eher ein seltenes Szenario ist.

  8. #8
    Contao-Nutzer
    Registriert seit
    21.07.2015.
    Beiträge
    2

    Standard

    Hallo,

    ich bin auf meiner Suche nach einer Lösung auf diesen Thread gestoßen, und denke, meine Frage passt hier genau zu.

    Ich habe eine Website, auf der es einige Unterseiten gibt, die nicht in den Google- bzw. Suchmaschinen-Index mit aufgenommen werden sollen. Ich hatte es vor Contao 4 so eingestellt, dass die Seiten auf "noindex,nofollow" standen und KEIN Häkchen bei "Nicht durchsuchen" gesetzt war. Das hat auch wunderbar funktioniert. Die Suche auf Website hat immer schön Ergebnisse geliefert.
    Nun gab es das Update auf Contao 4 und auf einmal funktionierte die Suche nicht mehr ... da bin ich auf diesen Thread gestoßen. Und scheinbar gilt das "noindex,nofollow" nun auch für die interne Contao-Suche.

    Nun meine Frage: Wie löse ich es, dass die Seiten nicht in "normalen" Suchmaschinen auftauchen, aber dennoch von der internen Contao-Suche durchsucht werden können und mir diese Ergebnisse liefert?

Aktive Benutzer

Aktive Benutzer

Aktive Benutzer in diesem Thema: 2 (Registrierte Benutzer: 0, Gäste: 2)

Lesezeichen

Lesezeichen

Berechtigungen

  • Neue Themen erstellen: Nein
  • Themen beantworten: Nein
  • Anhänge hochladen: Nein
  • Beiträge bearbeiten: Nein
  •