Hi,
ich habe eine Contao Intranet Installation von 4.4 auf 4.9.22 aktualisiert. Leider musste ich dabei lernen, dass das Indizieren von geschützen Inhalten jetzt nicht mehr so einfach klappt.
Nachdem ich stundenlang mit Forensuchen und Google herausgefunden habe, was man beachten muss und irgendwann alles im Backend auch funktioniert hat, wollte ich den crawler über die SSH Console probieren, weil der Index über das Backend fast eine Stunde läuft.
Leider bringt mir der Crawler nur die grüne "Erfolgsmeldung": [OK] Indexed 0 URI(s) successfully. 0 failed.
Im Log steht dann bei allen offenen und geschützen Seiten: "Forwarded to the search indexer. Did not index because of the following reason: Was explicitly marked "noSearch" in page settings."
Das ist schlicht falsch. Über den Backend Crawler funktioniert es ja auch.
Alle Seiten stehen auf index,follow. Ich habe eine Sitemap (nur deshalb aktiviert) und auch den Domainnamen eingetragen in der Wurzel. Auch die config.yml ist für protected pages angepasst.
Was kann noch der Unterschied sein zwischen Backend und SHH Crawler, dass er über die Console die Seiten als "Nicht durchsuchen" erkennt? Kann mir jemand einen Tipp geben?
Lesezeichen