Zunächst einmal möchte ich sagen, dass die Sache nach den letzten Änderungen deutlich besser aussieht und der Aufbau des Indexes auch auf meiner Seite wieder durch läuft . Das ist schonmal sehr gut!
Es gibt aber noch immer Suchergebnisse, die ich da nicht sehen möchte. Daher zunächst die Frage, ob ich die auch einfach nach dem Aufbau des Suchindexes über die Datenbank löschen könnte, also aus der tl_search. Kann es damit Probleme geben? Ich habs mal getestet und ich kann erst einmal keine Probleme erkennen. Das würde die Suchergebnisse für die Leser meiner Ansicht nach deutlich verbessern.
Konkret ist mir aufgefallen, dass folgende Links aufgenommen werden:
- Links, die im Frontoffice in den Texten gesetzt wurden und MM Filter nutzen. Mir ist klar, dass ich die Links selber ändern und mit dem data-escargot-ignore versehen muss, aber ich finde wohl nicht alle.
- Links der von MM erzeugten Linklisten und Selectfelder und zwar nach wie vor in Kombinationen mit Seiten.
- Links von Checkboxen (Ja/Nein)
- Links von Seiten der MM Listen. Die möchte ich alle nicht in den Suchergebnissen haben. Wenn ich das template aber entsprechend ändere, werden auch die auf den Seiten enthaltenen Einträge nicht mehr in die Suche aufgenommen. Das ist natürlich nichts.
Das Ziel ist für mich, dass nur die erste Seite mit der MM Liste aufgenommen wird (also ohne die Seitenzahl als Angang) und die Detailseiten. So war es ja auch bis zur Änderung des Crawlers. Alles andere ist in meinen Augen überflüssig und bläht den Suchindex nur auf.
Ein Fehler werden doch aber sicher solche Links sein oder? Das ist bei den tags. Oder waren die schon immer so?
https://***/Seitenname/page/8/anfang...prägung4.html
Du kannst es dir auf meiner Seite live ansehen, zonky.