Wie wir alle wissen, werden Scripte, Stylesheets, Bilder, etc. in Contao immer relativ zu der im BASE-Tag angegebenen URL verlinkt. Das sieht dann so aus:
In der Theorie ist das alles richtig und eine tolle Sache, da die Basis-URL nur einmal angegebene werden muss. In der Praxis sehe ich aber im Log, dass durch die Bank weg alle Browser, Suchmaschinen und sonstige Crawler mehr oder weniger Probleme damit haben und immer wieder unnötige 404er produzieren. Selbst beim Googlebot konnte ich das beobachten (Domain geändert):HTML-Code:<head> <base href="http://www.example.com/"> <link rel="stylesheet" href="assets/css/f9bf0fdc4898.css"> </head> <body> <img src="files/images/bild.jpg" alt=""> </body>
Die Seite inkl. dem Bild habe ich erst gestern hinzugefügt und heute hat der GoogleBot (IP kommt wirklich von Google) das Bild nicht in dem BASE + Bild Pfad sondern im relativen Pfad zum Ausgangsverzeichnis gesucht.Code:Details: No active page for page ID "grammatik/zeiten", host "www.example.com" and languages "" (http://www.example.com/de/grammatik/zeiten/files/images/english/english_tenses.de.png) Funktion: PageError404 generate() IP-Adresse: 66.249.78.0 Browser: Mozilla/5.0 (compatible; Googlebot/2.1; +http://www.google.com/bot.html)
Momentan ist bei mir die Lage so, dass ich nur durch ’zig Regeln in der .htaccess, die die häufigsten Fehler an die richtigen Stellen weiterleiten, überhaupt noch das Log halbwegs nutzen kann. Ohne diese Maßnahmen sind ca. 95 % der Logeinträge 404er von falsch aufgelösten URLs, bei denen der BASE-Tag nicht beachtet wurde.
Ich möchte mal hier in die Runde fragen, wie das bei anderen aussieht. Habt ihr ähnliche Erfahrungen gemacht oder nicht? Stört euch das oder nutzt ihr das Log sowieso nicht? Gibt es noch andere Weg, wie man das umgehen kann?
Gruß
Lesezeichen