Ergebnis 1 bis 22 von 22

Thema: Immer Ärger mit dem BASE-Tag - Meinungen und Erfahrungen erwünscht

  1. #1
    Contao-Fan Avatar von Babelfisch
    Registriert seit
    30.06.2009.
    Ort
    Leipzig
    Beiträge
    894

    Standard Immer Ärger mit dem BASE-Tag - Meinungen und Erfahrungen erwünscht

    Wie wir alle wissen, werden Scripte, Stylesheets, Bilder, etc. in Contao immer relativ zu der im BASE-Tag angegebenen URL verlinkt. Das sieht dann so aus:

    HTML-Code:
    <head>
      <base href="http://www.example.com/">
      <link rel="stylesheet" href="assets/css/f9bf0fdc4898.css">
    </head>
    <body>
      <img src="files/images/bild.jpg" alt="">
    </body>
    In der Theorie ist das alles richtig und eine tolle Sache, da die Basis-URL nur einmal angegebene werden muss. In der Praxis sehe ich aber im Log, dass durch die Bank weg alle Browser, Suchmaschinen und sonstige Crawler mehr oder weniger Probleme damit haben und immer wieder unnötige 404er produzieren. Selbst beim Googlebot konnte ich das beobachten (Domain geändert):

    Code:
    Details: No active page for page ID "grammatik/zeiten", host "www.example.com" and languages ""
     (http://www.example.com/de/grammatik/zeiten/files/images/english/english_tenses.de.png)
    Funktion:	PageError404 generate()
    IP-Adresse:	66.249.78.0
    Browser:	Mozilla/5.0 (compatible; Googlebot/2.1; +http://www.google.com/bot.html)
    Die Seite inkl. dem Bild habe ich erst gestern hinzugefügt und heute hat der GoogleBot (IP kommt wirklich von Google) das Bild nicht in dem BASE + Bild Pfad sondern im relativen Pfad zum Ausgangsverzeichnis gesucht.

    Momentan ist bei mir die Lage so, dass ich nur durch ’zig Regeln in der .htaccess, die die häufigsten Fehler an die richtigen Stellen weiterleiten, überhaupt noch das Log halbwegs nutzen kann. Ohne diese Maßnahmen sind ca. 95 % der Logeinträge 404er von falsch aufgelösten URLs, bei denen der BASE-Tag nicht beachtet wurde.

    Ich möchte mal hier in die Runde fragen, wie das bei anderen aussieht. Habt ihr ähnliche Erfahrungen gemacht oder nicht? Stört euch das oder nutzt ihr das Log sowieso nicht? Gibt es noch andere Weg, wie man das umgehen kann?

    Gruß
    Meine aktiven Contao-Projekte: LingoliaStiftung firmm

  2. #2
    Community-Moderator
    Wandelndes Contao-Lexikon
    Avatar von Spooky
    Registriert seit
    12.04.2012.
    Ort
    Scotland
    Beiträge
    34.316
    Partner-ID
    10107

    Standard

    Zitat Zitat von Babelfisch Beitrag anzeigen
    Code:
    Details: No active page for page ID "grammatik/zeiten", host "www.example.com" and languages ""
     (http://www.example.com/de/grammatik/zeiten/files/images/english/english_tenses.de.png)
    Funktion:	PageError404 generate()
    IP-Adresse:	66.249.78.0
    Browser:	Mozilla/5.0 (compatible; Googlebot/2.1; +http://www.google.com/bot.html)
    Die Seite inkl. dem Bild habe ich erst gestern hinzugefügt und heute hat der GoogleBot (IP kommt wirklich von Google) das Bild nicht in dem BASE + Bild Pfad sondern im relativen Pfad zum Ausgangsverzeichnis gesucht.
    Das ist ja dann gar kein Problem mit dem Base Tag, sondern mit der Language URL. Oder sehe ich das falsch?

    Wenn man die Language in der URL hat, kann man bspw. in den Browsern auch nicht direkt aus dem View Source Code Fenster die verlinkten CSS oder JavaScript Dateien aufmachen, weil der Browser dann immer auf example.com/de/files/foo/css/arr.css verlinkt, statt auf example.com/files/foo/css/arr.css.
    Geändert von Spooky (05.09.2013 um 11:34 Uhr)

  3. #3
    Contao-Fan Avatar von Babelfisch
    Registriert seit
    30.06.2009.
    Ort
    Leipzig
    Beiträge
    894

    Standard

    Zitat Zitat von Spooky Beitrag anzeigen
    Das ist ja dann gar kein Problem mit dem Base Tag, sondern mit der Language URL. Oder sehe ich das falsch?
    Nein, das ist ein BASE-Tag-Problem. Die Ausgangsseite war:

    Code:
    http://www.example.com/de/grammatik/zeiten/zeitpfeil
    Dort war dieses Bild eingebunden:

    HTML-Code:
    <img src="files/images/english/english_tenses.de.png">
    Im Base-Tag steht:

    HTML-Code:
    <base href="http://www.example.com/">
    Entsprechend wäre der richtig aufgelöste Pfad zum Bild:

    Code:
    http://www.example.com/files/images/english/english_tenses.de.png
    Ignoriert man dagegen den BASE-Tag und generiert den Pfad relativ zur Dokument-URL, kommt das raus:

    Code:
    http://www.example.com/de/grammatik/zeiten/files/images/english/english_tenses.de.png
    … und genau danach hat der GoogleBot gesucht. Er hat also definitiv den BASE-Tag ignoriert.

    Gruß
    Meine aktiven Contao-Projekte: LingoliaStiftung firmm

  4. #4
    Contao-Urgestein
    Registriert seit
    07.07.2009.
    Beiträge
    4.107

    Standard

    Und welchen Vorteil hast du nun wenn du den Base Tag weglässt? Ich empfehle dir Domainlink für absolute URLs

  5. #5
    Contao-Fan Avatar von Babelfisch
    Registriert seit
    30.06.2009.
    Ort
    Leipzig
    Beiträge
    894

    Standard

    Zitat Zitat von andreasisaak Beitrag anzeigen
    Und welchen Vorteil hast du nun wenn du den Base Tag weglässt?
    Ähh, keines der genannten Probleme…

    Zitat Zitat von andreasisaak Beitrag anzeigen
    Ich empfehle dir Domainlink für absolute URLs
    Funktioniert das auch bei Bildern?

    Gruß
    Meine aktiven Contao-Projekte: LingoliaStiftung firmm

  6. #6
    Contao-Urgestein
    Registriert seit
    07.07.2009.
    Beiträge
    4.107

    Standard

    Wenn der Googlebot den Base tag nun eh ignoriert und du ihn aus der fe_page löscht, was hast du dann gewonnen? Das wird mir nicht klar.

    Und ja Domainlink greift überall, nur bei Links/Bildern aus dem TinyMCE nicht.

  7. #7

  8. #8
    AG CMS-Garden
    Contao-Urgestein
    Avatar von lindesbs
    Registriert seit
    05.06.2009.
    Ort
    Oer-Erkenschwick
    Beiträge
    4.154
    Partner-ID
    keine
    User beschenken
    Wunschliste

    Standard

    Ich kenne Content Suchmaschine, die sich fuer Bilder oder CSS interessiert.
    Es geht hierbei NUR um den sichtbaren Content.
    Und das ist eben TEXT.
    von Willi Voltz aus PR 500: Henry George sagte einmal: »Kultur ist Zusammenarbeit.«


    Contao-Hosting: begeisterter Uberspace-Nutzer

  9. #9
    Community-Moderator
    Wandelndes Contao-Lexikon
    Avatar von Spooky
    Registriert seit
    12.04.2012.
    Ort
    Scotland
    Beiträge
    34.316
    Partner-ID
    10107

    Standard

    Zitat Zitat von Babelfisch Beitrag anzeigen
    Ähh, keines der genannten Probleme…
    Wenn du den base tag einfach weg lässt, besteht das Problem ja weiterhin, daher ist mir auch nicht ganz klar worauf du hinaus willst.


    Zitat Zitat von lindesbs Beitrag anzeigen
    Ich kenne Content Suchmaschine, die sich fuer Bilder oder CSS interessiert.
    Es geht hierbei NUR um den sichtbaren Content.
    Und das ist eben TEXT.
    Ist der Googlebot nicht auch für die Image Suche zuständig?

  10. #10
    Contao-Urgestein
    Registriert seit
    03.06.2010.
    Ort
    Wuppertal
    Beiträge
    2.149
    User beschenken
    Wunschliste

    Standard

    Ich denke es geht darum den Base Tag wegzulassen und überall mit absoluten URIs zu arbeiten.

    Ich habe das genannte Problem allerdings auf keiner Seite... Klar, kommt ab und zu mal ein 404 weil etwas weggenommen worden ist und dann nicht mehr vom Googlebot gefunden wird, ältere Dokumente es aber noch verlinken o.ä....

    Aber das von dir hier beschriebene Problem habe ich nicht.

  11. #11
    Contao-Fan Avatar von Babelfisch
    Registriert seit
    30.06.2009.
    Ort
    Leipzig
    Beiträge
    894

    Standard

    Worauf ich hinaus will? Ich wollte primär erst mal meine Erfahrungen schildern und fragen, ob andere mit den gleichen Problemen zu kämpfen haben. Interessant wäre hier insbesondere Nutzer, die Seiten mit vielen Inhalten und Zugriffen haben, da die Probleme mit zunehmenden Inhalten und Zugriffen auch immer deutlicher werden. Eine Seite von mir mit ca. 500 Besuchern pro Tag und ca. 100 Seiten ist noch im gelben Bereich, während das beschriebene Projekt > 3.000 Seiten und > 10.000 Besucher hat und damit auch deutlich mehr Fehler produziert werden.

    Ich habe auch nicht geschrieben, dass ich den BASE-Tag einfach so weglassen will. Das alleine wäre einfach und würde genau nichts bringen. Es geht darum, dass man evtl. mal überlegen sollte, in Contao gleich absolute URLs zu produzieren und damit das Problem generell zu vermeiden. Mit diesem Vorschlag brauche ich aber nicht bei Leo ankommen, wenn außer mir keiner ein Problem damit hat, deshalb meine Frage.

    Und natürlich sucht Google auch nach Bildern, schließlich hat er ja eine eigene Bildersuchmaschine.

    Gruß
    Geändert von Babelfisch (08.09.2013 um 08:50 Uhr)
    Meine aktiven Contao-Projekte: LingoliaStiftung firmm

  12. #12
    Contao-Nutzer Avatar von JBN
    Registriert seit
    03.07.2014.
    Ort
    Prieros bei Berlin
    Beiträge
    22

    Standard Base Tag macht Probleme mit FB und beim SEO

    Hallo zusammen,

    ich habe bei verschiedenen Seiten auch immer wieder das Problem mit den base Tag das diese z.B. auch von Facebook nicht berücksichtigt wird und FB dann versucht ein Bild der Seite zu laden um es als "Titel Bild" bei eine Like zu verwenden. Auch bei SEO wird immer wieder davon abgeraten den "Base Tag" zu verwenden.
    Ich hatte daher schon mal damit rumgespielt den Base Tag zu entfernen und über den Hook "generateFrontendUrl" alle URLs absolut zu setzen. Das hatte nur den dummen Nebeneffekt das die Sitemap und die Suche nicht mehr funktionierten.

    Hat jemand damit schon etwas mehr Erfahrung und oder kann mir einen Tip geben wie ich den Base Tag entfernen kann ohne das Contao dann dabei rum zickt?
    Derzeit setze ich meist noch die 3.2 LTS ein.

    Vielen Dank
    JBN

  13. #13
    Contao-Urgestein Avatar von Kahmoon
    Registriert seit
    22.06.2009.
    Ort
    München
    Beiträge
    5.291

    Standard

    Wenn es dir nur um Facebook etc. geht..warum setzt du nicht, die dafür vorgesehenen, og: metatags? Dann sucht sich FB auch nicht irgendein Bild sondern bekommt ein Vorgegebenes.


    Zum Topic
    Ich habe auch ab und zu solche URL Fehler und ich verwende kein Language in der URL. Google selbst hat hier aber noch keinen Fehler erzeugt....nur so Kandidaten wie xovibot und so Zeug.

  14. #14
    Contao-Urgestein
    Registriert seit
    03.06.2010.
    Ort
    Wuppertal
    Beiträge
    2.149
    User beschenken
    Wunschliste

    Standard

    Zitat Zitat von JBN Beitrag anzeigen
    Auch bei SEO wird immer wieder davon abgeraten den "Base Tag" zu verwenden.
    Gibt es dafür 'ne verlässliche Quelle?

    Und wenn Facebook im HTML rumwuselt, liegt das ja daran, dass für die Seite keine Open Graph Tags gesetzt sind.
    Grundsätzlich unterstützt aber auch der Facebook Crawler das base Tag.

    Beispiel:
    Code:
    http://www.contao-pool.de/
    In Contao umgesetzt, keine gesetzten Open Graph Tags, trotzdem ein Bild wenn man den Link bei Facebook einfügt.

  15. #15
    Contao-Nutzer Avatar von JBN
    Registriert seit
    03.07.2014.
    Ort
    Prieros bei Berlin
    Beiträge
    22

    Standard

    Zitat Zitat von Kahmoon Beitrag anzeigen
    Wenn es dir nur um Facebook etc. geht..warum setzt du nicht, die dafür vorgesehenen, og: metatags?
    Das habe ich ja auch bereits schon - soweit es geht - gemacht. Darum geht es mir auch nur in "zweiter" Linie.

    Zitat Zitat von Kahmoon Beitrag anzeigen
    Google selbst hat hier aber noch keinen Fehler erzeugt....nur so Kandidaten wie xovibot und so Zeug
    Zu dem "Zeug" gehört leider auch der Bingbot. Der hat mir bei einer Contao Installation über Monate hinweg die Syslog voll gemüllt...

    Zitat Zitat von Flex Beitrag anzeigen
    Gibt es dafür 'ne verlässliche Quelle?
    Eine 100% sichere Quelle gibt es für SEO Aussagen eigentlich nie - denn niemand weiss, was Google & Co. wirklich bewerten/gewichten. Aber ich habe immer wieder gelesen das "absolute" bzw. "Root-Relative" URLs von Vorteil sind und bevor ich mit Contao angefangen habe hatte ich alle meine Seiten so umgesetzt und bin sehr gut damit gefahren.

    Zitat Zitat von Flex Beitrag anzeigen
    In Contao umgesetzt, keine gesetzten Open Graph Tags, trotzdem ein Bild wenn man den Link bei Facebook einfügt.
    Es gibt ja auch nur Probleme wenn man mit Verzeichnisstrukturen arbeiten. Erst bei HTML-Seiten ab der zweiten Ebene gibt es Probleme mit Bild und CSS-Links.

  16. #16
    Community-Moderator
    Wandelndes Contao-Lexikon
    Avatar von Spooky
    Registriert seit
    12.04.2012.
    Ort
    Scotland
    Beiträge
    34.316
    Partner-ID
    10107

    Standard

    Zitat Zitat von JBN Beitrag anzeigen
    Zu dem "Zeug" gehört leider auch der Bingbot. Der hat mir bei einer Contao Installation über Monate hinweg die Syslog voll gemüllt...
    Wie sehen Beispiele dieser Meldung aus?


    Zitat Zitat von JBN Beitrag anzeigen
    Eine 100% sichere Quelle gibt es für SEO Aussagen eigentlich nie - denn niemand weiss, was Google & Co. wirklich bewerten/gewichten.
    Und weil viel Scharlatanerie betrieben wird.


    Zitat Zitat von JBN Beitrag anzeigen
    Es gibt ja auch nur Probleme wenn man mit Verzeichnisstrukturen arbeiten. Erst bei HTML-Seiten ab der zweiten Ebene gibt es Probleme mit Bild und CSS-Links.
    Das musst du genauer erklären. Hast du ein exaktes Beispiel?

  17. #17
    Contao-Nutzer Avatar von JBN
    Registriert seit
    03.07.2014.
    Ort
    Prieros bei Berlin
    Beiträge
    22

    Standard

    Zitat Zitat von Spooky Beitrag anzeigen
    Wie sehen Beispiele dieser Meldung aus?
    Es gibt die "No active page" Meldung für URLs die Kaskadiert die Hauptstruktur wiederholen, als z.B.

    Code:
    www.example.org/verzeichnis1/
    Parallel gibt es /verzeichnis2/ und /verzeichnis3/ in der Hauptebene. Aber der Bingbot wie auch andere Spider rufen dann URLs mit der Sturktur

    Code:
    www.example.org/verzeichnis1/verzeichnis2/
    auf. Oder ganz extrem - wenn auf der Error404 Seite eine Sitemap ist kommt es zu wirren Abrufen von:

    Code:
    www.example.org/verzeichnis1/verzeichnis3/verzeichnis1/verzeichnis2/
    Ich möchte öffentlich nicht die URL des Systems meines Kunden angeben und hoffe auf euer Verständnis.
    Bei dem Setup habe ich aus historischen Gründen reine Verzeichnisstrukturen gewählt, d.h. keine .html Extension sondern immer / am Ende.

    Und was die Bilder angeht so ist es dort eben das gleiche.
    Wenn das Bild unter /files/images/bild.gif liegt aber aus
    Code:
    www.example.org/verzeichnis1/
    heraus "relative" mit base tag verlinkt ist wird daraus eben
    Code:
    www.example.org/verzeichnis1/files/images/bild.gif
    - und das gibt es natürlich nicht.

  18. #18
    Contao-Urgestein Avatar von Kahmoon
    Registriert seit
    22.06.2009.
    Ort
    München
    Beiträge
    5.291

    Standard

    Zitat Zitat von JBN Beitrag anzeigen
    Es gibt die "No active page" Meldung für URLs die Kaskadiert die Hauptstruktur wiederholen, als z.B.

    Code:
    www.example.org/verzeichnis1/
    Parallel gibt es /verzeichnis2/ und /verzeichnis3/ in der Hauptebene. Aber der Bingbot wie auch andere Spider rufen dann URLs mit der Sturktur

    Code:
    www.example.org/verzeichnis1/verzeichnis2/
    Sowas habe ich leider auch manchmal...aber liegt das sicher am Basetag? Ich verwende übrigens .html am Ende. Das ändert nichts. Fehler taucht trotzdem auf.



    Edit:
    Gerade wieder von Xovibot

    Code:
    The  request for page ID "fotowall/image" contained unused GET parameters:  "blog"  (http://www.frankdaniels.de/fotowall/image/blog/peoplefotografie.html)
    Es gibt aber eigentlich nur /blog/alias.html oder /fotowall/image/alias.html. Und peoplefotografie.html liegt eigentlich unter root /peoplefotografie.html ;-)
    Geändert von Kahmoon (04.03.2015 um 10:11 Uhr)

  19. #19
    Contao-Nutzer Avatar von JBN
    Registriert seit
    03.07.2014.
    Ort
    Prieros bei Berlin
    Beiträge
    22

    Standard

    Zitat Zitat von Kahmoon Beitrag anzeigen
    Sowas habe ich leider auch manchmal...aber liegt das sicher am Basetag? Ich verwende übrigens .html am Ende. Das ändert nichts. Fehler taucht trotzdem auf.
    Ja. Genau daran liegt es. Wenn die URLs alle absolut wären oder zumindest alle mit einem / vom Wurzelverzeichnis her angegeben würden, würde dieses Problem nie auftreten. Daher versuche ich eben den Base Tag zu eliminieren und über den Hook das zu lösen - aber da stören sich eben andere Bestandteile von Contao dran. Leider.

  20. #20
    Community-Moderator
    Wandelndes Contao-Lexikon
    Avatar von Spooky
    Registriert seit
    12.04.2012.
    Ort
    Scotland
    Beiträge
    34.316
    Partner-ID
    10107

    Standard

    Zitat Zitat von JBN Beitrag anzeigen
    Ich möchte öffentlich nicht die URL des Systems meines Kunden angeben und hoffe auf euer Verständnis.
    Naja, nachdem die Seite bereits von Google, Facebook & Co. gecrawled wird, ist sie ja wahrscheinlich schon live, oder nicht? Aber wie auch immer, siehe PM

  21. #21
    Contao-Fan Avatar von elwega
    Registriert seit
    15.09.2009.
    Ort
    Black Forest
    Beiträge
    550

    Standard

    Hallo zusammen,
    ich habe mir schon zu dem Thema einen Wolf gesucht und hier: https://community.contao.org/de/show...823#post361823 zu meinem Problem was gepostet.
    Das könnte in die gleiche Richtung gehen.
    Wenn ich die 404 Seite als interne Weiterleitung auf die Startseite schalte ist das Ergebnis das gleiche.
    Diese Seite hat keine weiteren Sprachen nur de, trotzdem kommt der Fehler: No active page for page ID "fehler-404", host "www.domain.de" and languages "de, en-US, en"
    Wieso wird bei einem Fehler den die normale 404 Seite nicht ausgegeben?
    In der htaccess ist die 404 Seite ebenfalls eingetragen, dann dürfte doch auch die Browsersprache egal sein.
    Die Logeinträge füllen sich nach ein paar Tagen wieder mit 100ten Einträgen und die E-Mail mit Fragen warum da solche Einträge sind und in rot, gehn langsam an die Nerven.
    Mittels Script das Log intervallmäßig zu leeren kann ja keine Lösung sein.
    Beste Grüße
    Wenn der Reiter nichts taugt, ist das Pferd schuld.

  22. #22
    Alter Contao-Hase Avatar von Supermann
    Registriert seit
    17.02.2010.
    Ort
    Löhne
    Beiträge
    1.293

    Standard

    Zitat Zitat von andreasisaak Beitrag anzeigen
    Und welchen Vorteil hast du nun wenn du den Base Tag weglässt? Ich empfehle dir Domainlink für absolute URLs
    Hallo,
    ich stand auch schon vor dem gleichen Problem. Habe dann auch Domainlink benutzt, allerdings muss ich sagen das dann die Ansprechzeit der Seite bei mir gestiegen ist. Unser Webentwickler und ich haben dann festgestellt das die Erweiterung zwar sehr nützlich hierbei ist, aber das System ausbremmst.

    PS. Das ist jetz keine Kritik an den Entwickler, sondern meine persönliche Erfahrung mit der Erweiterung.

    Ich habe das ganze dann über die Subdomains gelöst, dann sind die Pfade absolut....

Aktive Benutzer

Aktive Benutzer

Aktive Benutzer in diesem Thema: 2 (Registrierte Benutzer: 0, Gäste: 2)

Lesezeichen

Lesezeichen

Berechtigungen

  • Neue Themen erstellen: Nein
  • Themen beantworten: Nein
  • Anhänge hochladen: Nein
  • Beiträge bearbeiten: Nein
  •