Ergebnis 1 bis 11 von 11

Thema: Numerische ID UND Alias als URL jeder Seite erreichbar

  1. #1
    Contao-Nutzer Avatar von ray
    Registriert seit
    10.07.2009.
    Ort
    Düsseldorf
    Beiträge
    61

    Standard Numerische ID UND Alias als URL jeder Seite erreichbar

    Hallo zusammen,

    mir ist gerade (erst) aufgefallen, dass man jede Seite einer Contao-Website auch als numerische ID erreichen kann (123.html) - neben dem normalen Alias (beispiel.html).

    Google findet das aber gar nicht so witzig und zeigt mir jeweils beide Seiten als 'Doppelte "title"-Tags' an und ich denke somit auch als Duplicate Content, oder?
    Würde Contao die ID per 301 an den Alias weiterleiten, wäre das alles ja halb so schlimm.

    Was für eine Idee steckt dahinter und lässt es sich irgendwie vermeiden/abschalten?

    Ich finde es seltsam, dass ich nichts dazu gefunden hab, deswegen vermute ich mal, dass ich nicht nach den richtigen Begriffen gesucht hab.

    Danke schonmal für eure Antworten.

    Gruß, Daniel

  2. #2
    Contao-Nutzer Avatar von ray
    Registriert seit
    10.07.2009.
    Ort
    Düsseldorf
    Beiträge
    61

    Standard

    Wenn ich doch jetzt nur dieses nicht-antworten richtig interpretieren könnte.
    Heißt es "Die Frage is so dumm, den Typ lass ich im Regen stehen"
    oder "Ouh, da hab ich echt keine Ahnung"
    oder mögt ihr einfach mein Avatarbild nicht?

  3. #3
    Contao-Urgestein
    Registriert seit
    03.06.2010.
    Ort
    Wuppertal
    Beiträge
    2.149
    User beschenken
    Wunschliste

    Standard

    Ich wollte dir eigentlich schon vorher antworten aber irgendwie war es mir entfleucht.

    Das Problem des Erreichens über beide Adressen ist bekannt, noch "schlimmer" ist es sogar mit der Startseite die theoretisch unter 3 URLs erreichbar ist, ID, Alias und die "leere" Domain. Wenn du dann noch "/articles/[article-name].html" benutzt, wird es langsam "eng"

    Mich stört es auch, aber es gab hier bereits einige Grundsatzdiskussionen darüber und da kam man nie auf einen grünen Zweig...

  4. #4
    Contao-Nutzer Avatar von ray
    Registriert seit
    10.07.2009.
    Ort
    Düsseldorf
    Beiträge
    61

    Standard

    Danke für die Antwort, Flex!

    Das bedeutet also, dass es so gewollt und nicht abschaltbar ist. Wie ekelhaft.

    Demnach muss ich entweder die schon von Google indizierten Seiten permanent auf den Alias weiterleiten oder aus Google entfernen, da sie ja sowieso zwei mal drin sind.
    Ich denke zweiteres macht mehr Sinn, oder?

  5. #5
    Wandelndes Contao-Lexikon Avatar von BugBuster
    Registriert seit
    15.06.2009.
    Ort
    Berlin
    Beiträge
    10.522
    User beschenken
    Wunschliste

    Standard

    Da stellt sich die Frage wie Google auf die IDs gekommen ist?
    Ist bei mir noch nie aufgetreten solch ein Fall.
    Grüße, BugBuster
    "view source" is your guide.
    Danke an alle Amazon Wunschlisten Erfüller

  6. #6
    Contao-Nutzer Avatar von ray
    Registriert seit
    10.07.2009.
    Ort
    Düsseldorf
    Beiträge
    61

    Standard

    Hi BugBuster,

    da kann ich nur vermuten, weil es bei mir auch das erste Mal ist.
    Die Website besteht schon einige Jahre und wurde mit Version 1.6.x erstellt - außerdem war es eine meiner ersten mit TYPOlight.
    Also entweder wurden damals die Aliase automatisch nach der ID vergeben oder ich hab einfach Mist gebaut und hab das Verwenden der Seitenaliase eine Zeit lang deaktiviert gehabt.

  7. #7
    Contao-Nutzer Avatar von mae
    Registriert seit
    20.07.2011.
    Beiträge
    99

    Standard

    ich sehe das nicht als bug an, sondern als feature !


    das hat mir bei einigen problemen mit adblock (ajax-reload) sehr geholfen - bitte als feature im backend aktivierbar/deaktivierbar machen !

  8. #8
    Contao-Nutzer Avatar von mae
    Registriert seit
    20.07.2011.
    Beiträge
    99

    Standard

    Anwendungsbeispiel (fe_page <head>):

    HTML-Code:
    <link rel="canonical" href="<?php echo $this->base; ?>{{env::page_alias}}<?php echo $GLOBALS['TL_CONFIG']['urlSuffix']; ?>" />
    <link rel="shortlink" href="<?php echo $this->base; ?>{{env::page_id}}<?php echo $GLOBALS['TL_CONFIG']['urlSuffix']; ?>" />
    Referenz: http://microformats.org/wiki/existin...ype_extensions
    Geändert von mae (31.07.2011 um 14:13 Uhr)

  9. #9
    Contao-Nutzer Avatar von ray
    Registriert seit
    10.07.2009.
    Ort
    Düsseldorf
    Beiträge
    61

    Standard

    Zitat Zitat von mae Beitrag anzeigen
    bitte als feature im backend aktivierbar/deaktivierbar machen !
    Dem stimme ich zu! Dann hätte ich auch nichts mehr dagegen.

  10. #10
    Contao-Nutzer Avatar von ray
    Registriert seit
    10.07.2009.
    Ort
    Düsseldorf
    Beiträge
    61

    Standard

    Zitat Zitat von mae Beitrag anzeigen
    Anwendungsbeispiel (fe_page <head>):

    HTML-Code:
    <link rel="canonical" href="<?php echo $this->base; ?>{{env::page_alias}}<?php echo $GLOBALS['TL_CONFIG']['urlSuffix']; ?>" />
    <link rel="shortlink" href="<?php echo $this->base; ?>{{env::page_id}}<?php echo $GLOBALS['TL_CONFIG']['urlSuffix']; ?>" />
    Referenz: http://microformats.org/wiki/existin...ype_extensions
    HTML5, verstehe. Ist das nicht die Lösung? Wird Google dadurch nicht gezeigt, dass beide Links auf eine Seite verweisen?
    Ich hätte jetzt die von Google indizierten IDs per htaccess permanent weiter geleitet, aber das sind echt viele und ich bezweifle, das es gut ist, die htacces Datei voll zu ballern.

  11. #11
    Contao-Nutzer Avatar von mae
    Registriert seit
    20.07.2011.
    Beiträge
    99

    Standard

    Zitat Zitat von ray Beitrag anzeigen
    Wird Google dadurch nicht gezeigt, dass beide Links auf eine Seite verweisen?
    Richtig - die unter "HTML 5 link type ext." aufgeführte tag's sind zwar noch nicht offiziell vom W3C bestätigt, werden aber bereits vom Google Bot gecrawlt.

    # Weitere Informationen: http://code.google.com/p/shortlink/


    Tipps:


    - [1.] Auf jeden Fall die "shortlink"-tags setzen, wenn Du aktive Probleme mit Duplicate Content in den Google Search Results hast.

    - [2.] Zur Trickkiste greifen: z.B. bei Seitenaufruf via numerischer ID bzw "shortlink"-tag, automatisch "noindex,nofollow" im <head> setzen

    - [3.] In den Google Webmaster Tools die eingetragene sitemap.xml entfernen und einige Stunden später wieder einfügen - so erzwingst Du eine neuen Index-Generierung




    > Werde heute oder morgen dazu ein entsprechendes Snippet anfertigen, weil ich das auch gut gebrauchen könnte



    Zitat Zitat von ray Beitrag anzeigen
    Ich hätte jetzt die von Google indizierten IDs per htaccess permanent weiter geleitet, aber das sind echt viele und ich bezweifle, das es gut ist, die htacces Datei voll zu ballern.
    Eine .htaccess dient als Schnittstelle zur direkten Kommunikaton mit einem httpd daemon (z.B. apache) - das Modul "mod_rewrite" ist ja nichts Anderes, als ein extrem leistungsfähiger Proxy, der jegliche requests (get,post etc) intern an ein Script (php,ruby,python) weitergibt: also fast schon Lichtgeschwindigkeit bei entsprechender Hardware, wobei mod_rewrite stets Ressourcen frisst.

    Wie oben geschrieben, arbeite ich momentan noch an einer einfachen und ressourcenschonenden Lösung, da dies ja nur dazu dient, mit GoogleBot zu kommunizieren.
    Geändert von mae (11.08.2011 um 14:41 Uhr)

Aktive Benutzer

Aktive Benutzer

Aktive Benutzer in diesem Thema: 1 (Registrierte Benutzer: 0, Gäste: 1)

Lesezeichen

Lesezeichen

Berechtigungen

  • Neue Themen erstellen: Nein
  • Themen beantworten: Nein
  • Anhänge hochladen: Nein
  • Beiträge bearbeiten: Nein
  •