Ergebnis 1 bis 14 von 14

Thema: Google Indexierung, Webmaster Tools, Blockierte Resource

  1. #1
    Alter Contao-Hase
    Registriert seit
    04.02.2010.
    Beiträge
    1.366

    Standard Google Indexierung, Webmaster Tools, Blockierte Resource

    Guten Morgen, ich suche Hilfe zu den Google Webmaster Tools. Es finden sich ganz viele blockierte Resourcen in der Anzeige:

    Bildschirmfoto 2016-07-11 um 10.43.30.png

    Ich hab keine Ahnung, warum das so ist, aber anscheinend stört es die saubere Indexierung der Seite. Hier meine robots:
    User-agent: *

    Allow: /system/cron/
    Allow: /system/modules/
    Allow: /system/cron/cron.php

    Disallow: /check/
    Disallow: /contao/
    Disallow: /system/
    Disallow: /templates/
    Disallow: /vendor/
    Disallow: /share/index.php
    Disallow: /build.xml
    Disallow: /composer.json
    Disallow: /composer.lock
    Disallow: /README.md
    Disallow: /de/praxisbedarf-fuer-fachaerzte.html
    Disallow: /de/gynaekologen.html
    Disallow: /de/hautaerzte-plastische-chirurgen.html
    Disallow: /de/anti-aging-mediziner.html
    Disallow: /mirena.html

    Allow: /
    Hat jemand einen Tipp, warum das nicht funktioniert?

    Danke und Vg
    Michel

  2. #2
    Contao-Urgestein Avatar von Andreas
    Registriert seit
    19.06.2009.
    Ort
    Mönchengladbach
    Beiträge
    7.703
    User beschenken
    Wunschliste
    Contao-Projekt unterstützen

    Support Contao

    Standard

    Hier mal zum Vergleich die robots aus dem Core https://github.com/contao/core/blob/master/robots.txt

    Soll das hier "Allow: /" bewirken, dass alles erlaubt wird? Hast du das erst nach deinem Test eingefügt? Nicht alle Crawler interpretieren ein "Allow:". Und wieso erst ein paar Dissalows und am Ende ein Allow auf alle?

    Bei der frontend.css kannst du mal nachsehen, ob dort die richtige .htaccess in assets/ liegt.
    Bitte!
    Vor Anfragen im Forum HTML validieren.
    Codesnippets hier im Froum sauber einrücken. Nur Tabs o. nur Leerzeichen verwenden.

    Vielen Dank an alle Wunschlistenerfüller
    Andreas Burg, Web Solutions

  3. #3
    Alter Contao-Hase
    Registriert seit
    04.02.2010.
    Beiträge
    1.366

    Standard

    Hi,

    danke für deine Antwort.

    Soweit ich weiß (dachte), arbeitet die robots nach dem Prinzip, was zuerst steht, zählt. Deswegen sind erstmal paar Bereiche
    blockiert, die nicht gecrawled werden sollen und dann Fall-Back: alles andere erlauben.

    Der Eintrag 'Allow: /' ist von Anfang an drin, ich mach den mal raus und baue das original wieder rein, dann berichte ich wieder.

    htaccess ist drin:
    Code:
    <IfModule !mod_authz_core.c>
      Order allow,deny
      Allow from all
    </IfModule>
    <IfModule mod_authz_core.c>
      Require all granted
    </IfModule>
    VG
    Geändert von Lengen1971 (11.07.2016 um 11:06 Uhr)

  4. #4
    Contao-Urgestein Avatar von Andreas
    Registriert seit
    19.06.2009.
    Ort
    Mönchengladbach
    Beiträge
    7.703
    User beschenken
    Wunschliste
    Contao-Projekt unterstützen

    Support Contao

    Standard

    Zitat Zitat von Lengen1971 Beitrag anzeigen
    was zuerst steht, zählt. Deswegen sind erstmal paar Bereiche
    blockiert, die nicht gecrawled werden sollen und dann Fall-Back: alles andere erlauben.
    Da widersprichst du dir. Bei dir sind zuerst ein paar erlaubt. Und wenn das stimmen sollte, von oben nach unten (was ich auch annehme), dann müsste ja das letzte Allow (falls es denn funktioniert) alle Disallows wieder aushebeln.

    Die .htaccess ist die richtige.
    Bitte!
    Vor Anfragen im Forum HTML validieren.
    Codesnippets hier im Froum sauber einrücken. Nur Tabs o. nur Leerzeichen verwenden.

    Vielen Dank an alle Wunschlistenerfüller
    Andreas Burg, Web Solutions

  5. #5
    Alter Contao-Hase
    Registriert seit
    04.02.2010.
    Beiträge
    1.366

    Standard

    Ich dachte, sobald eine Zeile zutrifft, wird die Abarbeitung eigentlich beendet. Zumindest kann man das beim Google robots-Tester schön sehen.

    Der zeigt an, welche Zeile eine Resource blockiert bzw. zuläßt. Ich hab meine blockierten Resourcen damit getestet und
    die waren alle richtig... deswegen hab ich ja hier geschrieben.

    VG
    Michel

  6. #6
    Community-Moderator
    Wandelndes Contao-Lexikon
    Avatar von Spooky
    Registriert seit
    12.04.2012.
    Ort
    Scotland
    Beiträge
    34.114
    Partner-ID
    10107

    Standard

    Die default robots.txt von Contao 3.5.14 sieht eigentlich so aus
    Code:
    User-agent: *
    Disallow: /check/
    Disallow: /contao/
    Disallow: /system/
    Disallow: /templates/
    Disallow: /vendor/
    Disallow: /share/index.php
    Disallow: /build.xml
    Disallow: /composer.json
    Disallow: /composer.lock
    Disallow: /README.md
    Allow: /system/cron/cron.txt
    Allow: /system/modules/*/assets/
    Allow: /system/modules/*/html/
    https://github.com/contao/core/blob/3.5.14/robots.txt

  7. #7
    Alter Contao-Hase
    Registriert seit
    04.02.2010.
    Beiträge
    1.366

    Standard

    Hi,

    ja, ich hab die schon wieder rein, muss aber warten, bis mir Google wieder ein neues Ergebnis mitteilt. Im Moment steht noch ein altes Datum..

    Ich berichte...

    VG

  8. #8
    Alter Contao-Hase
    Registriert seit
    04.02.2010.
    Beiträge
    1.366

    Standard

    Moin,

    hat etwas gedauert, aber jetzt hab ich ne neue Ansicht vom 16.07. Leider hat sich nichts geändert, wieder soviele
    blockierte Resourcen:

    blockierte-resourcen.jpg

    Was ist denn da falsch??

    VG
    Michel

  9. #9
    Community-Moderator
    Wandelndes Contao-Lexikon
    Avatar von Spooky
    Registriert seit
    12.04.2012.
    Ort
    Scotland
    Beiträge
    34.114
    Partner-ID
    10107

    Standard

    Nichts, diese Ressourcen sollen ja blockiert sein.

  10. #10
    Alter Contao-Hase
    Registriert seit
    04.02.2010.
    Beiträge
    1.366

    Standard

    A so?

    Versteh isch ned... sind dann nicht die entsprechenden Seiten von der Indexierung ausgeschlossen?

    VG

  11. #11
    Community-Moderator
    Wandelndes Contao-Lexikon
    Avatar von Spooky
    Registriert seit
    12.04.2012.
    Ort
    Scotland
    Beiträge
    34.114
    Partner-ID
    10107

    Standard

    Das sind ja keine Seiten, sondern nur die cron.txt, cron.php und eine CSS Datei einer Extension.

  12. #12
    Alter Contao-Hase
    Registriert seit
    04.02.2010.
    Beiträge
    1.366

    Standard

    aber dahinter steht doch: betroffene Seiten: 23

  13. #13
    Community-Moderator
    Wandelndes Contao-Lexikon
    Avatar von Spooky
    Registriert seit
    12.04.2012.
    Ort
    Scotland
    Beiträge
    34.114
    Partner-ID
    10107

    Standard

    Ja, auf diesen Seiten hat Google versucht die jeweilige Ressource zu laden, aber es wurde durch die robots.txt unterbunden. Die Seiten selbst sind nicht blockiert.

  14. #14
    Alter Contao-Hase
    Registriert seit
    04.02.2010.
    Beiträge
    1.366

    Standard

    OK, verstanden.

Aktive Benutzer

Aktive Benutzer

Aktive Benutzer in diesem Thema: 1 (Registrierte Benutzer: 0, Gäste: 1)

Lesezeichen

Lesezeichen

Berechtigungen

  • Neue Themen erstellen: Nein
  • Themen beantworten: Nein
  • Anhänge hochladen: Nein
  • Beiträge bearbeiten: Nein
  •