Seite 1 von 2 12 LetzteLetzte
Ergebnis 1 bis 40 von 52

Thema: [botdetection] Bot Erkennung

  1. #1
    Wandelndes Contao-Lexikon Avatar von BugBuster
    Registriert seit
    15.06.2009.
    Ort
    Berlin
    Beiträge
    10.513
    User beschenken
    Wunschliste

    HTML [botdetection] Bot Erkennung

    Hallo.

    Bot Detection dient als Hilfsklasse für andere Extensions (Frontend) die erkennen müssen, ob der Zugriff von Mensch oder Maschine erfolgt

    Eine sichere Erkennung gibt es dabei natürlich nicht.
    Es wird über 2 Verfahren versucht dieses zu erkennen:
    • User Agent Kennung
    • IP Adresse


    Erste Version beinhaltet eine Methode für die Agent (BD_CheckBotAgent) und eine für die IP Erkennung (BD_CheckBotIP).
    Ein Test ist beigefügt für den direkten Aufruf:
    Code:
    http://deine-domain.de/system/modules/botdetection/test/ModuleBotDetectionTest.php
    Damit wird auch gezeigt wie das Modul verwendbar wäre, für PHP Dateien die direkt aufrufbar sind wie z.B. cron.php oder banner_clicks.php vom Modul Banner.

    Desweiteren sind 2 Frontend Module als Demo für die Implementierung in eigene Module beigefügt.

    Mein Banner Modul habe ich bereits in meiner Testumgebung erfolgreich darauf angepasst, Visitors wird folgen. Läuft beides wird dieses dann auch entsprechend veröffentlicht.

    Zur Zeit geben die beiden Methoden True oder False zurück. (True = Bot)

    Ab Version 0.2.0 kam eine neue Methode (BD_CheckBotAgentAdvanced) dazu, die über eine externe Konfigurationsdatei die Erkennnug über User Agent durchführt und als Ergebnis den Kurznamen des Bots zurückgibt bzw. "false", wenn keine Erkennung erfolgte.

    Im ER ist das Modul hier zu finden.
    Wünsche, Fehlermeldungen, Korrekturen hier oder direkt ins Ticketsystem.
    Beschreibung im Wiki wird noch ergänzt.

    Testen tue ich das ganze übrigens mit dem Firefox Add-on "User Agent Switcher", cool so als Googlebot unterwegs zu sein
    Geändert von BugBuster (19.02.2011 um 20:52 Uhr) Grund: Text Anpassung Version 1.0.0
    Grüße, BugBuster
    "view source" is your guide.
    Danke an alle Amazon Wunschlisten Erfüller

  2. #2
    Wandelndes Contao-Lexikon Avatar von BugBuster
    Registriert seit
    15.06.2009.
    Ort
    Berlin
    Beiträge
    10.513
    User beschenken
    Wunschliste

    HTML

    Hi,
    zur Info, die Methode BD_CheckBot wird demnächst umbenannt in BD_CheckBotAgent, damit ist das dann einheitlicher zu BD_CheckBotIP.

    Die Liste mit den Strings der Bots in der feinen Suche wird demnächst ausgelagert in eine extra Konfigurationsdatei, da ich vorhabe diese zu genenrieren.

    Eigene Suchstrings kann man demnächst auch in der localconfig.php definieren wie die eigenen gefundenen IP Adressen. (siehe Hinweise in config/bot-ip-list.txt)
    Grüße, BugBuster
    "view source" is your guide.
    Danke an alle Amazon Wunschlisten Erfüller

  3. #3
    Wandelndes Contao-Lexikon Avatar von BugBuster
    Registriert seit
    15.06.2009.
    Ort
    Berlin
    Beiträge
    10.513
    User beschenken
    Wunschliste

    HTML [botdetection] Bot Erkennung , Version 0.2.0 beta1

    So, nun ist eine weitere Version im ER gelandet. (Links siehe ersten Beitrag)
    Wie angedroht, wurde die Methode BD_CheckBot umbenannt in BD_CheckBotAgent.

    Eine neue Methode BD_CheckBotAgentAdvanced kam hinzu, die über eine externe Konfigurationsdatei die Erkennung über User Agent durchführt und als Ergebnis den Kurznamen des Bots zurückgibt bzw. "false" wenn keiner Erkennung erfolgte.
    Derzeit sind 857 Kennungen registriert.

    Die ersten beiden Methoden, BD_CheckBotAgent und BD_CheckBotIP, geben im Vergleich dazu nur "true" oder "false" zurück.
    Grüße, BugBuster
    "view source" is your guide.
    Danke an alle Amazon Wunschlisten Erfüller

  4. #4
    Contao-Fan Avatar von deerwood
    Registriert seit
    24.11.2009.
    Ort
    Hamburg
    Beiträge
    344

    Standard

    Moin BugBuster,

    nur kurz, ich hatte leider noch keine Zeit, Deine neue Extension zu testen, aber sie wird mir jedenfalls sehr nützlich sein. Die Methode BD_CheckBotAgentAdvanced() hört sich sehr gut an, ich hatte vor einiger Zeit z.B. die Anforderung (in einem nicht TL Projekt), bestimmten (gutwiligen) Bots den Zugriff auf bestimmte Seiten/Dateien zu erlauben, anderen dagegen nicht.

    Danke für die Auslagerung.

    LG, Georg

  5. #5
    Wandelndes Contao-Lexikon Avatar von BugBuster
    Registriert seit
    15.06.2009.
    Ort
    Berlin
    Beiträge
    10.513
    User beschenken
    Wunschliste

    HTML Suche nach neuen Bots

    Da ich für die Advanced Suche mich auf eine Konfig von Dritten verlasse, wollte ich mal wissen ob auch alle Bots erkannt werden die bei mir so auflaufen.
    In meiner access.log habe ich, zumindest mir, unbekannte gefunden.

    Also habe ich mal ein Add-on zu meiner Bot Detection "geschrieben", welches mit alle Bots (User Agent) in eine Log schreibt die nicht durch die Advanced Methode erkannt werden.

    Da die Konfig nur Bot Signaturen enthält brauche ich einen Zugriff den nur Bots tun, nicht ein normaler Surfer.
    Da viel mir nur die robots.txt ein.

    Also schrieb ich in meine htaccess:
    Code:
    RewriteRule robots.txt myrobots.php
    Die PHP Datei muss nun einerseits den Inhalt der robots.txt ausgeben und weiterhin prüfen ob das ein unbekannter Bot war.
    Der Einfachheit halber gebe ich den Inhalt der robots.txt direkt aus und lese die nicht erst über Dateioperationen ein. Nicht ganz updatesicher, wenn Leo dran was ändert, aber für meinen Fall nicht tragisch.

    PHP-Code:
    <?php
    Header
    ('Content-type: text/plain');
    echo 
    "User-agent: *
    Disallow: /plugins/
    Disallow: /system/
    Disallow: /templates/
    Disallow: /typolight/
    Disallow: /CHANGELOG.txt
    Disallow: /cron.php
    Disallow: /flash.php
    Disallow: /GPL.txt
    Disallow: /INSTALL.txt
    Disallow: /LGPL.txt
    "
    ;

    //ab hier beginnt die Zukunft
    define('TL_MODE''FE');
    require(
    'system/initialize.php');

    class 
    ModuleBotDetectionGenerate extends ModuleBotDetection  
    {
            public function 
    run()
            {
                    
    $test01 $this->BD_CheckBotAgentAdvanced(); // Check for Bot
                    
    if ($test01 === false)
                    {
                            if (
    $this->Environment->httpUserAgent) { 
                                    
    $UserAgent trim($this->Environment->httpUserAgent); 
                            } else { 
                                    return 
    false// No return address, no search.
                            
    }       
                    }
                    if (
    $UserAgent)
                    {
                            
    log_message("ModuleBotDetectionGeneration: ".$UserAgent,"genuseragents.log");
                    }

            }
    }
    $objBotDetectionGen = new ModuleBotDetectionGenerate();
    $objBotDetectionGen->run();
    ?>
    Testen kann man das über Zugriff mit eigenem Browser, die User Agent Kennung landet dann in der Logdatei, da der Browser ja ein unbekannten Bot darstellt

    Mal sehen was so ankommt die Tage.
    Geändert von BugBuster (27.04.2010 um 15:14 Uhr)
    Grüße, BugBuster
    "view source" is your guide.
    Danke an alle Amazon Wunschlisten Erfüller

  6. #6
    Contao-Urgestein Avatar von do_while
    Registriert seit
    15.06.2009.
    Ort
    Berlin | Deutschland
    Beiträge
    3.613
    Partner-ID
    1081
    User beschenken
    Wunschliste
    Contao-Projekt unterstützen

    Support Contao

    Daumen hoch

    Hallo BugBuster,

    aus so eine Idee muss man erst mal kommen!

  7. #7
    Wandelndes Contao-Lexikon Avatar von BugBuster
    Registriert seit
    15.06.2009.
    Ort
    Berlin
    Beiträge
    10.513
    User beschenken
    Wunschliste

    Standard

    Im Kopf habe ich noch ne weitere, sowas habe ich mal vor den TL Zeiten gebastelt.
    In der robots.txt wird ein Disallow auf eine Datei eingetragen die nur für diesen Zweck angelegt wird und nirgends sonst verlinkt wird.
    Ruft nun ein bot diese Datei auf, hält er sich nicht an die Angaben und wird als "böse" eingestuft.

    Was man dann mit dieser Info tut, bleibt noch zu überlegen.
    Grüße, BugBuster
    "view source" is your guide.
    Danke an alle Amazon Wunschlisten Erfüller

  8. #8
    Contao-Urgestein Avatar von FloB
    Registriert seit
    19.06.2009.
    Ort
    Sonnensystem
    Beiträge
    1.618

    Standard

    Ein klassischer Honeypot – gibt's noch den versteckten "Guestbook-Link"?

    Aber Aufpassen, nicht immer ist ein Besucher einer robots.txt bzw. der darin aufgelisteten Dateien ein Bot, deswegen wäre ich mit generellen Sperren vorsichtig.
    So long,
    FloB since Nov. 2007 +706P +115P and counting

  9. #9
    Wandelndes Contao-Lexikon Avatar von BugBuster
    Registriert seit
    15.06.2009.
    Ort
    Berlin
    Beiträge
    10.513
    User beschenken
    Wunschliste

    Standard

    nee, schon klar. Darum gings mir auch nicht, eher um die Erfassung um dann später wie auch immer zu reagieren. Also mit biomechanischer Schnittstelle zwischendurch.
    Grüße, BugBuster
    "view source" is your guide.
    Danke an alle Amazon Wunschlisten Erfüller

  10. #10
    Wandelndes Contao-Lexikon Avatar von BugBuster
    Registriert seit
    15.06.2009.
    Ort
    Berlin
    Beiträge
    10.513
    User beschenken
    Wunschliste

    Standard Schon 2 gefunden...

    So,
    die Advanced findet folgende Bots momentan nicht (bei mir aufgetaucht):
    Code:
    TrueKnowledgeBot (http://www.trueknowledge.com/tkbot/; tkbot -AT- trueknowledge _dot_ com)
    Code:
    Mozilla/5.0 (compatible; ptd-crawler; +http://bixolabs.com/crawler/ptd/; crawler@bixolabs.com)
    Die schnell Variante findet diese, durch den Teilstring "bot" in beiden der Kennungen.

    Werd ich demnächst in die Liste mit aufnehmen.
    Grüße, BugBuster
    "view source" is your guide.
    Danke an alle Amazon Wunschlisten Erfüller

  11. #11
    Wandelndes Contao-Lexikon Avatar von BugBuster
    Registriert seit
    15.06.2009.
    Ort
    Berlin
    Beiträge
    10.513
    User beschenken
    Wunschliste

    Standard

    So, die Test Datei habe ich ein wenig gefärbt, nun erkenne ich besser welche Bots erkannt werden und welche nicht. Die roten sind hier wie gesagt die beiden die derzeit nicht erkannt werden von der Advanced Methode.

    Es gibt auch nur noch eine Stelle darin, wo die Agent Strings definiert werden.
    Einfach ne Zeile anhängen und schon wird es doppelt geprüft.

    ModuleBotDetectionTest.jpg

    Ich werde als zweite Demo ein Frontend Modul bauen mit einem Formular, darin kann man einen Agent String übergeben und prüfen lassen. Ist zwar mehr für mich gedacht, aber sicherlich auch sinnvoll für andere die selber in die access.log schauen und wissen wollen ob da was erkannt werden würde.

    Nachtrag: Beide Demos sind auch auf der Projekt Homepage zu finden.
    Geändert von BugBuster (15.05.2010 um 18:52 Uhr) Grund: Textänderung zweite Demo
    Grüße, BugBuster
    "view source" is your guide.
    Danke an alle Amazon Wunschlisten Erfüller

  12. #12
    Wandelndes Contao-Lexikon Avatar von BugBuster
    Registriert seit
    15.06.2009.
    Ort
    Berlin
    Beiträge
    10.513
    User beschenken
    Wunschliste

    Standard [botdetection] Bot Erkennung , Version 1.0.0 stable

    So, nachdem ich eine Weile damit gearbeitet habe, hab ich das nun in den Status 1.0.0 stable gehoben.
    Da mein "Fang Script" noch einige Bots gefunden hat, die durch den Drittanbieter nicht erkannt wurden, habe ich diese selbst noch hinzugefügt:
    • TrueKnowledgeBot
    • ptd-crawler bixolabs.com
    • Spock Crawler
    • NetStudyBot
    • BotOnParade
    • Taptubot
    Grüße, BugBuster
    "view source" is your guide.
    Danke an alle Amazon Wunschlisten Erfüller

  13. #13
    Wandelndes Contao-Lexikon Avatar von BugBuster
    Registriert seit
    15.06.2009.
    Ort
    Berlin
    Beiträge
    10.513
    User beschenken
    Wunschliste

    Standard

    Hab ich doch die Sprachfiles vergessen zu aktualisieren.
    Daher neues Build generiert.
    Grüße, BugBuster
    "view source" is your guide.
    Danke an alle Amazon Wunschlisten Erfüller

  14. #14
    Contao-Urgestein Avatar von FloB
    Registriert seit
    19.06.2009.
    Ort
    Sonnensystem
    Beiträge
    1.618

    Standard

    Ist es deswegen notwendig hier nochmal zu posten?
    So long,
    FloB since Nov. 2007 +706P +115P and counting

  15. #15
    Wandelndes Contao-Lexikon Avatar von BugBuster
    Registriert seit
    15.06.2009.
    Ort
    Berlin
    Beiträge
    10.513
    User beschenken
    Wunschliste

    Standard

    a) Ja, um PMs zu entgehen warum ein neues Build so kurz später nach der neuen Version von mir erzeugt wurde.
    b) Hab ich was verpasst?
    Grüße, BugBuster
    "view source" is your guide.
    Danke an alle Amazon Wunschlisten Erfüller

  16. #16
    Contao-Urgestein Avatar von FloB
    Registriert seit
    19.06.2009.
    Ort
    Sonnensystem
    Beiträge
    1.618

    Standard

    Ich seh nur pushing hättest deinen vorherigen Post auch bearbeiten können, anstatt einen neuen zu schreiben.

    PMs kann man ignorieren, außerdem bezweifel ich, dass da so viele kommen … sonst müssten ja im Forum ein unermessbares Datenvolumen 'rumschwirren, bei den vielen "Build-Updates".
    So long,
    FloB since Nov. 2007 +706P +115P and counting

  17. #17
    Wandelndes Contao-Lexikon Avatar von BugBuster
    Registriert seit
    15.06.2009.
    Ort
    Berlin
    Beiträge
    10.513
    User beschenken
    Wunschliste

    Fehler neue Bots gefunden

    Zur Info, die Advanced Variante (BD_CheckBotAgentAdvanced) findet folgende Bots momentan (1.0.0 Build 9) nicht (bei mir aufgetaucht):
    Code:
    nodestackbot/0.1 (bot@nodestack.com http://nodestack.com/bot.html)
    Mozilla/4.0 (compatible; MSIE 5.5; Windows NT 4.0; obot)
    Die schnell Variante (BD_CheckBotAgent) findet diese, durch den Teilstring "bot" in beiden der Kennungen.

    Werd ich demnächst in die Liste mit aufnehmen.

    Noch 3:
    Code:
    Mozilla/5.0 (compatible; Search17Bot/1.1; http://www.search17.com/bot.php)
    yacybot (amd64 Linux 2.6.31.12-0.2-desktop; java 1.6.0_0; Europe/de) http://yacy.net/bot.html
    Cityreview Robot (+http://www.cityreview.org/crawler/)
    Geändert von BugBuster (26.05.2010 um 00:06 Uhr)
    Grüße, BugBuster
    "view source" is your guide.
    Danke an alle Amazon Wunschlisten Erfüller

  18. #18
    Wandelndes Contao-Lexikon Avatar von BugBuster
    Registriert seit
    15.06.2009.
    Ort
    Berlin
    Beiträge
    10.513
    User beschenken
    Wunschliste

    Standard [botdetection] Bot Erkennung , Version 1.0.1 stable

    Im Update sind nur neue Bots in der Erkennnung aufgenommen worden:
    • nodestackbot
    • obot
    • yacybot
    • Search17Bot
    • Cityreview Robot
    Grüße, BugBuster
    "view source" is your guide.
    Danke an alle Amazon Wunschlisten Erfüller

  19. #19
    Wandelndes Contao-Lexikon Avatar von BugBuster
    Registriert seit
    15.06.2009.
    Ort
    Berlin
    Beiträge
    10.513
    User beschenken
    Wunschliste

    Standard [botdetection] Bot Erkennung, Version 1.0.4 stable

    Mittlerweile sind wieder einige neue dazugekommen seit 1.0.1:

    • (bot; http://) , in BD_CheckBotAgentAdvanced: "No-Name-Bot"
    • S2Bot
    • Rassler
    • Caret Byte
    • O'Reilly Link Checker
    • Semager
    • CligooRobot
    • gonzo / suchen.de
    • LexxeBot
    • Java/1.6
    • SemtoBot
    • Ruky-Roboter
    • SheenBot
    • Google-Site-Verification
    • Microsoft URL Control (Harvester!)
    Grüße, BugBuster
    "view source" is your guide.
    Danke an alle Amazon Wunschlisten Erfüller

  20. #20
    Wandelndes Contao-Lexikon Avatar von BugBuster
    Registriert seit
    15.06.2009.
    Ort
    Berlin
    Beiträge
    10.513
    User beschenken
    Wunschliste

    Standard [botdetection] Bot Erkennung, Version 1.0.6 stable

    Mittlerweile sind wieder einige neue dazugekommen seit 1.0.4:

    • AppEngine-Google
    • mxbot
    • StatoolsBot
    • BixoLabs Crawler
    • Huaweisymantecspider
    • TwengaBot
    Grüße, BugBuster
    "view source" is your guide.
    Danke an alle Amazon Wunschlisten Erfüller

  21. #21
    Wandelndes Contao-Lexikon Avatar von BugBuster
    Registriert seit
    15.06.2009.
    Ort
    Berlin
    Beiträge
    10.513
    User beschenken
    Wunschliste

    Standard [botdetection] Bot Erkennung, Version 1.1.1 stable

    Mittlerweile sind wieder einige neue dazugekommen seit 1.1.0:
    • Hoge
    • Tagoobot
    • Bingbot
    • Peew Crawler
    • FindShare
    Grüße, BugBuster
    "view source" is your guide.
    Danke an alle Amazon Wunschlisten Erfüller

  22. #22
    Wandelndes Contao-Lexikon Avatar von BugBuster
    Registriert seit
    15.06.2009.
    Ort
    Berlin
    Beiträge
    10.513
    User beschenken
    Wunschliste

    Standard [botdetection] Bot Erkennung, Version 1.2.0 stable

    Neue Bots in Version 1.2.0:
    • picmole
    • SiteBot
    • Yasaklibot
    • Dropcatcher


    Außerdem wurde eine aktuelle browscap.ini für die Basis der Bot Datenbank verwendet.
    Grüße, BugBuster
    "view source" is your guide.
    Danke an alle Amazon Wunschlisten Erfüller

  23. #23
    Wandelndes Contao-Lexikon Avatar von BugBuster
    Registriert seit
    15.06.2009.
    Ort
    Berlin
    Beiträge
    10.513
    User beschenken
    Wunschliste

    Standard [botdetection] Bot Erkennung, Version 1.2.1 stable

    Neue Bots in Version 1.2.1:
    • adressendeutschland.de
    • DoCoM
    • CMS Crawler
    • GetWeb
    • NetSpider
    • Rippers
    • HTTrack
    • NetAnts
    • Website eXtractor
    • WebWhacker
    Grüße, BugBuster
    "view source" is your guide.
    Danke an alle Amazon Wunschlisten Erfüller

  24. #24
    Contao-Urgestein Avatar von Kahmoon
    Registriert seit
    22.06.2009.
    Ort
    München
    Beiträge
    5.280

    Standard

    Servus,

    seit kurzem spamt (mehrere hundert Meldungen pro Minute) es mein Log mit folgender Meldung voll

    BotDetection extension required!

    Unter Info steht das:

    Details: BotDetection extension required!
    Funktion: ModulBanner BannerCheckBot
    IP Adresse: 66.249.66.149
    Browser: Mozilla/5.0 (compatible; Googlebot/2.1; +http://www.google.com/bot.html)

    Hab die Erweiterung aber schon mehrfach neu installiert . Modul Banner ist die Version 2.0.0 stable 20

    Gruß
    Geändert von Kahmoon (16.01.2011 um 18:05 Uhr)

  25. #25
    Contao-Urgestein Avatar von do_while
    Registriert seit
    15.06.2009.
    Ort
    Berlin | Deutschland
    Beiträge
    3.613
    Partner-ID
    1081
    User beschenken
    Wunschliste
    Contao-Projekt unterstützen

    Support Contao

    Standard

    Hallo Kahmoon,

    die Banner-Erweiterung braucht seit einigen Releases die Botdetection-Erweiterung. Die Abhängigkeit ist beim Modul eingetragen und für neue Installationen wird die Botdetection gleich mit aufgespielt.
    Leider ist das bei Updates nicht so, nachträgliche Abhängigkeiten werden von der Erweiterungsverwaltung bisher nicht beachtet. Ich habe dazu bereits ein Ticket angelegt:
    http://dev.contao.org/issues/2793

  26. #26
    Contao-Urgestein Avatar von Kahmoon
    Registriert seit
    22.06.2009.
    Ort
    München
    Beiträge
    5.280

    Standard

    Alles klar. Aktueller Workaround? Beide Module sind ja installiert.

    Gruß

  27. #27
    Contao-Urgestein Avatar von do_while
    Registriert seit
    15.06.2009.
    Ort
    Berlin | Deutschland
    Beiträge
    3.613
    Partner-ID
    1081
    User beschenken
    Wunschliste
    Contao-Projekt unterstützen

    Support Contao

    Standard

    Oh, da bin ich ratlos. Da kann vielleicht BugBuster helfen.
    BugBuster erreicht man oft im IRC Chat
    http://de.contaowiki.org/Chat_HowTo

  28. #28
    Wandelndes Contao-Lexikon Avatar von BugBuster
    Registriert seit
    15.06.2009.
    Ort
    Berlin
    Beiträge
    10.513
    User beschenken
    Wunschliste

    Standard

    Wenn Botdetection installiert ist,sollte diese Meldung aber nicht kommen!
    Ist das Modul eventuell deaktiviert?
    Grüße, BugBuster
    "view source" is your guide.
    Danke an alle Amazon Wunschlisten Erfüller

  29. #29
    Contao-Urgestein Avatar von Kahmoon
    Registriert seit
    22.06.2009.
    Ort
    München
    Beiträge
    5.280

    Standard

    Ich hab jetzt beide Module frisch installiert. Seit dem kam es nicht mehr. Musste nur alle Banner neu einrichten

  30. #30
    Wandelndes Contao-Lexikon Avatar von BugBuster
    Registriert seit
    15.06.2009.
    Ort
    Berlin
    Beiträge
    10.513
    User beschenken
    Wunschliste

    Standard

    Hmm, vielleicht hätte ja eine Reparatur Installation schon gereicht.
    Na wenigstens es läuft wieder, ich hoffe es ware nicht zu viele Banner.
    Geändert von BugBuster (17.01.2011 um 21:10 Uhr)
    Grüße, BugBuster
    "view source" is your guide.
    Danke an alle Amazon Wunschlisten Erfüller

  31. #31
    Contao-Urgestein Avatar von Kahmoon
    Registriert seit
    22.06.2009.
    Ort
    München
    Beiträge
    5.280

    Standard

    Ich hab davor beide "repariert". Das hatte nichts geholfen.

  32. #32
    Wandelndes Contao-Lexikon Avatar von BugBuster
    Registriert seit
    15.06.2009.
    Ort
    Berlin
    Beiträge
    10.513
    User beschenken
    Wunschliste

    Standard

    Das macht die Sache noch seltsamer.
    Grüße, BugBuster
    "view source" is your guide.
    Danke an alle Amazon Wunschlisten Erfüller

  33. #33
    Wandelndes Contao-Lexikon Avatar von BugBuster
    Registriert seit
    15.06.2009.
    Ort
    Berlin
    Beiträge
    10.513
    User beschenken
    Wunschliste

    Standard [botdetection] Bot Erkennung, Version 1.2.2 stable

    Neue Bots in Version 1.2.2:
    • Purebot
    • Spinn3r
    • suggybot
    • Ezooms
    Grüße, BugBuster
    "view source" is your guide.
    Danke an alle Amazon Wunschlisten Erfüller

  34. #34
    Administrator Avatar von xchs
    Registriert seit
    19.06.2009.
    Beiträge
    14.557
    User beschenken
    Wunschliste
    Contao-Projekt unterstützen

    Support Contao

    Standard

    Hallo BugBuster,

    wäre es eigentlich auch möglich, über die Erweiterung "botdetection" die - je nach eingestellter Browsersprache - automatische Auslieferung der jeweils passenden Seitenstruktur durch Contao entsprechend zu beeinflussen?

    Oder anders ausgedrückt: Könnte man für verschiedene Suchmaschinen-Bots/Crawler eine bevorzugt auszuliefernde Seitenstruktur (einer bestimmten Sprache) festlegen?

    Wenn das ginge, dann könnte man ja auch die in diesem Thema angesprochene Problematik etwas entschärfen oder?

    Dann nämlich könnte man u.a. folgendes Anwendungsszenario realisieren:
    • Contao-Installation mit drei Seitenstrukturen für die Sprachen "Deutsch", "Englisch" und "Französisch"
    • Seitenstruktur "Deutsch" als Sprachen-Fallback
    • Deutsche Seitenstruktur soll auch bevorzugt den Suchmaschinen-Bots ausgeliefert werden

    Das beabsichtigte Verhalten sollte demnach sein:
    • Besucher mit "deutschem" Browser: Seitenstruktur [de]
    • Besucher mit "englischem" Browser: Seitenstruktur [en]
    • Besucher mit "französischem" Browser: Seitenstruktur [fr]
    • Besucher mit "russischem" Browser: Seitenstruktur [de]
    • GoogleBot als "englischsprachiger" Crawler: Seitenstruktur [de]

    Wäre sowas grundsätzlich im Zusammenhang mit der Hilfsklasse "botdetection" über eine eigene Erweiterung zu implementieren?
    Contao Community Administrator

    [Unterstützungsmöglichkeiten]

  35. #35
    Wandelndes Contao-Lexikon Avatar von BugBuster
    Registriert seit
    15.06.2009.
    Ort
    Berlin
    Beiträge
    10.513
    User beschenken
    Wunschliste

    Standard

    Ja, so eine Idee hatte ich auch schon im Kopf.
    Bin nur noch nicht dazu gekommen eine geeignete Methode zu finden, um die Browsersprache zu überstimmen bzw. zu schauen ob das überhaupt möglich ist.

    Muss ich mich mal ransetzen.
    Aber das wäre dann, wie richtig angedeutet ein eigenes Modul, welches am besten per hook sich irgendwie einklinkt. Mal sehen was ich so finde.

    Nachtrag: ich glaub ich habe das was gefunden, mal sehen wie ich am Wochende Zeit finde, um das mal zu testen.
    Geändert von BugBuster (09.02.2011 um 21:43 Uhr)
    Grüße, BugBuster
    "view source" is your guide.
    Danke an alle Amazon Wunschlisten Erfüller

  36. #36
    Administrator Avatar von xchs
    Registriert seit
    19.06.2009.
    Beiträge
    14.557
    User beschenken
    Wunschliste
    Contao-Projekt unterstützen

    Support Contao

    Standard

    In der Praxis müsste man wahrscheinlich eh nur die drei Suchbots von Google, Bing und Yahoo entsprechend berücksichtigen, zumal all die anderen ohnehin keine reale Bedeutung haben.

    Von daher wäre es dann auch egal, wenn bei diesen "bedeutungslosen" Suchbots - so wie bisher auch - die Seitenstruktur mit den englischen Seiten ausgeliefert wird...
    Contao Community Administrator

    [Unterstützungsmöglichkeiten]

  37. #37
    Wandelndes Contao-Lexikon Avatar von BugBuster
    Registriert seit
    15.06.2009.
    Ort
    Berlin
    Beiträge
    10.513
    User beschenken
    Wunschliste

    Standard Replace Language

    Habe mal angefangen.
    http://www.contao-forge.org/projects/replacelanguage

    Die Backend Definition und das Einklinken scheinen schon zu funktionieren, die Botdetection Einbindung muss ich noch machen.
    Grüße, BugBuster
    "view source" is your guide.
    Danke an alle Amazon Wunschlisten Erfüller

  38. #38
    Administrator Avatar von xchs
    Registriert seit
    19.06.2009.
    Beiträge
    14.557
    User beschenken
    Wunschliste
    Contao-Projekt unterstützen

    Support Contao

    Standard

    Zitat Zitat von BugBuster Beitrag anzeigen
    Habe mal angefangen.
    http://www.contao-forge.org/projects/replacelanguage

    Die Backend Definition und das Einklinken scheinen schon zu funktionieren, die Botdetection Einbindung muss ich noch machen.
    Wenn ich das im Wiki richtig sehe, dann hast Du "Replace Language" im Backend-Modul "Einstellungen" vorgesehen. Wäre es nicht günstiger, diese Einstellung im "Startpunkt einer Webseite" zu implementieren? So könnte man nämlich für Multidomain-Installationen jeweils unterschiedliche Vorgaben hinsichtlich der Sprachersetzung für Suchmaschinen festlegen.
    Contao Community Administrator

    [Unterstützungsmöglichkeiten]

  39. #39
    Wandelndes Contao-Lexikon Avatar von BugBuster
    Registriert seit
    15.06.2009.
    Ort
    Berlin
    Beiträge
    10.513
    User beschenken
    Wunschliste

    Standard

    Wie warscheinlich ist das, dass jemand eine Mutlidomain-Multilanguage Installation fährt und verschiedene Zielsprachen benötigt?
    Das würde die Sache wesendlich verkomplizieren.
    Grüße, BugBuster
    "view source" is your guide.
    Danke an alle Amazon Wunschlisten Erfüller

  40. #40
    Administrator Avatar von xchs
    Registriert seit
    19.06.2009.
    Beiträge
    14.557
    User beschenken
    Wunschliste
    Contao-Projekt unterstützen

    Support Contao

    Standard

    Mir ist das auch nur in den Sinn gekommen, da eine solche Multidomain-Umgebung mit jeweils verschiedenen Sprachen erst gestern/vorgestern hier diskutiert wurde.

    Aber Du hast sicherlich recht: Das würde in der Umsetzung wahrscheinlich ungemein komplexer werden.
    Geändert von xchs (13.02.2011 um 21:34 Uhr)
    Contao Community Administrator

    [Unterstützungsmöglichkeiten]

Aktive Benutzer

Aktive Benutzer

Aktive Benutzer in diesem Thema: 2 (Registrierte Benutzer: 0, Gäste: 2)

Lesezeichen

Lesezeichen

Berechtigungen

  • Neue Themen erstellen: Nein
  • Themen beantworten: Nein
  • Anhänge hochladen: Nein
  • Beiträge bearbeiten: Nein
  •