CTRL-ALT-CANC

Per chi ci capisce...
Messaggio del 26-05-2010 alle ore 20:05:36
Cerco di essere breve e preciso, spereme

In un forum che permette la visualizzazione di alcune sezioni solo agli utenti registrati, spesso e volentieri è possibile accedere ai contenuti protetti senza registrazione, usando l'estensione di firefox USER AGENT SWITCHER settata su GoogleBot...

volevo sapere se è possibile evitare questo, in qualche modo, su un forum phpbb...

(ovviamente senza perdere l'indicizzazione di google...)

Grazie in anticipo
Messaggio del 27-05-2010 alle ore 00:41:00
Ma tutto sto casino per vederti un paio di pornazzi?
Messaggio del 27-05-2010 alle ore 06:03:49
ess lu prime cujone

un primo input me l'hanno dato, devo pazziare con il robot.txt.... mo mi manca il "come"
Messaggio del 27-05-2010 alle ore 07:02:50
mi sa ca nin si po fa, pena: no indicizzazione....
Messaggio del 27-05-2010 alle ore 09:51:03
Dovresti controllare se google implementa un sistema di autenticazione sicuro, piuttosto che autenticarlo rispetto all' oggetto "navigator" della richiesta html. Infatti se non sbaglio USER AGENT SWITCHER non fa altro che settare un attributo di quell'oggetto.

Ma nella fattispecie non conosco per niente phpbb (e poco php in generale )
Messaggio del 27-05-2010 alle ore 11:36:18
In pratica tu vorresti che in un'area protetta entra il Bot ma non l'utente che si camuffa da Bot tramite questa estensione?

O vuoi che il Bot indicizzi solo le aree Pubbliche del sito?
Messaggio del 27-05-2010 alle ore 13:01:27
la prima che hai detto
Messaggio del 27-05-2010 alle ore 18:31:31
Per verificare se è realmente un bot di google o no occorre fare un reverse lookup sull'IP e poi controllare l'ip per vedere se è veramente google

adesso sto andando a farmi una bella birra fresca, ma per capire, ti posto un piccolissimo scriptino php di esempio che riconosce se sei un bot anche se ho considerato solo il BOT Google e Yahoo

ecco una LISTA DI CRAWLER e in bocca al lupo.

Messaggio del 27-05-2010 alle ore 18:32:07
ASPITT CHE SAMPEI BLOCCA I TAG PHP

$uagent = $_SERVER['HTTP_USER_AGENT'];

$ip = $_SERVER['REMOTE_ADDR'];

$host = gethostbyaddr( $ip );

$verip = gethostbyname( $host );

echo "IL TUO USER AGENT E': ".$uagent;

echo "IL TUO IP E': ".$ip;

echo "IL TUO HOST E': ".$host;

echo "IL TUO IP CORRISPONDENTE ALL'HOST E': ".$verip ;

if ( $ip = $verip ) {
if ( substr($host, -14) == '.googlebot.com') {
echo "BELLA GOOGLE";
} elseif ( substr( $bothost, -18) == '.inktomisearch.com') {
echo "BELLA YAHOO";
} else {
echo "NON SEI UN BOT";
}
} else {
echo "ERRORE NEL REVERSE LOOKUP";
}
Messaggio del 27-05-2010 alle ore 19:00:38
Ci manca il check sullo user agent... cosí impedisce di far funzionare la pagina a chiunque
qualcosa di simile... (non sono sicuro di qual'è la stringa per google bot)

if ( substr($host, -14) == '.googlebot.com' && $uagent == 'googlebot' ) {

Quell "ERRORE NEL REVERSE LOOKUP" implica IP spoofing... quindi faresti bene a mettere l'IP in una black list temporanea.

Ancora più sicuro sarebbe usare un ssl firmato da google per tutti i casi uagent = 'googlebot'.
Messaggio del 27-05-2010 alle ore 19:38:47
oh pe mo grazie delle dritte a tutt e ddu, se avete altri link o suggerimenti, non mi offendo

Messaggio del 27-05-2010 alle ore 20:33:59
Certo Gipsy... questo a tutti dice che non è google infatti volevo solo postare un piccolo esempio di una pagina che anche se attivi il plugin ti dice che non sei google... in pratiuca quella paginetta php che ho fatto ti dice che non sei google anche se attivi il plugin.

insomma un piccolo spunto su cui lavorare...

ci sarebbero anche altri metodi probabilmente più performanti tipo mettere delle regole sul file httpd.conf di apache (se usa apache)

Nuova reply all'argomento:

Per chi ci capisce...

Login




Registrati
Mi so scurdate la password
 
Hai problemi ad effettuare il login?
segui le istruzioni qui

© 2024 Lanciano.it network (Beta - Privacy & Cookies)