Recherche sur le site Abondance :

Tout Abondance  Toute l'actu depuis 1998

18 juin 2008 


MadSpam : un projet de lutte contre le spamdexing

Le 18 juin 2008  
   

 
MadSpam est un projet de recherche auquel collaborent ANR, Orange (France Telecom RetD et Portail Orange), blogSpirit, KartOO et le Laboratoire d'informatique de Paris 6. Il a pour nom complet Méthodes Automatiques pour la Détection de SPAMdexing sur les Grands Réseaux d'Information.



voici comment il se présente sur son site :

La pollution par le spam des contenus sur les environnements ouverts comme le Web, les forums, les blogs, et tous les sites collaboratifs ouverts du Web, se déploie à très grande vitesse et attaque aujourd'hui tous les média du Web. Le succès du Web est directement lié à son ouverture, la contrepartie en est que toute source d'information ouverte peut être manipulée de façon malicieuse pour être détournée de son but initial. Le phénomène est déjà extrêmement important pour tous les acteurs de l'Internet et constitue une menace de premier ordre pour cette économie.


Le spam dans le cas du Web est aujourd'hui connu sous le nom de spamdexing. Dans le milieu des années 90, il a largement participé au déclin de nombreux moteurs de recherche alors que Google montait en puissance grâce à des algorithmes de référencement plus robustes au spamdexing. Google a rapidement été rattrapé par le phénomène. Tous les acteurs du Web2.0 sont directement menacés par la généralisation et la croissance des différents phénomènes de spam/spamdexing. La pollution du Web est devenue tellement importante que tous les moteurs de recherche commerciaux doivent aujourd'hui consacrer une partie importante de leurs ressources à la lutte antispam.




Bien au-delà des sites Web, le spam attaque aujourd'hui toutes les sources d'information ouvertes comme les blogs, les wiki, les forums, les sites collaboratifs, les réseaux sociaux et plus généralement tous les réseaux d'interaction basés sur le partage ou l'échange de contenu. Les enjeux économiques et sociaux sont devenus extrêmement importants pour les différents acteurs du Web et pour les utilisateurs: les moteurs de recherche, les blogs et tous les sites pollués meurent très rapidement.

Alors que le spam sur les e-mails (90% du trafic des e-mails) a fait l'objet de nombreuses mesures aussi bien techniques que légales, très peu a été fait pour toutes les formes de spamdexing adressées dans ce projet. Il n'y a pas aujourd'hui de parade pour ces formes récentes de spam et les entreprises qui commercialisent des environnements de développement pour les blogs, wiki, etc ainsi que les utilisateurs sont à la merci des spammeurs. Le phénomène de spam est très diversifié. Une caractéristique essentielle est qu'il s'adapte rapidement à toutes les parades et qu'il s'agit d'une bataille permanente entre spammeurs et acteurs du web. Il faut que les parades soient suffisamment génériques pour s'adapter elles même en permanence aux nouvelles sources de spam et pour pouvoir être déployées rapidement par les différents acteurs du Web. C'est l'objet du projet de développer des outils permettant de contrer le spamdexing sous ses différentes formes et de les déployer à grande échelle en situation réelle.



[...] Le projet vise à développer une bibliothèque d'outils génériques permettant de s'adapter aux différentes sources et manifestations du spam, non seulement dans les deux applications cibles du projet (moteurs de recherche, blogs et forums) mais aussi dans les applications proches comme les wiki et des domaines émergents comme les réseaux sociaux. Pour ces différentes applications, l'interactivité et l'adaptabilité seront privilégiés. D'autre part le projet permettra à travers des campagnes de test à large échelle de mieux caractériser et analyser ces phénomènes de spamdexing qui parce qu'ils sont plus récents que le spam sur les courriers électroniques n'ont pas fait l'objet d'études systématiques ni de tentatives de législation.


Le projet dispose également d'un blog et certaines de ses équipes ont participé au Challenge WebSpam 2008 dont les résultats ont été déovilés en avril dernier à Pékin. Une initiative en tout les cas intéressantes et don tl'impact sur la qualité des résultats de recherche sera à suivre dans le smois qui viennent...


 


 

0 Commentaires :

Rappelons ici que les liens insérés dans vos commentaires sont en 'rel=nofollow' et ne sont donc ni suivis ni interprétés par les moteurs de recherche...

 
<< Accueil
 

 

Quelques réflexions sur les moteurs de recherche et le référencement, infos sur le référencement à destination des webmasters, études, enquêtes sur les moteurs de recherche, etc.
 
feed xml
 
SEO 2011 : pour ne rien rater de l'actu SEO en 2011
 
Un guide (PDF) de 97 pages qui propose un résumé de ce qui a fait l'année 2011 en termes de SEO, pour être sûr de ne rien avoir raté ces 12 derniers mois au niveau du référencement naturel de votre site web.


Le livre "Réussir son référencement web, édition 2012" (Eyrolles, janvvier 2012) bientôt disponible !
Consultez le site Livre Référencement !

Recherche et Référencement
La lettre professionnelle mensuelle "Recherche et Référencement" pour tout savoir sur les moteurs de recherche. Indispensable pour votre veille !

Les Universités du Référencement
3 jours de formation pour explorer les territoires de la rédaction web, de l'optimisation de sites web pour les moteurs de recherche et du référencement naturel en général...
 
Pour tout savoir sur le DVD "SEO, Optimisez votre Référencement Web" (Elephorm, mars 2011), consultez le site de l'editeur Elephorm !


 
Lettre d'actualité
La lettre "Actu Moteurs" est hebdomadaire et gratuite. Abonnez-vous :

Rejoignez nos 70 000 abonnés (plus d'infos) depuis 1998 et recevez toute l'info sur les moteurs chaque semaine !

 
Les blogs d'Abondance
Abondance-Actu :
Toute l'actualité quotidienne des moteurs de recherche et du référencement.
Abondance-Info :
Quelques réflexions sur les moteurs de recherche et le référencement.
Abondance-Pro :
Le sommaire de la lettre professionnelle "Recherche et Référencement".
Abondance-Abonnés :
Le blog des abonnés payants.
 



 

 
 Recherche sur le site Abondance :

Tout Abondance
Toute l'actu depuis 1998

 

Messages précédents

 
Recherche et Référencement : le numéro de juin 200...
Etude > CNN.com meilleur moteur d'actualités devan...
Actu Moteurs : la 500ème !
Etude > Impact de la publicité graphique sur l'eff...
Comment illustrer un billet sur un blog sans être ...
Split A/B testing, la méthode de test de l'interfa...
Etude > Google Analytics installé sur 1/3 des 500 ...
Un après-midi à Roland-Garros
Etude > Le Search Engine Marketing en Grande-Breta...
Etude > La recherche documentaire chez les jeunes

 

Archives

 
septembre 2005
octobre 2005
novembre 2005
décembre 2005
janvier 2006
février 2006
mars 2006
avril 2006
mai 2006
juin 2006
juillet 2006
août 2006
septembre 2006
octobre 2006
novembre 2006
décembre 2006
janvier 2007
février 2007
mars 2007
avril 2007
mai 2007
juin 2007
juillet 2007
août 2007
septembre 2007
octobre 2007
novembre 2007
décembre 2007
janvier 2008
février 2008
mars 2008
avril 2008
mai 2008
juin 2008
juillet 2008
août 2008
septembre 2008
octobre 2008
novembre 2008
décembre 2008
janvier 2009
février 2009
mars 2009
avril 2009
mai 2009
juin 2009
juillet 2009
août 2009
septembre 2009
octobre 2009
novembre 2009
décembre 2009
janvier 2010
février 2010
mars 2010
avril 2010
mai 2010
juin 2010
juillet 2010
août 2010
septembre 2010
octobre 2010
novembre 2010
décembre 2010
janvier 2011
février 2011
mars 2011
avril 2011
mai 2011
juin 2011
juillet 2011
août 2011
septembre 2011
octobre 2011
novembre 2011
décembre 2011
janvier 2012
février 2012

Lettres d'actualité

 
Actu Moteurs : revue de presse hebdomadaire
Recherche & Référencement : lettre professionnelle mensuelle

L'actu des moteurs

 


Liens

 
Abondance.com
Réseau Abondance
Un site du Réseau Abondance (english version : Search Engine Tools) :
Information : Abondance - Forums Abondance - Boutique Abondance - Livre Référencement - Livre Google
Outils : Outiref - Visiref - Keyword Search Engine - Spider Simulator - Soumission-Manuelle - Flash Moteurs - Moklic
Divers / Jeux : Googlefight - Klevener - Googland - Grifil.com
Moteurs de recherche : Mozbot.fr - Motref - Grifil.net - Biomalin - Foot Engine - SearchWings