Formulaires de contact, robots et spam sans vergogne

Depositphotos 52422737 s

L'anti-spam est un énorme sujet avec les e-mails. Les gens essaient de garder leur boîte de réception propre depuis des années avec tout ce qui est ennuyeux spamarrest outils aux filtres de courrier indésirable simples avec leur capacité étrange pour les faux positifs. En fait, le spam par courrier électronique est devenu une telle nuisance que le gouvernement est même intervenu (imaginez-le) et a rédigé des lois à ce sujet. Mais il y a une forme de spam que les justiciers doivent encore attraper… et j'espère que vous m'aiderez.

Cela a commencé comme un simple ennui, mais cela s'est transformé en une interruption totale des activités. Chaque soumission de formulaire déclenche automatiquement un prospect dans mon CRM. Ce qui signifiait que depuis environ un an, j'ai eu beaucoup de prospects à vendre à des sociétés de référencement qui peuvent me mettre sur la page 1 de Google. J'ai donc décidé de créer un gestionnaire de formulaires de brassage maison qui commencerait à identifier et à éliminer ces méchants spammeurs SANS risque de faux positifs. Parce que, après tout, même si je déteste le spam, je déteste encore plus une occasion manquée.

Pour commencer, j'ai fait bouillir les types de spam que je pourrais éventuellement éliminer en deux catégories:

  1. Le vrai humain qui soumet des données erronées juste pour accéder à ce cookie derrière le formulaire… l'essai gratuit, le livre blanc gratuit, le marketing goutte à goutte contenu, etc.
  2. Les robots qui explorent le Web en soumettant des liens d'affiliation et des données erronées à n'importe quelle forme qu'ils peuvent trouver.

Aussi, dans le cadre de ce petit projet collaboratif (auquel vous pouvez adhérer en commentaire ici) permettez-moi d'ajouter le paramètre suivant: PAS DE CAPTCHA. Je ne peux pas lire les choses dang moi-même la moitié du temps et il y a des raisons de craindre que CAPTCHA lui-même réduise la conversion de plomb par la seule difficulté.

Donc, l'astuce consiste à créer une série de tests logiques contre lesquels on peut exécuter les données soumises par formulaire qui identifieront positivement le spam un pourcentage significatif du temps tout en ne bloquant presque jamais les prospects légitimes.

Voici où je suis:

  1. Insérez une entrée dans le formulaire, tapez = texte, mais style = "display: none;". Les bots injecteront naturellement une valeur dans n'importe quel champ de saisie de texte dans le but de contourner les vérificateurs de champ requis. Cependant, si ce champ particulier devait être soumis avec des données, nous pouvons savoir avec certitude qu'un humain ne l'a pas fait.
  2. Recherchez «asdf». Simple, je sais, mais un rapport de spam historique a montré qu'il s'agissait d'une forme plutôt populaire de fausses soumissions. Si la chaîne asdf apparaît dans un champ, c'est du spam.
  3. Vérifiez les caractères répétitifs. J'ai essayé et essayé, mais je ne pouvais pas penser à une raison légitime pour laquelle un personnage devrait se répéter plus de 3 fois dans un champ de nom, nom de société ou adresse. Si vous pouvez me convaincre du contraire, tant mieux. Pour l'instant, «XXXX Consulting Company» ne deviendra pas un lead pour moi.
  4. Vérifiez les chaînes identiques. À part le voisin de Tim Allen, Wilson Wilson, personne à ma connaissance n'a la même valeur de chaîne dans tous les champs d'un formulaire de contact. Si trop de champs sont identiques, c'est du spam.
  5. Enfin, et c'est la clé: vérifier les URL auxquelles elles n'appartiennent pas. L'un des cas les plus classiques de spam est de placer une URL dans un champ auquel elle n'appartient pas. En dehors de la zone de texte «message», une URL ne doit pas être utilisée pour son nom, son numéro de téléphone, le nom de l'entreprise ou autre. S'ils l'essaient, c'est du spam.

Ces 5 tests logiques ont réduit les soumissions de spam de bien plus de 70% au cours du mois dernier sur notre formulaire de contact gratuit produit. J'aimerais que ce chiffre soit encore plus élevé. Le plus grand nombre de soumissions de spam qui se faufilent encore sont des offres de référencement malhonnêtes. Alors, voici le prochain défi: pouvez-vous proposer une série de termes clés et de seuil de densité qui indiqueraient raisonnablement que le contenu de la soumission parle de référencement? Bien sûr, cela pourrait être une mauvaise idée pour les gars de SlingShot de mettre en œuvre sur leur site, mais pour le reste d'entre nous, cela conviendrait.

Les développeurs Web s'unissent: que faut-il tester d'autre?

5 Commentaires

  1. 1

    J'adore l'idée d'ajouter un champ avec affichage: aucun. C'est ingénieux! J'ai écrit un article il y a de nombreuses lunes sur la gravité de la technologie Captcha ... elle punit les innocents et ajoute une étape supplémentaire et inutile pour les utilisateurs. C'est l'antithèse de l'expérience utilisateur. Je peux mettre votre champ caché à l'épreuve!

  2. 2

    J'adore l'idée d'ajouter un champ avec affichage: aucun. C'est ingénieux! J'ai écrit un article il y a de nombreuses lunes sur la gravité de la technologie Captcha ... elle punit les innocents et ajoute une étape supplémentaire et inutile pour les utilisateurs. C'est l'antithèse de l'expérience utilisateur. Je peux mettre votre champ caché à l'épreuve!

  3. 3

    Cela fonctionne très bien, mais si vous le déployez sur des formulaires existants, cela peut prendre un certain temps pour que l'effet se propage. Les robots mettent souvent en cache votre formulaire et y postent comme ils l'ont vu il y a des semaines jusqu'à ce qu'ils reviennent et le voient à nouveau. Donc, tant qu'ils publient sur votre formulaire mis en cache, ils réussiront. Dans environ un mois, vous devriez commencer à voir des résultats.

  4. 4

    1. Une minuterie;
    2. Difficile de deviner les noms de champ de formulaire;
    3. validation du formulaire côté serveur;
    4. un champ de formulaire qui ne devrait pas avoir de valeur;
    5. avoir JavaScript mettre à jour un champ caché avec un formulaire de soumission;
    6. modifier les attributs du formulaire lors de l'envoi avec JavaScript;

    Le n ° 1 est mon préféré. Démarrez un minuteur dès que la page de contact (ou n'importe quelle page) est chargée. Du côté du serveur, définissez le temps requis pour remplir le formulaire. S'il est soumis trop tôt, l'utilisateur verra un message / compte désactivé / l'administrateur reçoit un e-mail / etc. Celui-ci élimine en fait 99.9% de tout type d'activité de bot.

    # 2 stockez les noms de champs dans une session et donnez aux champs des noms aléatoires. Rend l'apprentissage difficile pour un bot.

    # 3 celui-ci est important. Les e-mails peuvent être vérifiés très précisément avec des expressions régulières, un champ de numéro de téléphone est censé contenir 10 chiffres, 2 champs ou plus avec la même valeur = bot, etc.

    # 4 expliqué dans votre article, 5 et 6 quelques options de script.

  5. 5

    Merci pour le message, Nick. Appréciez le partage.

    Martin - Je pense que la minuterie est une excellente idée. Je suppose qu'un bot le ferait glisser et le seuil serait un peu bas… peut-être 5 secondes? Je suis simplement curieux à cause des formulaires pré-remplis pour les utilisateurs réels ainsi que pour les utilisateurs qui reviennent sur la page et savent immédiatement qu'ils veulent remplir le formulaire. juste mes deux centimes. Je sais que j'ai environ un an de retard sur ce post, donc je ne m'attends pas à beaucoup de réponse, je le mets juste dans l'espoir 🙂

    Merci encore!

    -Dave

Que pensez-vous?

Ce site utilise Akismet pour réduire les spams. Découvrez comment sont traitées les données de vos commentaires..