Comment explorer un grand site et extraire des données à l'aide de SEO Spider de Screaming Frog

Screaming Frog SEO Spider
Temps de lecture: 3 minutes

Nous assistons actuellement plusieurs clients avec Migrations Marketo. Comme les grandes entreprises utilisent des solutions d'entreprise comme celle-ci, c'est comme une toile d'araignée qui se tisse dans des processus et des plates-formes au fil des ans… jusqu'à ce que les entreprises ne soient même pas conscientes de chaque point de contact.

Avec une plateforme d'automatisation du marketing d'entreprise telle que Marketo, les formulaires sont le point d'entrée des données sur les sites et les pages de destination. Les entreprises ont souvent des milliers de pages et des centaines de formulaires sur leurs sites qui doivent être identifiés pour être mis à jour.

Un excellent outil pour cela est L'araignée SEO de Screaming Frog… Peut-être la plate-forme la plus populaire du marché pour l'exploration, l'audit et l'extraction de données d'un site. La plate-forme est riche en fonctionnalités et offre des centaines d'options pour pratiquement toutes les tâches dont vous avez besoin.

Screaming Frog SEO Spider: Exploration et extraction

Une caractéristique clé de Screaming Frog SEO Spider est que vous pouvez effectuer des extractions personnalisées basées sur Regex, XPathou CSSPath détails. Cela s'avère extrêmement utile car nous souhaitons explorer les sites du client et auditer et capturer les valeurs MunchkinID et FormId à partir des pages.

Avec l'outil, ouvrez Configuration> Personnalisé> Extraction pour identifier les éléments que vous souhaitez extraire.

extraction personnalisée screamingfrog

L'écran d'extraction permet une collecte de données pratiquement illimitée:

Règles d'extraction d'araignée de Screaming Frog SEO

Extraction de regex, XPath et CSSPath

Pour le MunchkinID, l'identifiant se trouve dans le script de formulaire qui se trouve dans la page:

<script type='text/javascript' id='marketo-fat-js-extra'>
    /* <![CDATA[ */
    var marketoFat = {
        "id": "123-ABC-456",
        "prepopulate": "",
        "ajaxurl": "https:\/\/yoursite.com\/wp-admin\/admin-ajax.php",
        "popout": {
            "enabled": false
        }
    };
    /* ]]> */

Nous appliquons ensuite un Règle Regex pour capturer l'ID à partir de la balise de script insérée dans la page:

Regex: ["']id["']: *["'](.*?)["']

Pour l'ID de formulaire, les données se trouvent dans une balise d'entrée dans le formulaire Marketo:

<input type="hidden" name="formid" class="mktoField mktoFieldDescriptor" value="1234">

Nous appliquons un Règle XPath pour capturer l'identifiant à partir du formulaire inséré dans la page. La requête XPath recherche un formulaire avec une entrée avec un nom de formidable, puis l'extraction enregistre le valeur:

XPath: //form/input[@name="formid"]/@value

Screaming Frog SEO Spider Rendu Javascript

Une autre excellente option de Screaming Frog est que vous n'êtes pas limité au HTML de la page, vous pouvez rendre tout JavaScript qui va insérer des formulaires dans votre site. Dans Configuration> Araignée, vous pouvez accéder à l'onglet Rendu et l'activer.

Screaming Frog SEO Spider Rendu Javascript

Cela prend un peu plus de temps pour explorer le site, bien sûr, mais vous obtiendrez des formulaires rendus côté client par JavaScript ainsi que des formulaires insérés côté serveur.

Bien qu'il s'agisse d'une application très spécifique, c'est une application incroyablement utile car vous travaillez avec de grands sites. Vous voudrez absolument vérifier où vos formulaires sont intégrés sur le site.

Télécharger Screaming Frog SEO Spider

Que pensez-vous?

Ce site utilise Akismet pour réduire les spams. Découvrez comment sont traitées les données de vos commentaires..