Sémantique
- Sémantique
Analyser les title d'une requête avec R
Le langage R a le vent en poupe dans la communauté SEO depuis quelques mois, voire quelques années. Après avoir lu les très bons articles de Vincent Terrasi et de Grégory Florin sur le sujet, je me suis lancé il y a peu dans l'apprentissage de ce langage.
- Sémantique
Clustering de mots-clés : un exemple avec Gephi
La notion de clusterisation est à nouveau abordée sur le blog, mais sous un autre angle. J'ai en effet décidé d'explorer les fonctionnalités de Gephi pour générer la cartographie d'un univers sémantique. L'objectif est de visualiser à la fois l'intérêt d'un mot-clé (volume de recherche) et la façon dont il est connecté aux autres mots-clés (similarité sémantique)
- Sémantique
Clustering de mots-clés : un exemple avec K-means & Ruby
Le machine learning étant un des nouveaux sujets SEO du moment, j'ai récemment commencé à approfondir le sujet et à mettre les mains dans le cambouis, dans le cadre d'une problématique bien précise : la catégorisation de mots-clés.
- Sémantique
Les pièges à éviter lors de l'analyse sémantique
Le 4 février dernier avait lieu à l'Espace Inkermann une nouvelle édition du SEO Campus Lille. Au programme : un peu de R, de webspam ou encore d'Adwords mais aussi et surtout des échanges très intéressants avec les participants. Pour ma part, j'ai eu le plaisir d'y intervenir pour une conférence sur les pièges à éviter lors de l'analyse sémantique.
- Sémantique
Calcul de similarité avec Ruby
Les solutions logicielles ou saas permettant de détecter le contenu dupliqué sur un site web sont, soit un peu trop opaques, soit un peu trop onéreuses à mon goût. Je vous présente donc ici un script rudimentaire, permettant à la fois, de crawler un site web en aspirant son contenu page à page, et de calculer la similarité de chacune des pages entre elles, en utilisant le tf-idf et le cosinus de Salton.
- Sémantique
Recherches associées Google : décryptage et méthode de scrape
Depuis quelques temps, le blog de Bill Slawski est entré dans mes favoris. En décryptant les différents brevets publiés par Google, cet auteur très réputé aux Etats Unis permet aux référenceurs de mieux comprendre comment fonctionne Google et surtout de découvrir quelles méthodes de traitement automatiquement du langage sont à l'oeuvre du côté de Mountain View. Ses billets sur les recherches associées ou related queries ont particulièrement attiré mon attention. Ce sera donc l'objet de cet article, avec, en bonus, un petit script maison pour scraper les recherches associées avec CasperJS (voir l'article de 512Banque pour une présentation sous l'angle SEO).
- Sémantique
Mots-clés de contenu Google Webmaster Tools : sur quel contenu porte l'analyse ?
Si vous possédez un compte Webmaster Tools et que vous y avez inscrit vos sites, vous avez peut être déjà remarqué l'onglet 'Mots-clés de contenu' dans la section 'Index Google'. La documentation officielle précise qu'il s'agit là d'un échantillon des mots-clés les plus représentatifs trouvés par Google lors de l'exploration du site. Mais savez-vous comment Google s'y prend pour calculer le nombre d'occurences ? Je vous donne ici ma vision des faits. Il ne s'agit que d'une interprétation personnelle, je ne prétends pas vous donner une vérité, d'ailleurs vous le verrez, j'arrive difficilement à une conclusion solide