17 Novembre 2009 2 commentaires

Robots.txt techniques de SEO

http://markbeljaars.com/wp-content/plugins/sociofluid/images/digg_48.png http://markbeljaars.com/wp-content/plugins/sociofluid/images/reddit_48.png http://markbeljaars.com/wp-content/plugins/sociofluid/images/stumbleupon_48.png http://markbeljaars.com/wp-content/plugins/sociofluid/images/delicious_48.png http://markbeljaars.com/wp-content/plugins/sociofluid/images/furl_48.png http://markbeljaars.com/wp-content/plugins/sociofluid/images/technorati_48.png http://markbeljaars.com/wp-content/plugins/sociofluid/images/facebook_48.png http://markbeljaars.com/wp-content/plugins/sociofluid/images/yahoobuzz_48.png http://markbeljaars.com/wp-content/plugins/sociofluid/images/mixx_48.png http://markbeljaars.com/wp-content/plugins/sociofluid/images/twitter_48.png

Ce post est une longue, mais importante. Je vous recommande de prendre une tasse de chocolat chaud avant de vous lancer :)

Si vous n'avez pas entendu parler du fichier robots.txt, il est tout simplement un petit fichier situé dans votre répertoire racine du site qui indique les moteurs de recherche sur ce qu'ils peuvent et ne peuvent pas faire. Bien que n'étant pas strictement appliquées, les bots des moteurs de recherche seront généralement respecter les règles fixées en avant dans le fichier robots.txt. Avec un fichier robots.txt est correctement configuré, vous pouvez, par exemple, tentent de repousser les robots collecteurs de mails, indiquer à Google de ne pas indexer vos images ou d'instruire les robots collecteurs de sauter des pages qui pourraient contenir un contenu en double.

Les bots sont des morceaux de logiciel utilisé par les moteurs de recherche, les spammeurs et les accumulateurs de contenu pour analyser l'Internet pour trouver le contenu nouveau ou modifié. Le travail d'un bot est de suivre les liens sur un site web rampant de page en page et site à site. C'est un peu comme un Six Degrees of Kevin Bacon chose. Suivre les liens assez et vous devriez finir par trouver tout le contenu sur le net. C'est pourquoi backlinks sont si importantes. Les backlinks plus vous avez, plus il est facile pour les moteurs de recherche pour trouver votre contenu. Il ya littéralement des millions de cas bot chalutage sur le net à un moment donné. Le terme officiel pour un bot est un user-agent dont il existe des milliers. Prenons Google par exemple. Google a de nombreux différents utilisateurs agents utilisés pour indexer votre site, extraire des images et des vidéos, de trouver des fils de nouvelles, de trouver le contenu du téléphone mobile, vérifiez votre site pour la qualité Adsense et ainsi de suite. Ce site de plus de détails la liste complète des agents utilisateurs connus.

Le fichier robots.txt a été autour depuis des siècles. Il était en fait introduit par AltaVista en 1994, mais reste aujourd'hui un aliment de base pour araignées. Pour une description complète du fichier et sa notation standard, visitez le site ici . En bref, un fichier robots.txt peut restreindre les robots collecteurs spécifiques de ramper votre site entier ou en partie. Pour ce faire, tous les robots ont une signature particulière. Par exemple, l'index de Google bot est appelé Googlebot, robot de Bing est appelé MSNbot, et bot de Yahoo est appelé Yahoo! Slurp.

Une entrée dans le fichier robots.txt peut ressembler à ceci:

User-Agent: Yahoo! Slurp
Allow: /public*/
Disallow: /*_print*.html

Ici, nous disons à l'agent utilisateur Slurp qu'il puisse accéder à toutes les pages situées dans n'importe quel répertoire commençant par «public», et n'ont pas accès à des pages contenant "_print" dans l'URI.

Ci-dessous un fichier robots.txt complet pour un de mes sites WordPress expérimental (je posterai un article expliquant ce que je veux dire par site expérimental un autre jour). Les lecteurs astucieux peut noter que je suis interdisant tous les agents utilisateurs à partir de répertoires spécifiques, et seulement permettre à certains agents utilisateurs spécifiques d'accès aux zones restantes de mon site. Une mise à jour récente de la norme me permet aussi à la liste de l'emplacement de ma carte de site pour aider les moteurs de recherche trouver toutes mes pages.

User-agent: *
Disallow: /cgi-bin
Disallow: /wp-admin
Disallow: /wp-includes
Disallow: /wp-content
Disallow: /search/*/feed
Disallow: /search/*/*

User-agent: Mediapartners-Google
Allow: /

User-agent: Adsbot-Google
Allow: /

User-agent: Googlebot-Image
Allow: /

User-agent: Googlebot-Mobile
Allow: /

User-agent: Mediapartners-Google
Allow: /

User-agent: Adsbot-Google
Allow: /

User-agent: Googlebot-Image
Allow: /

User-agent: Googlebot-Mobile
Allow: /

Sitemap: http://beginnerchess.org/sitemap.xml

Interdire les robots collecteurs d'accéder au contenu non destiné à la consommation va s'assurer que votre site restera mot clé optimisé sur toutes les pages, contribuant ainsi à promouvoir votre site dans les moteurs de recherche. Disons par exemple que vous avez travaillé dur à l'optimisation de toutes les pages pour le «gain de poids» des mots clés et les queues de diverses longtemps. Votre travail peut être filtrée par les yeux des moteurs de recherche si elle a pu explorer votre page de connexion, la page vie privée et le formulaire de contact.

Certains experts SEO prétendent également que Google punit sites de jeunes en faveur des anciens sites plus établis. Google utilise apparemment l'Internet Archive (qui se trouve ici ) afin de déterminer l'âge d'un site. Si elle ne peut pas trouver le site dans les archives, il assume apparemment le site est un certain âge. Pour cette raison, beaucoup de gens activement arrêter l'Internet Archive user-agent de l'indexation de leur site. Ceci peut être fait en incluant les lignes suivantes:

User-agent: ia_archiver-web.archive.org
Disallow: /

Vous pouvez également arrêter les robots collecteurs de l'image d'accéder à vos photos si elles ont emprunté non-banque d'images provenant d'autres sites. Cela peut être fait comme ceci:

User-agent: Googlebot-Image
Allow: /

Enfin, robots.txt peut être utilisé pour exclure les robots collecteurs de pages spécifiques qui peuvent être utilisées pour afficher du contenu qui peut être disponible sur d'autres sites ou pages. Il est souvent avancé que Google va punir votre notes pour afficher le contenu en double. Personnellement, je ne vois pas cela comme un gros problème et nous croyons que le duplicate content peut effectivement aider à cote de votre site dans certains cas (plus à ce sujet un autre jour). Quoi qu'il en soit, pour arrêter un bot d'accéder à une page spécifique, ajoutez les lignes suivantes:

User-agent: *
Disallow: */my-duplicate-page.html

Notez que ce n'est pas une méthode infaillible. Si votre page a refusé a des liens avec elle depuis un autre site, il faudra encore être exploré par les bots.

Je pourrais continuer, mais je suis sûr que vous êtes tous s'ennuient maintenant. N'hésitez pas à commenter ci-dessous ou contactez-moi directement si vous souhaitez en savoir plus.

Roboting heureux.

13 Novembre 2009 8 commentaires

10 Site Web Minute Moteur de recherche optimisé

http://markbeljaars.com/wp-content/plugins/sociofluid/images/digg_48.png http://markbeljaars.com/wp-content/plugins/sociofluid/images/reddit_48.png http://markbeljaars.com/wp-content/plugins/sociofluid/images/stumbleupon_48.png http://markbeljaars.com/wp-content/plugins/sociofluid/images/delicious_48.png http://markbeljaars.com/wp-content/plugins/sociofluid/images/furl_48.png http://markbeljaars.com/wp-content/plugins/sociofluid/images/technorati_48.png http://markbeljaars.com/wp-content/plugins/sociofluid/images/facebook_48.png http://markbeljaars.com/wp-content/plugins/sociofluid/images/yahoobuzz_48.png http://markbeljaars.com/wp-content/plugins/sociofluid/images/mixx_48.png http://markbeljaars.com/wp-content/plugins/sociofluid/images/twitter_48.png

Le guide suivant est un programme complet, étape par étape la procédure de configuration d'un SEO (Search Engine Optimization) site convivial à partir d'une installation par défaut de WordPress. J'ai supposé que vous avez déjà installé WordPress et ont connecté au tableau de bord d'administrateur. J'ai également supposé que vous savez comment installer et configurer de nouveaux plugins. Sinon, voir ici .

Toutes les instructions ont été écrites pour WordPress 2.8.6, mais devrait fonctionner aussi bien pour la plupart des versions. Avant de commencer, vous devez déjà avoir étudié votre phrase-clé cible, écrit un mot-clé 300 + mot optimisé article et choisi un nom de domaine qui comprend votre phrase clé. Voici un article sur la recherche de mots clés pour vous lancer.

  1. Développer le menu Apparence et sélectionnez Ajouter de nouveaux thèmes. Parcourir tous les thèmes disponibles et choisi un qui représente le mieux votre phrase-clé. Le thème que vous avez choisie doit avoir un ensemble minimum de caractéristiques qui le jugent référencement optimisé. Ils comprennent:

    • Un menu de navigation qui s'affiche sur toutes les pages. Cela garantit que si le robot de recherche trébuche sur un de vos pages, il ya un chemin à toutes les autres pages pour cela de suivre.
    • Un titre et une description du texte du titre qui apparaît sur le dessus de toutes les pages. Le titre doit être enfermé dans les balises H1. Les moteurs de recherche ne peuvent pas utiliser la reconnaissance optique de caractères pour récupérer le nom de votre blog, afin d'assurer qu'il est écrit dans le texte.
    • Une barre latérale gauche. Des études montrent que les gens cliquent sur les annonces qui sont affichées sur la gauche plus souvent que les ajoute sur la droite.
  2. Modifier les paramètres par défaut de WordPress:

    • Développez Paramètres et sélectionnez Général. Réglez le titre du blog à votre phrase-clé. Réglez le Slogan d'une queue longue mot clé ou une phrase qui comprend un ou plusieurs mots clés. Assurer que l'adresse e-mail est rempli po
    • Développez Paramètres et sélectionnez Permaliens. Définissez les Paramètres communs à la structure de commande et dans le champ de saisie, tapez "/% postname% /" (sans les guillemets). Cela donnera à votre page d'après le même nom que le titre de votre post. Comme le titre de votre message doit être optimisé mot-clé, ce sera aussi l'URL de votre POSR.
  3. Installez et activez l' Akismet plugin. Suivez les instructions indiquées dans la page Configuration Akismet pour acquérir une clé API WordPress.com. Akismet automatiquement supprimer les commentaires spam. La dernière chose que vous voulez sont des commentaires de mails réduire la densité de vos mots clés.
  4. Installez et activez le WP-it plugin. WP-it vous permettra de coller votre message clé optimisé pour le haut de votre page d'accueil.
  5. Installez et activez le lien brisé Checker plugin. Il a été débattu que Google fera baisser votre autorité, si votre site contient de nombreux liens brisés. Il est logique que les sites avec des liens brisés sont généralement périmés ou sont de faible qualité. Utilisez ce plugin pour vérifier périodiquement les liens brisés dans n'importe quelle page ou par la poste.
  6. Installez et activez le Formulaire de contact plugin. Suivez les instructions pour créer une page de contact. Les gens ne sera pas l'achat de biens confortable à partir de votre site si il n'existe aucun moyen de vous contacter si quelque chose devait mal se passer.
  7. Installez et activez l' Confidentialité Facile Politique plugin. Suivez les instructions pour créer une page politique de confidentialité. Notez que si vous avez l'intention d'afficher des annonces Google, votre site doit inclure une politique de confidentialité accessibles pour répondre aux exigences lunettes.
  8. Installez et activez le SEO Aucun duplicata plugin. Google récompense les liens pour contenu dupliqué sur le site avec le meilleur classement page. Beaucoup de débats que Google a également sanctionner les sites Web qui ont beaucoup de pages avec le même contenu. Ce plugin va simplement tous les points contenus dupliqués sur votre site vers un seul permalien.
  9. Installez et activez le Social Bookmarks plugin. Si vos messages sont vaut le partage, vous devriez encourager vos lecteurs à mettre en signet social. Cela aidera à générer du trafic vers votre site.
  10. Installez et activez l' Table des matières Creator plugin. Suivez les instructions pour créer une page plan du site. Ce plugin va aider les robots des moteurs de recherche en exposant toutes les pages dans une seule liste.
  11. Installez et activez l' ultime Google Analytics plugin. Suivez les instructions pour acquérir une identité de compte Google Analytics. Cela est bénéfique car vous serez en mesure de suivre le nombre d'utilisateurs qui visitent le site yout.
  12. Installez et activez le Google XML Sitemaps plugin. Suivez les instructions pour obtenir un ID d'application Yahoo. Les moteurs de recherche utilisent des cartes de site pour déterminer combien de fois vos pages changer.
  13. Installez et activez le All in One SEO Pack de plugin. Prenez votre temps lors du remplissage dans les options du plugin. Assurez-vous que:

    • Le titre Home est votre mot clé.
    • Le Home Description est le mot clé optimisé et conçu pour attirer l'attention de tout soi-visiteur. Cette description est affichée sous cotation de votre site dans plusieurs moteurs de recherche.
    • Les Mots d'accueil devrait inclure votre phrase-clé, les mots clés individuels et des queues de mots clés de long.
    • Appliquer des comptes webmaster à Google , Yahoo et Bing . Ajoutez votre site à chaque compte et de copier toutes les balises trois méta autorisation dans les en-têtes poste supplémentaire, en-têtes supplémentaires et complémentaires têtes Accueil trouvés dans la page des options Pack de référencement.
  14. Créer un nouveau message et le coller dans votre article optimisé mot clé. Vérifiez que le nom de votre poste est la phrase clé. Création d'étiquettes de poste et les catégories également correspondant à vos mots clés et mots clés. Remplissez les options pack référencement au bas de la page, faire en sorte que le titre est votre phrase-clé, la description est le mot clé optimisé et les Mots-clés comprennent votre phrase clé et tous les mots-clés. Régler le statut post it à Sticky.
  15. Utilisez l'un des nombreux outils de recherche de soumission de moteur (comme cela un) pour soumettre votre site à tous les principaux moteurs de recherche.

C'est tout. Vous avez maintenant un site Web page 4. Le premier site a probablement pris plus de temps que 10 minutes, mais les sites consécutifs sera plus rapide que vous aurez déjà l'API Akismet clés, Yahoo ID d'application, et les comptes webmaster. Notez que vous pourriez avoir à attendre n'importe où jusqu'à un mois avant que votre site est d'abord indexé. Pour accélérer le processus, social bookmark votre site à Clipmarks, Stumble Upon, reddit, digg, etc. En utilisant cette technique, votre site doit être indexé en aussi peu que 2 semaines. Ne pas s'emballer cependant. Si vous créez 100 de signets avant que votre site est indexé, Google obtiendra suspectes et j'ai vu les gens doivent attendre trois mois ou plus avant que leur site apparaît.

Aussi tenir à distance sur l'ajout de Google AdSense jusqu'à 2 semaines après votre site est indexé. Certains soutiennent que l'ajout adsense trop tôt se dégrade note de votre site.

Il ya aussi quelques autres plugins que vous devriez envisager d'ajouter. Ils sont:

  1. Lien Jolie . Ce plugin vous permettra de suivre un lien frappe et bien rangé de longues URL.
  2. WP-phpMyAdmin . Pour l'utilisateur avancé. Ce plugin permet l'accès direct à la base de données WordPress.
  3. WP Super Cache . Si votre site a une grande quantité de trafic, WP Super Cache permet d'accélérer l'expérience utilisateur en mettant en cache le résultat HTML d'une page plutôt que de ré-exécuter côté serveur un script PHP.
  4. WP-DBManager . Effectuer l'entretien de routine automatisée de la base de WordPress et peut également être configuré pour envoyer un courriel sauvegarde de la base à intervalles réguliers.
  5. Sauvegarde WordPress . Les e-mails d'une sauvegarde du plugin WordPress, téléchargements et répertoires de thèmes à intervalles réguliers.

J'espère que cet article a été d'une certaine utilité.


SpinChimp Leaderboard 728x90