Aller plus vite, tout le temps. Tout automatiser. Les générateurs de texte participent de cette dynamique infernale. Bienvenue dans la production de contenu à la chaîne, la version 3.0 des Temps modernes. Oui, mais pour quels résultats ? Plongeons dans les entrailles du monde de la génération de contenu pour voir ce qu’il en ressort.

Pourquoi vouloir générer du contenu automatiquement ?

Pour gagner du temps

Imaginez un propriétaire de site e-commerce qui doit créer des dizaines de fiches produits pour des références dont seule la couleur varie. Quelle serait sa réaction si vous lui proposiez un moyen facile et rapide de générer les contenus dont il a besoin ? Oui, il y a fort à parier qu’il saute sur l’occasion, car elle lui ferait économiser beaucoup de temps. C’est là la toute première raison qui pousse à utiliser un générateur de contenu. Un simple clic permet d’obtenir du texte. Vous comprenez que cela en fasse rêver plus d’un.

Pour gagner de l’argent

Qui dit gagner du temps dit gagner de l’argent, évidemment, car l’écriture automatique de texte permet d’économiser des ressources humaines. Pas besoin d’embaucher des rédacteurs, la machine se charge de produire du contenu à leur place. Alors bien sûr, les logiciels ont un coût, mais il doit être mis en rapport avec celui du recrutement d’écrivains numériques. En principe, le gain de temps, et in fine, d’argent sont les motivations principales des gérants de sites internet faisant appel à l’intelligence artificielle pour la création de textes.

Pour éviter le duplicate content

Une autre raison qui motive à utiliser un générateur de texte est d’éviter le duplicate content. Qu’est-ce que la duplication de contenu ? Comme son nom le laisse deviner, c’est le fait d’afficher un texte identique sur plusieurs pages d’un site. Pour reprendre l’exemple des fiches produits, qui sont les types de contenus les plus concernés par cette problématique, cela équivaudrait à décliner un même texte sur plusieurs pages en ne changeant, par exemple, que la couleur de l’article. Le contenu dupliqué est mal vu par Google, nous y reviendrons. Chaque page d’un site devrait proposer aux internautes des écrits 100 % uniques.

Pour ne pas être taxé de plagiat

J’ai gardé le « meilleur » pour la fin. Les générateurs permettent aux petits malins qui piquent, sans scrupules, les textes des autres d’afficher du contenu différent de la source, avec plus ou moins de réussite. C’est aussi du duplicate content, mais intersite celui-ci. Dans ce cas, la reformulation « mot pour mot » est pratiquée dans le but d’éviter le plagiat. Car le plagiat, qui porte atteinte au droit d’auteur, est un délit, et à ce titre, il est sanctionné par la loi.

Générateur de texte : les outils

Logiciel de content spinning

Le moyen sans doute le plus répandu de générer du contenu rapidement et simplement est d’utiliser un logiciel de content spinning. Qu’est-ce que le content spinning ? La « rotation de contenu » (en français) est une méthode qui permet de décliner un même script à l’envi. Il faut au préalable établir un masterspin, une matrice prévoyant les variantes de chacun des mots employés. Puis le logiciel de spinning produit les différentes déclinaisons. Ensuite, il suffit de conserver celles qui présentent le taux d’unicité le plus important. Cette méthode nécessite un travail préparatoire rigoureux pour espérer obtenir le résultat le plus « qualitatif » possible.

Outil de paraphrase

Un deuxième moyen de générer du contenu est d’utiliser un logiciel de réécriture de texte. Dans ce cas, il suffit de coller les paragraphes à paraphraser dans un outil et d’appuyer sur un bouton. Le résultat est rarement à la hauteur, vous vous en doutez. Pour autant, cela ne semble pas en freiner certains, pour qui la qualité est accessoire. Le plus souvent, ces textes sont surtout à destination des robots des moteurs de recherche. Et l’internaute dans tout cela ? Rien à faire ! Ce qui compte, c’est d’apparaître sur des requêtes clés, peu importe si le contenu n’est pas compréhensible pour le commun des mortels. Arf !

Content spinning, paraphraseur de texte : des méthodes au service de l’appauvrissement du Web

Oui, rien que cela. Vous trouvez que j’y vais fort ? Qui, au hasard de ses navigations sur le Web, n’est pas déjà tombé sur des textes totalement abscons, dont les mots s’enchaînent jusqu’à former une indigeste bouillie ? Je pense que cela nous est arrivé à tous, dans le cadre d’écrits traduits automatiquement, mais pas que. Google fait de gros efforts pour traquer ces types de contenus et les renvoyer dans les tréfonds des pages de résultats.

Parce que mon propos manque peut-être jusqu’ici d’illustration, voyez par vous-même avec ce contenu que j’ai écrit, puis passé à la moulinette infernale d’un rewriter de texte.

« Le Web est un formidable espace de diffusion des connaissances et de partage d’information. Regardez, d’un clic, vous pouvez accéder au savoir universel. Chacun peut ainsi transmettre au monde entier sa culture et ses passions. N’est-ce pas prodigieux ? Sur le papier, l’idée est séduisante, mais dans la réalité, qu’en est-il vraiment ? Force est de constater que le Net se retrouve pollué par des contenus fades, inutiles, au service du business et non de l’enrichissement de la pensée collective. Alors, on noie les internautes sous de la pub et on les nourrit à base d’articles insipides. L’objectif ? Qu’ils consomment. Eh bien ce Web-là, je n’en veux pas ! »

Misère, regardez ce qu’en a fait l’outil :

« Le Web est un excellent espace de diffusion des connaissances et de partage d’informations. Voir, vous pouvez accéder aux connaissances générales en un seul clic. Par conséquent, chacun peut diffuser sa culture et sa passion dans le monde. N’est-ce pas génial ? En surface, cette idée est très séduisante, mais en réalité, qu’est-ce que c’est ? De toute évidence, on constate qu’Internet est pollué par des contenus ennuyeux et inutiles dans l’industrie des services, plutôt que par l’abondance d’idées collectives. Par conséquent, nous avons inondé les internautes de publicités et leur avons fourni des articles méprisables. Objectifs ? Ils consomment. Eh bien, ce site, je n’en veux pas ! »

CQFD.

Paraphraser un texte en ligne est d’une simplicité enfantine et s’obtient en quelques clics seulement. Mais, pauvres de nous, ce n’est pas avec ce genre de contenus que nous allons être tirés vers le haut. Heureusement, Google veille au grain !

La génération de contenu : une pratique chassée par Google

Le contenu de mauvaise qualité, peu pertinent, Google le combat depuis des années. Progressivement, il améliore ses algorithmes en ce sens. Le géant américain enjoint les créateurs de site à offrir aux internautes les meilleurs contenus possible. Pour y parvenir, il leur suggère de se poser des questions telles que :

  • L’article fournit-il des informations originales ?
  • La page offre-t-elle une valeur substantielle par rapport aux autres pages des résultats de recherche ?
  • Le contenu semble-t-il bâclé ou produit à la hâte ?
  • Etc.

Cela montre à quel point la valeur ajoutée compte à ses yeux. Dès lors, quelle place pour la génération automatisée de contenu sur le Web version Google ? Aucune. À l’instar de toutes les techniques destinées à produire du texte pour les moteurs de recherche et non pour les internautes, elle est considérée comme du spamdexing, une pratique spammante. À ce titre, elle est donc proscrite.

Le problème, c’est que certains outils, dotés d’une IA puissante, sont capables de concevoir des textes tout à fait compréhensibles par les lecteurs. Alors comment un robot pourrait-il épingler un contenu créé artificiellement, indétectable par l’humain ? Toutefois, il est illusoire de penser qu’on puisse s’adonner à ce type de pratique en toute impunité pour longtemps. C’est une question de temps. Tic-tac, tic-tac.

S’agissant du plagiat ou de la reformulation grossière de contenu, Google ne la sanctionne pas encore. Tout au plus, il écarte les pages coupables de ce méfait des résultats principaux. Le moteur de recherche invite aussi, à travers un formulaire spécifique, les auteurs bafoués à signaler une atteinte aux droits d’auteur. Mais rappelons encore une fois que le vol de texte est répréhensible par la loi. La loi des Hommes est supérieure à celle des robots.

La qualité, rien que la qualité. C’est ce qui devrait guider chaque gérant de site internet dans sa stratégie de contenu. Et pour être sûr de l’atteindre, mieux vaut faire confiance aux pros : des rédacteurs web SEO formés. Envie de faire partie de la famille des e-rédacteurs premium ? Oubliez les MOOC, regardez plutôt le programme de la formation en rédaction web de Lucie Rondelet.

Stéphanie Soulier – Correctrice, rédactrice et chargée éditoriale dans l’équipe de Lucie Rondelet, ancienne élève Origami 4

lucie rondelet instagram

error: Content is protected !!
%d blogueurs aiment cette page :