Gnu/Linux Magazine 204

Prédisez les saisies de vos utilisateurs !

… avant qu'ils ne sachent eux-même quoi écrire

  • Regroupez les documents d'un domaine pour créer votre corpus
  • Calculez les probabilités d'apparition des mots
  • Prédisez les prochains mots dans une phrase

Plus de détails

7,90 € TTC

 
sommaire

Actus & Humeur

p. 06    Principaux changements et améliorations de Django 1.10

IA, Robotique & Science

p. 12    Radio Data System (RDS) : analyse du canal numérique transmis par les stations radio FM commerciales, introduction aux codes correcteurs d’erreur

Système & Réseau

p. 38    Déployez Kubernetes sur vos Raspberry Pi avec Kubeadm

IoT & Embarqué

p. 48    Programmez votre objet connecté RPi avec Python

Kernel & Bas niveau

p. 56    Programmation fonctionnelle en C++

Hack & Bidouille

p. 64    « Paie Ton Patch !™ » : Weboob

Libs & Modules

p. 70    Conctructions « with » en langage... bash !
p. 80    Et si la prédiction n’était plus le domaine réservé des oracles ?

Mobile & Web

p. 86    Créez votre propre saveur Markdown

Sécurité & Vulnérabilité

p. 92    Address Space Layout Randomization

édito

Il est parfois édifiant de constater à quel point une idée simple peut nous faciliter la vie. Cette idée apparaît comme par enchantement et l'on se demande comment on a pu vivre jusque-là sans elle... et surtout comment on a fait pour ne pas l'avoir avant, cette satanée idée ! Prenons un exemple tout simple : lorsque l'on travaille sur un Raspberry Pi et que l'on écrit un article sur un PC, on a deux claviers, deux souris et deux écrans. Immanquablement, lorsque l'on souhaite écrire sur le Raspberry Pi on utilise le clavier... du PC ! Ce qui conduit à des résultats quelque peu aléatoires... Lorsque l'on souhaite déplacer la souris du PC, on utilise la souris du Raspberry Pi ce qui l'amène généralement, de rage, à prendre son envol sur quelques dizaines de centimètres (ce qui permet de comprendre l'utilité du câble qui relie la souris à l'ordinateur...), etc. Alors qu'en fait, on pourrait utiliser un bête commutateur USB et un commutateur HDMI qui existent depuis bien longtemps (les plus fortunés pouvant même se tourner directement vers des switchs KVM pour Keyboard-Video-Mouse) ! Il fallait juste avoir l'idée au bon moment... Les machines ne peuvent malheureusement (ou plutôt heureusement) pas anticiper, prédire ces idées qui nous font défaut. Par contre, il est possible statistiquement de déterminer le prochain mot auquel vous allez penser. En effet, en analysant un ensemble de documents, on peut calculer la probabilité pour un mot d'apparaître connaissant le mot précédent (ou les n précédents). La qualité des documents utilisés pour « l'apprentissage » est donc essentielle ! Vous n'obtiendrez pas la même précision suivant que vous allez employer :

  • des documents hétérogènes avec par exemple des textes en anglais du XVIIIe siècle, des textes en français du XVIe siècle et des textes en italien du XVe siècle ;
  • ou des documents homogènes issus de la même époque et du même domaine.

Dans le premier cas, vous allez réaliser une « grosse soupe » en mélangeant des époques, des langues et certainement des domaines (articles de presse, poésie, théâtre, etc.) et vous allez l'utiliser pour déterminer le prochain mot d'une phrase en français du XXIe siècle : un tirage purement aléatoire vous demandera moins de travail pour un taux de réussite à peu près équivalent.

Par contre dans le second cas, en travaillant de manière précise à l'élaboration de la base de documents, vous pourrez obtenir des résultats intéressants qui ne devront rien au hasard.

Ce mois-ci nous vous proposons d'étudier ce processus de prédiction dans son ensemble, depuis la création de la « base d'apprentissage » jusqu'à la proposition d'un mot devant compléter une phrase.

Vous pourrez également découvrir dans ce magazine comment réceptionner et décoder des trames RDS (mais oui, le RDS : les données numériques transmises sur les ondes FM), comment fonctionne le mécanisme d'allocation mémoire aléatoire du kernel et bien d'autres choses encore !

Je vous laisse prendre connaissance de ce contenu assez dense, je vous souhaite une bonne (lecture | année | soirée | journée)* et je vous retrouverai avec plaisir le mois prochain !

* Avec certains historiques de mots (comme « je vous souhaite une bonne »), la prédiction peut être difficile à effectuer... ;-)

Tristan Colombo

A propos du magazine
Logo

Le magazine de référence technique pour les développeurs et les administrateurs sur systèmes UNIX, open source & embarqué !

Pionnier dans son domaine, GNU/Linux Magazine est depuis 1998 une véritable référence technique pour pour tous les développeurs et administrateurs sur systèmes Unix, open source et embarqués. Le premier magazine français 100 % Linux se démarque grâce à une ligne rédactionnelle résolument technique et pédagogique. Chaque mois de nombreux thèmes sont abordés permettant de toucher à différents domaines de l’informatique, que ce soit de l’intelligence artificielle, de la sécurité, de l’embarqué, du système/réseau ou du hack.

Nouveaux produits