12,90 € TTC
p. 08 Petite introduction au Machine Learning
p. 20 Évaluez efficacement les frameworks de Machine Learning
p. 36 Utilisez la régression linéaire pour la prédiction
p. 56 La malédiction de la dimension
p. 74 Comment coder un système de recommandation en Python : l'exemple de Mangaki
p. 88 L'Univers, ses galaxies et le machine Learning
p. 112 Prédiction de structures secondaires de protéines
p. 120 Recherche de molécules innovantes
Avec l’explosion du nombre de données disponibles, il faut trouver des méthodes efficaces de traitement pour parvenir à en faire émerger des connaissances. En effet, posséder des milliards et des milliards de données dans différents domaines n’a strictement aucun intérêt en soi si l’on est incapable de les faire « parler », d’établir des relations entre elles ou des inférences. Si nous prenons l’exemple de la biologie, à quoi bon posséder des génomes séquencés si nous nous arrêtons à leurs séquences de nucléotides ? Cela ne nous renseigne en aucune manière sur le fonctionnement de l’organisme étudié. Il faut pour cela passer par les acides aminés, les gènes et leur organisation sur le génome, les protéines, leur structure et leur fonction, etc. Et lorsque les données croissent drastiquement, il n’est plus question d’annotation manuelle et d’expériences (si ce n’est pour valider des hypothèses), il faut un outil informatique puissant qui va aider à faire des prédictions. Cet outil, utilisé par le data scientist (l’expert scientifique chargé de l’analyse de données), peut être le machine learning, thème de ce guide.
De nombreux frameworks permettent d’utiliser le machine learning relativement simplement et ils vous seront présentés de manière plus ou moins avancée dans les différents articles que vous pourrez lire dans les pages suivantes. Il faut toutefois noter deux éléments fondamentaux :
Pour que ce guide soit complet, nous avons voulu le bâtir de manière à proposer des articles présentant les bases théoriques et des exemples pratiques, illustrant comment appliquer le machine learning sur des données et quelles informations en retirer. Vous devriez donc avoir entre les mains tout ce qu’il vous faut pour vous lancer, il ne reste plus qu’à trouver les données...
Tristan Colombo
GNU/Linux Magazine s'adresse aux professionnels et aux particuliers désireux de mieux maîtriser les techniques et problématiques liées à la programmation et à l’utilisation de solutions open source. Tous les deux mois avec ses articles techniques, la publication couvre les thématiques suivantes : programmation système, algo, bas niveau, sécurité du code, développement web...

Dans certains environnements, et notamment ceux multicloud, il peut être intéressant de disposer d’une solution d’interconnexion de vos serveurs, notamment dans un but d’administration. Dans cet article, nous traiterons d’une solution technique qui permet la mise en place d’un tel mécanisme : Nebula.
Lors de l’exploitation d’infrastructures conséquentes, il est essentiel de bien s’outiller pour en assurer la maintenance. L’observabilité est un de ces outils dont il est difficile de se passer. La méthode la plus simple et la plus commune d’observer son infrastructure reste probablement la journalisation des événements, autrement dit les logs. Ceux qui ont déjà eu l’occasion de me lire dans SysOps Pratique (et son prédécesseur Linux Pratique) sauront que ma boîte à outils préférée pour l’observabilité est la suite LGTM de Grafana Labs, ainsi que de mon intérêt pour HAProxy comme tête d’infrastructure web. Nous allons donc nous intéresser à la première étape de l’instrumentation télémétrique de HAProxy.
Dans un précédent article [1], nous avons commencé à aborder la thématique des « Day One Operations » avec Ansible. Nous continuons dans ce nouvel opus sur notre lancée, en évoquant d’autres cas d’utilisation de l’outil d’automatisation dans le contexte de la maintenance et l’évolution d’une infrastructure logicielle existante et complexe.