Etienne Magro (blog)

L'auto-hébergement

2023-04-11T15:00:00+02:00

Petite note, je fais cet article pour plusieurs raisons :

partager une de mes passions et un des trucs qui fait que les gens me regarde avec des yeux ronds :-D
suite à un repas entre amis, on m'a demandé conseil pour débuter dans la pratique de l'auto-hébergement. Alors pour en faire profiter un maximum de monde, j'ai couché tout ça par écrit
promouvoir à ma très petite échelle la pratique

/!\ Attention, ce blogpost est touffu et très décousu. Il n'est en rien un tuto (je ne suis pas à 2-3 approximations près), mais plutôt des pensées écrites au fil de l'eau avec un semblant d'organisation. Si ça vous a donné envie de vous lancer, partagez-le-moi, ça fera toujours plaisir. Et si vous avez des questions, contactez-moi :-)

Aspect politique et philosophique

Je vais commencer ce blogpost par présenter un peu la vision politique et philosophique qu'a pris l'auto-hébergement pour moi. Au départ, c'était surtout pour "mettre les mains dans le cambouis", m'amuser à installer un serveur web par-ci ou un serveur git par-là. Et au fur et à mesure la pratique technique s'est également accompagniée d'une revendication politique. Détaillons un peu ça.

L'auto-hébergement, self-hosting en anglais, consiste en l'hébergement des services informatiques dont on a besoin (ou envie) par soi-même. On pourrait rajouter d'autres éléments, mais ça excluerait de fait autant de tentatives pourtant louable : serveurs en propre, par exemple. Pour un professionnel, c'est héberger son site web institutionnel sur sa propre infrastructure, ainsi que tous les outils utilisés par les employés. Pour un particulier, ça démarre généralement avec un PC installé dans la DMZ de la box ou sur un dédié ou un VPS chez un fournisseur.

L'idée derrière cette pratique, c'est de (re-)prendre le controle sur les services informatiques que l'on consomme, et d'être le plus autonome sur son propre environnement technologique. Au niveau étatique, c'est une composante importante de la "souveraineté technologique". En creux, on trouve l'envie de se soustraire aux controles exercés ou exerçable par les grandes entreprises de la tech et d'éventuels gouvernements présents ou futurs, et par là-même la réaffirmation du droit à la vie privée et son application la plus strict et personnelle. C'est particulièrement mon cas. On peut aller jusqu'à y trouver pour certains un acte de résistance contre la centralisation d'Internet.

Pour moi, cet aspect d'être maître de mes outils et de mes données est le plus important. Je ne veux pas que les photos de mes vacances familiales soient stockées sur des serveurs qui ne m'appartiennent pas et qui pourraient être exploitées. Mes photos de vacances sont mes souvenirs à moi. Je ne veux pas que quelqu'un se les approprie. On parle également de mon carnet d'adresse perso, de mes agendas, et ça va jusqu'au code que je produis pour mes hobbys ou mes habitudes de lecture de journaux/blog/BD/manga/comics/romans/etc...

Oui, les journaux/blog/BD/etc... que je lis ne regardent pas d'autres personnes (ou entreprises, ou états). Tous autant qu'ils sont, ils sont le reflet de mes opinions, revendications, incertitudes, humeurs, interrogations (et des changements dans celles-ci) et je veux que personne ne puisse les utiliser.

Avant de passer à la technique pure et dure, je vais ajouter que c'est aussi une manière d'apprendre de nouvelles choses et de ne pas rester rouiller sur mes acquis. Je suis obliger de constamment me mettre à jour pour toujours avoir des services à jour. C'est également un laboratoire à ciel ouvert et ça forge aussi une certaine expertise (qui s'est déjà fait poutrer son serveur parce qu'il ne l'avait pas sécurisé comme il faut ? C'est bibi :-D)

Aspect matériel

Ok, maintenant qu'on a abordé l'auto-hébergement sous son jour politique, passons au concret : comment fait-on ? En premier il va falloir un serveur. Une machine sur laquelle on va installer les services que l'on désire.

Le plus facile, c'est d'utiliser un vieux PC qu'on n'utilise plus et qui prend la poussière dans un coin. On installe Linux dessus, et hop, ça fait un serveur. Ou bien le Raspberry Pi dont on ne sait pas quoi faire. C'est comme ça qu'à titre perso j'ai commencé : quand j'étais étudiant, mes parents ont remplacé le PC famillial par un nouveau, j'ai récupéré l'ancien et j'ai y installé un Debian 3.

Si on ne dispose pas d'une machine libre, on peut se tourner vers la location d'une VM ou d'un serveur dédié. On trouve des VPS et des dédiés par cher (4-6€/mois) qui sont parfaits pour débuter. Voire même de manière pérenne.

Si vous voulez vraiment investir et ne savez pas quoi acheter, le champs des possibles est trop grand pour que je puisse vous conseiller comme ça. Si vous n'avez de workload prévu, tournez-vous vers des mini-PC (j'adore ce form-factor) et dites-vous que plus le CPU est récent, moins il consommera d'électricité. A titre personnel, j'ai acheté un mini-PC sur une base d'intel celeron J4125 à ~150€ il y a bientôt 2 ans. En terme de puissance, c'est laaaaargement suffisant pour le workload familial. J'ai juste augmenté sa RAM à 16Go, son disque à 2To de HDD et 120Go de SSD et il me fera au moins 5 ans, voire 7-8 si je n'ai pas de grosse surprise.

Si vous avez besoin d'un gros stockage, le sujet est pour une autre fois ;-)

Aspect logiciel

L'OS

Maintenant que l'on a un matériel, il faut savoir quoi installer dessus. Si vous louez un VPS ou un dédié, vous avez le choix entre plusieurs linux (qui voudrait faire de l'hébergement avec autre chose, franchement <Troll Inside :-D>), prenez celui avec lequel vous êtes le plus à l'aise. Sinon, un ubuntu ou un debian fera très bien l'affaire.

Si vous êtes sur un hardware que vous maîtrisez, vous avez également la possibilité de partir sur de la virtualisation. ESXi, Proxmox sont les plus connus et recommandé. C'est aussi une manière de se faire une architecture n-tiers, ou de se faire une/des VM "propre" qui hébergera les services à demeure et une/des VM "bac à sable" pour les expérimentations et qui pourront être trashées/recréées autant que l'on veut.

Pour des débutants, le mieux, à mon avis, c'est de partir sur un Debian le plus simple possible, sans VM, sans fioritures, le plus classique et pour lequel on pourra trouver le plus facilement de l'aide en ligne.

Comment installer les services

La manière de gérer les services que l'on installe sur les serveurs est importante. Parce qu'elle doit être le reflet de l'organisation que l'on a ou souhaite.

On peut le faire en mode "roots" : apt get install. C'est parfait si l'on sait que l'on aura qu'un seul service d'installé ou que l'ensemble des services ne vont pas se marcher sur les pieds.
On peut le faire en mode "docker à la main" : à chaque fois on se logue en SSH sur le serveur et on pratique la cli docker (docker pull, docker run, etc)
On peut le faire avec docker-compose : on commence à organiser ses installations avec un/des fichiers docker-compose.
On peut le faire avec ansible/puppet/salt : là, c'est le début de la professionnalisation
On peut le faire avec un k8s ou k3s : on est pas là pour lancer une start-up, passez votre chemin :-D

A titre personnel, j'utilise ansible, profession oblige. Mais à mon avis, un/des docker-compose seront parfait pour des débutants et des moins-débutants. Je vais ajouter également qu'à titre perso, je suis utilisateur de docker sur mon infra perso (notez que j'insiste sur le "perso". Et aussi, podman à la place de docker sur le dernier serveur en date, pour expérimenter un peu). Ainsi l'installation de mes services est pilotée par ansible, et les services eux-même tournent sur les serveurs dans des containeurs. C'est ce qui me semble le plus propre à l'échelle hobby/serveur familial, aujourd'hui.

Quels services installer

A ce niveau-là, ce que vous voulez !

Littéralement des milliers de possibilités s'offrent à vous.

Je vais juste vous indiquer ce que j'auto-héberge, sur mon mini-PC :

Nextcloud, pour la synchronisation des fichiers, photos, contacts, agenda, notes, recettes de cuisine et messagerie familiale
Funkwhale, pour écouter ma musique où et quand je veux
Gitea, un serveur git ultra-léger, mais aussi très complet
PiHole, qui fait la résolution DNS dans la maison, ainsi qu'un premier niveau de blocage de pub et trackers
Kresus, pour la gestion des finances familiales
Searx, le meta-moteur de recherche
Calibre-web, pour faciliter la gestion et la distribution de nos livres électroniques (pour nos téléphones, tablettes et liseuse)
FreshRSS, chouette lecteur de flux RSS, pour ma veille techno et non-techno
Mes mails, avec une très jolie webUI, même si ça devient de plus en plus compliqué avec les années (cf Framasoft)
le site web de mon beau-frère
la webapp que j'ai codé pour lire mes mangas/comics
mon blog, avec Pelican
le future blog de mon épouse
Info-medoc, un petit projet perso d'il y a quelques années
Plusieurs autres projets perso, futurs ou anciens

On y va ?

Sur le serveur avec docker

Forcément, je ne pourrais pas être exhaustif, alors voilà le postulat de départ :

Vous disposez d'une machine debian minimaliste fraichement installée et à jour sur laquelle vous vous connectez en SSH
Vous avez choisi l'option de facilité en déployant vos services avec Docker + docker-compose
Vous êtes sur une machine avec une IP publique (chez un hébergeur ou si le serveur est chez vous, il doit y avoir un paramétrage dans votre box pour placer votre serveur dans la DMZ. Et hop, c'est tout pareil ensuite).
Il y aura moins de 10 personnes qui utiliserons votre service. Je pars sur une installation type familiale, plus d'utilisateurs pourrait nécessité une configuration différente.

Commençons par installer docker (doc officielle) :

sudo apt-get remove docker docker-engine docker.io containerd runc # On enlève ce qui pourrait gêner
sudo apt-get update
sudo apt-get install ca-certificates curl gnupg # On installe les dépendances nécessaire à l'usage du dépôt de package docker
sudo install -m 0755 -d /etc/apt/keyrings
curl -fsSL https://download.docker.com/linux/debian/gpg | sudo gpg --dearmor -o /etc/apt/keyrings/docker.gpg # On installe la clé GPG de docker qui va signer les packages
sudo chmod a+r /etc/apt/keyrings/docker.gpg
echo \
  "deb [arch="$(dpkg --print-architecture)" signed-by=/etc/apt/keyrings/docker.gpg] https://download.docker.com/linux/debian \
  "$(. /etc/os-release && echo "$VERSION_CODENAME")" stable" | \
  sudo tee /etc/apt/sources.list.d/docker.list > /dev/null # On configure le dépôt officiel de docker

sudo apt-get update
sudo apt-get install docker-ce docker-ce-cli containerd.io docker-buildx-plugin docker-compose-plugin # Installation à proprement parler de docker

Premier service hébergé

Pour aller au plus simple, je vais partir sur l'installation d'un Nextcloud avec docker-compose. On va d'ailleur fortement s'inspirer de la documentation officielle. Mettez ce qui suit dans un fichier docker-compose.yml :

version: '3'

volumes:
  nextcloud:

services:
  nextcloud:
    image: nextcloud
    restart: always
    ports:
      - 8080:80
    volumes:
      - nextcloud:/var/www/html
    environment:
      SQLITE_DATABASE: nextcloud.sqlite3

Puis lancez votre docker-compose :

docker-compose up -d

Bravo, vous pouvez vous rendre sur l'URL http://<IP_DE_VOTRE_SERVEUR>:8080 et vous devriez pouvoir complétez l'installation de votre nextcloud.

Facile, non ?

Reverse-proxy et HTTPS

Suposons maintenant que vous vouliez pouvoir accéder à votre serveur nextcloud avec un nom de domaine et sur le "bon" port. Il faut que vous achetiez/louiez un nom de domaine chez votre registrar préféré et que vous le fassiez pointer (enregistrement A pour l'IPv4 et AAAA pour l'IPv6) vers l'adresse IP publique de votre serveur (ou box). Un fois cela fait, on va rajouter le reverse-proxy traefik qui va s'occuper du certificat pour vous. Comme toujours, on va s'appuyer sur la doc officielle.

En premier lieu, arrêtez votre premier service (docker-compose down), puis modifiez le fichier docker-compose.yml comme suit :

version: '3'

volumes:
  nextcloud:
  letsencrypt:

services:
  rproxy:
    image: traefik
    command:
      - "--providers.docker=true"
      - "--providers.docker.exposedbydefault=false"
      - "--entrypoints.web.address=:80"
      - "--entrypoints.websecure.address=:443"
      - "--certificatesresolvers.myresolver.acme.httpchallenge=true"
      - "--certificatesresolvers.myresolver.acme.httpchallenge.entrypoint=web"
      - "--certificatesresolvers.myresolver.acme.email=<VOTRE_ADRESSE@EMAIL.com>"
      - "--certificatesresolvers.myresolver.acme.storage=/letsencrypt/acme.json"
    ports:
      - "80:80"
      - "443:443"
    volumes:
      - "letsencrypt:/letsencrypt"
      - "/var/run/docker.sock:/var/run/docker.sock:ro"
  nextcloud:
    image: nextcloud
    restart: always
    volumes:
      - nextcloud:/var/www/html
    environment:
      SQLITE_DATABASE: nextcloud.sqlite3
    labels:
      - "traefik.enable=true"
      - "traefik.http.routers.nextcloud.rule=Host(`moncloudprive.mondomaine.example.com`)"
      - "traefik.http.routers.nextcloud.entrypoints=websecure"
      - "traefik.http.routers.nextcloud.tls.certresolver=myresolver"

On relance le docker-compose :

docker-compose up -d

Et maintenant, rendez-vous sur https://moncloudprive.mondomaine.example.com. Vous devriez voir votre service nextcloud.

Un serveur git ?

Pour l'exercice, rajoutons un serveur git qui va nous permettre de stocker notre fichier docker-compose.yml comme il faut. Après avoir arrêté nos services avec docker-compose down, modifions le fichier comme suit :

version: '3'

volumes:
  nextcloud:
  letsencrypt:
  gitea:

services:
  traefik:
    image: traefik
    restart: always
    command:
      - "--providers.docker=true"
      - "--providers.docker.exposedbydefault=false"
      - "--entrypoints.web.address=:80"
      - "--entrypoints.websecure.address=:443"
      - "--certificatesresolvers.myresolver.acme.httpchallenge=true"
      - "--certificatesresolvers.myresolver.acme.httpchallenge.entrypoint=web"
      - "--certificatesresolvers.myresolver.acme.email=<VOTRE_ADRESSE@EMAIL.com>"
      - "--certificatesresolvers.myresolver.acme.storage=/letsencrypt/acme.json"
    ports:
      - "80:80"
      - "443:443"
    volumes:
      - "letsencrypt:/letsencrypt"
      - "/var/run/docker.sock:/var/run/docker.sock:ro"


  nextcloud:
    image: nextcloud
    restart: always
    volumes:
      - nextcloud:/var/www/html
    environment:
      SQLITE_DATABASE: nextcloud.sqlite3
    expose:
      - "80"
    labels:
      - "traefik.enable=true"
      - "traefik.http.routers.nextcloud.rule=Host(`moncloudprive.mondomaine.example.com`)"
      - "traefik.http.routers.nextcloud.entrypoints=websecure"
      - "traefik.http.routers.nextcloud.tls.certresolver=myresolver"


  gitea:
    image: gitea/gitea
    restart: always
    volume:
      - "{{ app_data_dir }}/gitea:/data"
    ports:
      - "222:22"
    expose:
      - "3000"
    env:
      RUN_MODE: prod
      SSH_DOMAIN: monserveurgit.mondomaine.example.com
      SSH_PORT: 222
      SSH_LISTEN_PORT: 22
      INSTALL_LOCK: "true"
      SECRET_KEY: "MaCleSuperPrivee"
      PROTOCOL: https
      DOMAIN: monserveurgit.mondomaine.com
      ROOT_URL: "https://monserveurgit.mondomaine.example.com/"
      ENABLE_GZIP: "true"
      DISABLE_REGISTRATION: "true"
      OFFLINE_MODE: "true"
    labels:
      - "traefik.enable=true"
      - "traefik.http.routers.gitea.rule=Host(`monserveurgit.mondomaine.example.com`)"
      - "traefik.http.routers.gitea.tls=true"
      - "traefik.http.routers.gitea.entrypoints=websecure"
      - "traefik.http.routers.gitea.tls.certresolver= myresolver"

On commence à avoir l'habitude, maintenant : on relance les services avec docker-compose up -d. Vous devriez toujours avoir votre nextcloud sur https://moncloudprive.mondomaine.example.com et en plus votre serveur git sur https://monserveurgit.mondomaine.example.com.

Le reste ne dépend plus que de vous !

Note de fin

Attention, le présent blogpost ne parle pas du tout de la sécurisation du serveur, des services, ni des données stockées. Si vous vous lancez dans l'auto-hébergement sérieusement, il faut vous renseigner sur ces sujets (peut-être une idée pour un prochain blogpost, tien). Si vous ne voulez pas voir vos serveurs devenir des mineurs de cryptocoin sans votre aval ou des bots au sein d'un réseau de piratage, ni vous le voir "confisqué" par un crypto-locker, ou vos données volées, il faut que vous creusiez sérieusement ces sujets.

Btrfs, c'est de la fucking black magic

2021-09-07T19:00:00+02:00

Contexte

J'ai chez moi un NAS fait avec un HP Proliant Gen7 N54L. C'est une belle bête, un peu vieille maintenant, mais toujours vaillante, avec en standard une capacité de 4 disques 3,5". J'ai mis l'OS sur un disque supplémentaire (on peut le tweaker pour en rajouter jusqu'à 4 en plus) et j'utilisais jusqu'à ce jour 3 disques ainsi :

sda : 3To (xfs) pour les gros fichiers de la maison (pensez vieux films non dispo en VOD que j'ai rippé pour notre usage familial, fichiers pour de l'animation 3D, etc.., ce genre de gros fichiers)
sdb : 3To (xfs) pour toutes les photos et les documents familiaux à garder le plus précieusement
sdc : 2To (ext4) backup manuel (mais cronné quand même) du sdb

Pour les trucs vraiment importants (présents sur le sdb), j'ai d'autres backups, avec la règle des 3-2-1. L'idée c'était de ne pas perdre mes données en cas de défaillance d'un disque (tous achetés à des moments différents en veillant bien à ce qu'ils ne fasse pas partie d'un même lot de fabrication).
Dernièrement, le sda s'est retrouvé quasiment plein. J'ai donc acheté un nouveau disque de 6To pour le remplacer. C'est là que je me suis dit que je pourrais basculer sur du Btrfs, qui est le FS par défaut sur certaines distrib' linux depuis pas mal de temps, mais que je n'avais jamais choisi.
Sur un disque tout seul, c'est relativement simple, et ça s'utilise comme les autres FS.

mkfs.btrfs /dev/sdX
mount /dev/sdX /media/ou_vous_voulez    # N'oubliez pas le fstab

Et après ça s'oublie.

Raid

Notes avant la suite : je suis sur un serveur perso chez moi, du coup, les reboot ne sont pas un problème, ce n'est pas de la prod en disponibilité 99,999%. Et je vais parler de "partitions", par abus de langage, même si le vrai terme n'est pas forcément celui-là.

Depuis maintenant plus de 10 ans, je cherche un système qui me permettrait d'avoir un FS unique et quand on manque de place, on rajoute un disque ou on en remplace un par un plus gros, et ça fonctionne sans plus de complications. Je me suis toujours tenu à l'écart de LVM et de mdraid. Au niveau perso, je trouve que ça rajoute des couches inutilement compliquées, avec pas mal de contraintes. Ça se justifie totalement dans un contexte professionnel, mais pour le serveur familial qui doit juste marcher dans un coin de la maison, ça me rebutait.
Et le problème, pour moi, au-dela de la complexité, c'était l'impossibilité d'utiliser un environnement hétérogène, en terme de disque. Je ne veux pas avoir à remplacer tous les disques du serveurs si je veux juste augmenter sa capacité. Je veux juste en acheter un plus gros et c'est tout.

Et c'est là qu'est la force de Btrfs. On lui donne un nombre de disque que l'on veut, de capacités différentes, il s'en fout, il fait au mieux (qui est même mieux que ce que je pourrais faire avec un LVM+mdraid). Et ça marche !

Du coup, voici ce que j'ai fait (en root, et de mémoire, donc vérifiez avant de copier-coller) :

mkfs.btrfs /dev/sdd # formattage du dernier disque de 6To ajouté en Btrfs
mount /dev/sdd /media/sdd
rsync -a /media/gros_fichiers /media/sdd
vim /etc/fstab  # suppression de la ligne de montage du /dev/sda, et rajout de la ligne de montage du /dev/sdd à la place du sda sur /media/gros_fichiers
reboot      # Ainsi, le nouveau disque sdd prend la place du vieux sda pour l'opérationel

btrfs device add -f /dev/sda /media/gros_fichiers   # le '-f' est là pour forcer, parce que sinon, ça ne se fait pas car l'outil détecte la présence de l'ancien formattage en xfs (et c'est bien)
screen btrfs balance start -dconvert=raid1 -mconvert=raid1 /media/gros_fichiers

Il faut que j'explique, là.
Après le formattage du sdd en Btrfs, j'ai donc une partition de 6To (je passe outre les pertes diverses, là n'est pas mon propos). Quand on fait le btrfs device add, ça étend la partition en utilisant le(s) disque(s) ajouté(s). Du coup, là, je me retrouve avec une partition de 6+3=9To. Un bon petit RAID0 les doigts dans le nez, sans rien faire d'autre. C'est magique !

Et ce qui est encore plus magique, c'est le btrfs balance start -dconvert=raid1 -mconvert=raid1. Ça convertit le RAID0 (6+3 To) en RAID1 (6+3 / 2 = 4,5 To). (Je reprécise, je m'en fous des chiffres exacts, ce n'est pas mon propos). Ça veut dire que Btrfs va s'arranger au mieux pour qu'une même donnée soit présente 2 fois sur des disques différents. Dans mon cas, c'est possible car justement toutes les data tenaient sur le disque de 3To.
Ça prend un peu de temps, car il faut tout dupliquer, mais quand j'y suis revenu le lendemain, c'était terminé.

La suite, c'est donc d'y rajouter le sdc de 2To. Oui, oui, c'est possible, et c'est ce que j'ai fait devant vos yeux ébahis :

btrfs device add -f /dev/sdc /media/gros_fichiers # toujours le '-f' car le disque était utilisé avant

Du coup, ça me donne en une seule commande un RAID1 sur 3 disques différents (6+3+2 / 2 = 5,5 To). Franchement, j'ai pas de mots pour dire à quel point je trouve ça merveilleux.
J'ai terminé en rajoutant tout le reste dessus et en reconfigurant le /etc/fstab et le /etc/exports pour que tout fonctionne avec une seule "partition".

rsync -a /media/fichiers_importants /media/gros_fichiers
vim /etc/fstab      # Pour monter la partition unique Btrfs sur /media, maintenant (relisez les rsync et vous comprendrez)
reboot

btrfs device add -f /dev/sdb
screen btrfs balance start /media

On attend un petit moment, que toutes les données soient rebalancées sur les 4 disques. Une fois la redistribution faite, on a donc une seule "partition" Btrfs d'une capacité de 6+3+3+2 / 2 = 7To. Tout ça en RAID1 sur 4 disques de capacitées différentes.

Ai-je mentionné qu'hormis les reboot, tout le reste s'est fait pendant que les disques étaient utilisés ? Je bossais sur des documents/fichiers présents sur ces disques, exportés en NFS depuis un autre PC, sans rien remarquer.

C'est scandaleux tellement c'est facile. À ce niveau-là, on frole la magie.

Futur nouveau disque

Si d'aventure je voulais rajouter un nouveau disque, il me suffirait d'acheter celui qui me convient le mieux en terme de coût et capacité à ce moment-là et de faire un btrfs device add, éventuellement un btrfs balance start et c'est tout.

Si je veux augmenter la capacité en remplaçant un disque, c'est un peu plus compliqué et risqué, mais en planifiant ça comme il faut ça devrait fonctionner. Par exemple, si je veux remplacer le disque de 2To par un de 6To. Les commandes suivantes me le permettront (WARNING : non-testé, à l'inverse des commandes précédentes. Ca devrait marcher, mais je ne l'ai pas encore vérifié) :

btrfs device delete /dev/sdc /media
# Enlèvement du disque physique, et branchement du nouveau à la place
btrfs device add /dev/sdX /media
screen btrfs balance start /media

Je répète, on ne sait jamais, je n'ai pas encore testé ça. Il y a des choses à considérer avant d'enlever un disque d'un RAID, quel qu'il soit. Par exemple (non-exhaustif, et en plus d'un backup), il faut que la "partition" Btrfs ne soit pas pleine et que tous les autres disques puissent se répartir ce que contient le disque qu'on enlève, sinon, problèmes. Il ne faut pas que les autres disques tombent en panne pendant l'opération, non plus, sinon, vous êtes bon pour la perte de données.

EDIT : Au final, j'ai décidé de rester sur 3 disques (donc 6+3+3 / 2 = 6To) pour le moment, pour faciliter l'augmentation de capacité par remplacement (au fait, le btrfs device delete marche super bien, même en cours d'utilisation de la "partition"). Plutôt que de faire un delete puis add, le moment venu, je ferais l'inverse add d'un nouveau disque plus gros puis delete d'un des anciens disques. Ainsi je n'aurais pas à me soucier de vérifier trop régulièrement si j'ai la possibilité/capacité de faire le delete. Et aussi, ça me simplifiera la vie en cas de défaillance d'un des disques actuels. Dans un cas comme dans l'autre, il suffira de brancher un nouveau disque dans le 4e compartiment vide et de l'add, puis de retirer le disque crashé ou trop petit. Rester sur 3 disques et faire ainsi, me semble le mieux, vu mon use-case.

Snapshot

On verra la gestion des snapshot dans un autre temps, mais forcément, vu mon setup et mon besoin, ça ne sera pas forcément un truc très standard (pas envie de gérer des subvolumes, par exemple). Je ferais sûrement quelque chose à base de cp -r --reflink=auto /media/fichiers_importants /media/snapshot/fichiers_importants-$(date +'%Y-%m-%d'), écrasé/rotaté régulièrement (Oui, ce cp --reflink=auto est une autre magie de Btrfs).

Pour finir, un peu de doc qui m'a bien aidée : https://btrfs.wiki.kernel.org/index.php/Using_Btrfs_with_Multiple_Devices (en anglais).
La page sur le wiki de Sebsauvage (en français) peut aussi apporter des info/explications/retour d'expérience : https://sebsauvage.net/wiki/doku.php?id=btrfs

EDIT : après quelques mois d'utilisation

Ca marche super bien.

J'ai besoin d'en dire plus ?

J'ai modifié mon /etc/fstab comme ça : UUID=6......1-1f3a-4922-a...............6 /mnt btrfs defaults,noatime,autodefrag,compress=zstd 0 0. Du coup, avec le compress=zstd, tout ce qui peut être compressé le sera de manière transparente (et c'est intelligent : ça n'essayera pas de re-compresser un fichier .zip ou .tgz ou autre). Mine de rien, ça se prend. Plus de place disque sans changer/rajouter de disque, c'est super !

Je cite le site FedoraProject :

Compression saves space and can significantly increase the lifespan of flash-based media by reducing write amplification. It can also increase read and write performance.

Du coup, effet de bord non envisagé/cherché spécifiquement : après vérification, grâce au RAID intégré à Btrfs + la compression, la vitesse des transferts depuis et vers le NAS a été décuplée. Youhou !

Pour la maintenance, j'ai juste cronné une défragmentation mensuelle (avec vérification de la compression) btrfs filesystem defragment -r -v -czstd /mnt. C'est l'un des rares points noirs de Btrfs : contrairement à ext4/xfs, ça fragmente. Même si on met l'option de montage autodefrag, il faut penser à dégramenter régulièrement.

Bilan

Ca tourne bien, ça tourne plus vite et avec plus d'espace disque dispo, en RAID1 compressé transparent sur des disques hérérogènes, sans rien avoir eu à faire depuis que c'est installé. Moi, ça me va !

Btrfs, c'est de la fucking black magic, sérieusement.

Utiliser Kolla-Ansible pour déployer un environnement openstack

2021-05-20T15:00:00+02:00

A toutes fins utiles, il convient de toujours se reporter à la documentation officielle. Le blogpost qui suit n'en est d'ailleurs qu'une reprise, et un résumé, adaptée à la découverte de l'usage de kolla-ansible dans le cadre de l'installation d'un openstack d'exemple sur un serveur unique (dit "mono-node" ou "all-in-one").

Avant toute chose, il faut savoir que Kolla-Ansible est un ensemble de playbooks et de rôles ansible déjà tous prêt pour installer un openstack dans les règles de l'art. Ce dépôt ansible est écrit et maintenu par les équipes d'openstack pour représenter l'état de l'art de l'installation d'un openstack et peut être utilisé tel quel par tout un chacun.

Pré-requis

Avant d'utiliser Kolla-Ansible, il est important de connaitre ansible. Au moins des notions de cet outil et une connaissance même basique de son usage sont nécessaires pour ne pas être perdu.

Également, la machine sur laquelle vous allez installer openstack a besoin d'au-moins deux interfaces réseau. Sans cela, impossible (ou alors, vraiment compliqué et ça dépasse le cadre de ce post) d'installer openstack.

Installation de Kolla-ansible

Dépendances

Comme pour tout, il faut commencer par installer les dépendances. Heureusement, c'est python qui propulse ansible, du coup, pour les dépendances, c'est relativement vite fait. Pour mon PC sous fedora, ça donne ça (pour d'autres distrib', voir la doc officielle kolla) :

sudo dnf install python3-devel libffi-devel gcc openssl-devel python3-libselinux
python3 -m venv venv
. venv/bin/activate.fish       # . venv/bin/activate si vous utilisez bash
pip install 'ansible<3.0' kolla-ansible

Préparation de kolla-ansible

sudo mkdir -p /etc/kolla
sudo chown $USER:$USER /etc/kolla
cp -rv venv/share/kolla-ansible/etc_examples/kolla/* /etc/kolla

A noter que les deux fichiers globals.yml et password.yml qui sont copiés dans /etc/kolla sont vide de configuration pour le premier (faite un grep -v '#' dessus pour vérifier) et inutilisable pour le second (toutes les variables sont vides).

cp -v venv/share/kolla-ansible/ansible/inventory/* .

Les deux fichiers copiés ne vont pas servir tels quels, il va falloir les modifier un peu avant usage. A savoir que dans le cadre de ce post, nous n'allons utiliser que le fichier d'inventaire all-in-one. Il va nous permettre d'installer openstack sur un seul serveur. C'est parfait pour découvrir kolla-ansible, mais ne l'utilisez surtout pas ainsi en prod.

Configuration

Configuration ansible

Avant d'utiliser Ansible, il faut bien sûr commener par préparer l'inventaire. Dans notre cas, il va s'agir du fichier all-in-one copié à l'étape précédente. Ce qui nous intéresse, ce sont uniquement les premières lignes de ce fichier. Les reste du fichier constitue des groupe et sous-groupes que nous n'avons pas d'intérêt à modifier ici, mais qui seront pratique/utilisés lors du déploiement et le configuration des service.

Si vous souhaitez déployer openstack en local (c'est à dire si toutes les opérations que vous avez faites depuis le début ont été faite sur la machine où vous souhaitez déployer openstack), vous n'avez pas besoin de modifier ce fichier all-in-one. Sinon, si comme moi, vous préférer exécuter ansible sur une machine dédiée ou votre poste et installer openstack ailleurs, il faut le modifier. Voilà ce que donnent les premières lignes modifiées pour moi :

# These initial groups are the only groups required to be modified. The
# additional groups are for more control of the environment.
[control]
sandbox-test-user1     ansible_host=10.8.X.Y ansible_user=debian ansible_become=true

[network:children]
control

[compute:children]
control

[storage:children]
control

[monitoring:children]
control

[deployment:children]
control

Et plus qu'à vérifier ça avec la commande classique ansible (ne faites pas attention au warning, ansible n'aime pas les "-" dans les noms des groupes) :

> ansible -i all-in-one all -m ping
[WARNING]: Invalid characters were found in group names but not replaced, use -vvvv to see details
sandbox-test-user1 | SUCCESS => {
    "ansible_facts": {
        "discovered_interpreter_python": "/usr/bin/python3"
    },
    "changed": false,
    "ping": "pong"
}

Configuration kolla

Kolla a besoin que l'on configure le fichier /etc/kolla/passwords.yml copié précédemment. Ce fichier va contenir tous les mots de passe qui seront ensuite paramétré dans l'openstack. Il ne s'agit pas de mot de passe utilisateurs, mais plutôt des services qui doivent s'identifier et s'authentifier entre-eux. Pour rappel, openstack est codé en micro-services. Et ces micro-services ont besoin de s'authentifier entre-eux pour être sûr qu'un intrus ne vienne les parasiter.

Cette configuration serait rédibitoire à faire manuellement, alors kolla met un outils à notre disposition pour faire ça simplement :

> grep -v '#' /etc/kolla/passwords.yml | head # Avant l'exécution, on voit bien que le fichier ne contient aucun mot de passe
---
rbd_secret_uuid:
cinder_rbd_secret_uuid:

database_password:
mariadb_backup_database_password:

docker_registry_password:

vmware_dvs_host_password:
> kolla-genpwd
> head /etc/kolla/passwords.yml # Alors qu'après, ils sont tous là
aodh_database_password: YPaA................................vhpL
aodh_keystone_password: DOHa................................b8q7
barbican_crypto_key: 4KwA....................................FsY=
barbican_database_password: PI73................................Fo7v
barbican_keystone_password: QE3Q................................zFv3
barbican_p11_password: HfWS................................6xOn
bifrost_ssh_key:
  private_key: '-----BEGIN PRIVATE KEY-----

    MIIJ........................................................kg64

Nous devons maintenant configurer le second fichier copié précédemment : /etc/kolla/globals.yml. Il s'agit du fichier de configuration principal pour kolla. C'est de lui que vont être extrait tous les paramètres nécessaires à l'installation d'un openstack. La configuration réseau, quels services déployer, etc...

VOici le strict minimum à vérifier/configurer (pour plus d'information, se reporter à la doc officielle kolla):

network_interface: "ens3" # mettez ici l'interface réseau principale de la machine sur laquelle l'openstack sera déployé. C'est l'interface réseau qui sera utilisée pour l'administration de l'openstack

neutron_external_interface: "ens4" # Il s'agit de l'interface réseau qui sera utilisée pour les communications entres les VM et l'extérieur de l'openstack

kolla_internal_vip_address: "172.20.2.121" # Il faut indiquer une adresse IP non-utilisée sur l'interface "network_interface" ci-dessus. Elle servira de vIP (IP flotante) pour accéder aux API de l'openstack, ainsi que la webUI horizon

Vous pouvez parcourir ce fichier, les variables importantes sont commentées et toutes ont des valeurs par défaut qui vous satisferont en première utilisation.

Déploiement

Le déploiement proprement dit

Dans l'ordre, on va installer les dépendances bas-niveau sur l'host, puis y déployer openstack après quelques vérifications.

kolla-ansible -i ./all-in-one bootstrap-servers
kolla-ansible -i ./all-in-one prechecks
kolla-ansible -i ./all-in-one deploy

A savoir, j'ai eu cette erreur, lors de la première commande, sur un host en Debian 10 :

TASK [baremetal : Install docker apt gpg key] *************************************************************************************************************************************
fatal: [etienne-kolla-test1]: FAILED! => {"changed": false, "msg": "Failed to find required executable gpg in paths: /usr/local/sbin:/usr/local/bin:/usr/sbin:/usr/bin:/sbin:/bin"}

Ça se règle avec l'installation de gnupg dessus à la main (apt install gnupg sur l'host openstask).

La vérification

Un fois que tout est terminé, vous pouvez vous rendre sur l'interface webUI horizon http://172.20.2.121/, où l'adresse IP est celle renseignée dans la variable kolla_internal_vip_address précédemment. Vous devriez arriver sur la page d'authentification d'horizon. Le login par défaut est admin et le mot de passe associé est indiqué dans la variable keystone_admin_password présente dans le fichier /etc/kolla/passwords.yml.

Il est possible de récupérer simplement et rapidement le fichier RC pour intéragir avec le nouvel openstack, sans devoir passer par la webUI horizon. Pour cela, lancez cette commande :

kolla-ansible -i ./all-in-one -e 'node_config=/where/you/want' post-deploy

A savoir, l'argument -e 'node_config=... n'est pas obligatoire, mais sans cela, kolla-ansible va essayer de créer le fichier RC dans /etc/kolla. A titre perso, je pense que c'est moyen, d'où cet ajout. Deuxième chose, vous pourriez avoir une erreur selinux (ça a été mon cas, sur ma Fedora). Ca se règle avec un pip install selinux.

Instancier une VM dans un openstack en CLI

2021-05-19T15:00:00+02:00

On va partir du principe qu'on vous a fourni un accès à une plateforme openstack. Cela veut dire qu'on vous a donné ces informations-ci, au minimum :

une URL (généralement celle de la web-GUI horizon¹, du style https://horizon.openstack.example.org/)
un login
et son mot de passe associé.

Il faut savoir que les informations ci-dessus sont le strict minimum pour se connecter à la web-GUI, mais ne sont pas suffisantes pour vraiment travailler avec openstack. En effet, il manque d'autres informations, pour pouvoir utiliser l'API d'openstack. Typiquement, l'URL du keystone², un "project id", etc...

La bonne pratique est la création d'un "RC file", un simple fichier sh qui mettra en place les bonnes variables d'environnement dont la CLI d'openstask a besoin, et de faire un source de ce fichier avant de travailler. Vous pouvez le créer vous-même, mais il faudra qu'on vous fournisse quand même les info manquantes. Le plus aisé, pour cette étape, est quand même de passer par la Web-GUI Horizon.

Le passage quasi-obligé de la web-GUI pour le fichier RC

La première chose à faire, donc, est de récupérer ces informations supplémentaires. Ça se passe sur la web-GUI à cette adresse : https://horizon.openstack.example.org/project/api_access/. Téléchargez simplement le fichier RC que vous propose, en haut à droite :

Jetons un œil au contenu de ce fichier :

> grep -v '#' openstack-rc.sh
export OS_AUTH_URL=https://horizon.openstack.example.org:5000/v3
export OS_PROJECT_ID=718336....................b8453d
export OS_PROJECT_NAME="sandbox"
export OS_USER_DOMAIN_NAME="mycompany"
if [ -z "$OS_USER_DOMAIN_NAME" ]; then unset OS_USER_DOMAIN_NAME; fi
export OS_PROJECT_DOMAIN_ID="19e48......................8c18a"
if [ -z "$OS_PROJECT_DOMAIN_ID" ]; then unset OS_PROJECT_DOMAIN_ID; fi
unset OS_TENANT_ID
unset OS_TENANT_NAME
export OS_USERNAME="myusername"
echo "Please enter your OpenStack Password for project $OS_PROJECT_NAME as user $OS_USERNAME: "
read -sr OS_PASSWORD_INPUT
export OS_PASSWORD=$OS_PASSWORD_INPUT
export OS_REGION_NAME="region1"
if [ -z "$OS_REGION_NAME" ]; then unset OS_REGION_NAME; fi
export OS_INTERFACE=public
export OS_IDENTITY_API_VERSION=3

Si comme moi, vous être plutôt adepte du shell fish, voici le fichier rc transposé pour ce shell, c'est cadeau :

set -gx OS_AUTH_URL https://horizon.openstack.example.org:5000/v3
set -gx OS_PROJECT_ID 718336....................b8453d
set -gx OS_PROJECT_NAME sandbox
set -gx OS_USER_DOMAIN_NAME mycompany
set -gx OS_PROJECT_DOMAIN_ID 19e48......................8c18a
set -e OS_TENANT_ID
set -e OS_TENANT_NAME

set -gx OS_USERNAME user
echo "Please enter your OpenStack Password for project $OS_PROJECT_NAME as user $OS_USERNAME: "
read -s OS_PASSWORD_INPUT
set -gx OS_PASSWORD $OS_PASSWORD_INPUT

set -gx OS_REGION_NAME region1
set -gx OS_INTERFACE public 
set -gx OS_IDENTITY_API_VERSION 3

Installation de la CLI cliente openstask

Ça paraît évident, mais vous allez avoir besoin d'un shell linux (bash généralement ou fish pour moi), et de python. Sur mon poste (Fedora), l'installation en virtualenv se passe comme ça :

sudo dnf install python3-devel python3-pip python3-virtualenv
virtualenv -p python3 venv
. venv/bin/activate.fish # ou . venv/bin/activate avec bash
pip install python-openstackclient

Testons maintenant que tout est bon :

. openstack-rc.fish # ou . openstack-rc.sh avec bash
openstack server list

Si tout se passe bien, vous devriez vous voir répondre quelque chose dans ce genre :

+--------------------------------------+---------------------+---------------+-----------------------------+---------------------+--------------+
| ID                                   | Name                | Status        | Networks                    | Image               | Flavor       |
+--------------------------------------+---------------------+---------------+-----------------------------+---------------------+--------------+
| 8a0...46-4..1-4..7-8..b-7b........ea | sandbox-test-test1  | ACTIVE        | internal=172.20.X.Y         | Debian-10           | c2.medium    |
| 35c...57-a..3-4..1-b..0-30........f0 | int-ubu-user39--6   | ACTIVE        | provider=10.8.X.Y           | Ubuntu-20.04        | c2.tiny      |
[...]
+--------------------------------------+---------------------+---------------+-----------------------------+---------------------+--------------+

Bravo !

Commandes utiles avant de créer votre première VM dans openstack

Avant de créer sa première VM au sein d'openstack, il faut savoir qu'elle image de base on peut utiliser, quelle taille de VM est posible, quel réseau, etc... Pour savoir tout cela, voici quelques commandes qui vont vous y aider.

Quelle taille (flavor) ?

Quelle taille de VM voulez-vous, et surtout, que propose votre fournisseur openstack ? Vous pouvez le savoir avec cette commande :

> openstack flavor list
+--------------------------------------+-----------------+-------+------+-----------+-------+-----------+
| ID                                   | Name            |   RAM | Disk | Ephemeral | VCPUs | Is Public |
+--------------------------------------+-----------------+-------+------+-----------+-------+-----------+
| 11....94-6629-444d-ab2d-f6........83 | c2.medium       |  4096 |   20 |         0 |     2 | True      |
| 1a....34-47f6-4417-a559-13........92 | c8.large        | 12288 |   80 |         0 |     8 | True      |
[...]
+--------------------------------------+-----------------+-------+------+-----------+-------+-----------+

Quelle image de base ?

Quelle image de base pouvez-vous utiliser ? Généralement, vous ne pouvez pas utiliser toutes les distributions linux existantes, mais juste quelques unes parmis un catalogue, catalogue qui se récupère ainsi :

> openstack image list
+--------------------------------------+---------------------------+--------+
| ID                                   | Name                      | Status |
+--------------------------------------+---------------------------+--------+
| 4d....db-cdee-4f08-b37e-71........fd | CentOS-7                  | active |
| 1b....63-27de-4b0c-bca9-c6........52 | CentOS-8                  | active |
| e4....3a-00e1-432d-b0eb-8d........69 | Ubuntu-20.04              | active |
| ea....5f-e72d-4da3-8f04-5d........3c | Debian-10                 | active |
[...]
+--------------------------------------+---------------------------+--------+

Quel réseau lui attacher ?

Votre VM va avoir besoin d'être connectée sur un réseau pour pouvoir communiquer et que vous puissiez vous y connecter. Pour avoir la liste, je pense que maintenant, vous devez commencer à deviner :

> openstack network list
+--------------------------------------+-------------------+--------------------------------------+
| ID                                   | Name              | Subnets                              |
+--------------------------------------+-------------------+--------------------------------------+
| 07....1a-09b9-49e6-9b09-1b........5c | internal          | 1a....5e-536d-4889-ae47-ca........02 |
| 08....56-76ca-4c85-b0d9-bb........6e | public            | ff....59-43b0-4620-a225-da........8b |
[...]
+--------------------------------------+-------------------+--------------------------------------+

Quel filtrage (security group) ?

Il faut que vous puissiez vous connecter en SSH à votre VM, il faut donc lui appliquer un "security group" qui l'autorise. Dans mon cas, il en existe un bien nommé "ssh".

> openstack security group list
+--------------------------------------+-------------+------------------------+----------------------------------+---------+
| ID                                   | Name        | Description            | Project                          | Tags    |
+--------------------------------------+-------------+------------------------+----------------------------------+---------+
| 0f....ee-497b-4917-8569-ae........ea | default     | Default security group | 71............................3d | []      |
| 29....82-f29a-470b-a7bf-cd........20 | ssh         |                        | 71............................3d | []      |
[...]
+--------------------------------------+-------------+------------------------+----------------------------------+---------+

Quelle clé SSH ?

On sait tous que se connecter en SSH sur un serveur avec un mot de passe, c'est pas génial. Du coup, il faut indiquer une pair de clé à openstask. Si vous en avez déjà inscrites dans openstack, c'est facile, un coup de openstack keypair list devrait suffir, mais si non, il faut le faire :

> openstack keypair list

> openstack keypair create --public-key ~/.ssh/id_rsa.pub ssh-rsa-etienne
+-------------+------------------------------------------------------------------+
| Field       | Value                                                            |
+-------------+------------------------------------------------------------------+
| created_at  | None                                                             |
| fingerprint | d9:xx:xx:xx:xx:xx:xx:xx:xx:xx:xx:xx:xx:xx:xx:cb                  |
| id          | ssh-rsa-etienne                                                  |
| is_deleted  | None                                                             |
| name        | ssh-rsa-etienne                                                  |
| type        | ssh                                                              |
| user_id     | 8e............................................................00 |
+-------------+------------------------------------------------------------------+
> openstack keypair list
+-----------------+-------------------------------------------------+------+
| Name            | Fingerprint                                     | Type |
+-----------------+-------------------------------------------------+------+
| ssh-rsa-etienne | d9:xx:xx:xx:xx:xx:xx:xx:xx:xx:xx:xx:xx:xx:xx:cb | ssh  |
+-----------------+-------------------------------------------------+------+

Créons notre premier VM avec openstack

Voici la commande qu'il faut utiliser pour créer une VM dans votre openstack, ainsi que sa syntaxe.

openstack server create --flavor {FlavorID-or-FlavorName} --image {ImageID-or-ImageName}  --nic net-id={NetworkID-or-NetworkName} --security-group {SecurityGroupID-SecurityGroupName} –key-name {KeypairName} <VM_Name>

Exemple :

> openstack server create --flavor c2.medium --image Debian-10  --nic net-id=internal --security-group ssh -–key-name ssh-rsa-etienne sandbox-test-user1
+-----------------------------+------------------------------------------------------------------+
| Field                       | Value                                                            |
+-----------------------------+------------------------------------------------------------------+
| OS-DCF:diskConfig           | MANUAL                                                           |
| OS-EXT-AZ:availability_zone |                                                                  |
| OS-EXT-STS:power_state      | NOSTATE                                                          |
| OS-EXT-STS:task_state       | scheduling                                                       |
| OS-EXT-STS:vm_state         | building                                                         |
| OS-SRV-USG:launched_at      | None                                                             |
| OS-SRV-USG:terminated_at    | None                                                             |
| accessIPv4                  |                                                                  |
| accessIPv6                  |                                                                  |
| addresses                   |                                                                  |
| adminPass                   | xxxxxxxxxxxx                                                     |
| config_drive                |                                                                  |
| created                     | 2021-05-19T15:44:50Z                                             |
| flavor                      | c2.medium (11....94-6629-444d-ab2d-f6........83)                 |
| hostId                      |                                                                  |
| id                          | af....c2-562e-49b3-9848-f0........8d                             |
| image                       | Debian-10 (ea....5f-e72d-4da3-8f04-5d........3c)                 |
| key_name                    | ssh-rsa-etienne                                                  |
| name                        | sandbox-test-user1                                               |
| progress                    | 0                                                                |
| project_id                  | 71............................3d                                 |
| properties                  |                                                                  |
| security_groups             | name='29....92-f29a-470b-a7bf-cd........20'                      |
| status                      | BUILD                                                            |
| updated                     | 2021-05-19T15:44:50Z                                             |
| user_id                     | 8e............................................................00 |
| volumes_attached            |                                                                  |
+-----------------------------+------------------------------------------------------------------+

Vérification du résultat :

> openstack server list | grep sandbox-test-user1
| af....c2-562e-49b3-9848-f0........8d | sandbox-test-user1    | ACTIVE            | internal=172.20.X.Y                         | Debian-10           | c2.medium       |

La nouvelle VM est bien présente sur l'openstack.

> openstack server show sandbox-test-user1
+-----------------------------+------------------------------------------------------------------+
| Field                       | Value                                                            |
+-----------------------------+------------------------------------------------------------------+
| OS-DCF:diskConfig           | MANUAL                                                           |
| OS-EXT-AZ:availability_zone | nova                                                             |
| OS-EXT-STS:power_state      | Running                                                          |
| OS-EXT-STS:task_state       | None                                                             |
| OS-EXT-STS:vm_state         | active                                                           |
| OS-SRV-USG:launched_at      | 2021-05-19T15:44:56.000000                                       |
| OS-SRV-USG:terminated_at    | None                                                             |
| accessIPv4                  |                                                                  |
| accessIPv6                  |                                                                  |
| addresses                   | internal=172.20.X.Y                                              |
| config_drive                |                                                                  |
| created                     | 2021-05-19T15:44:50Z                                             |
| flavor                      | c2.medium (11....94-6629-444d-ab2d-f6........83)                 |
| hostId                      | 93....................................................99         |
| id                          | af....c2-562e-49b3-9848-f0........8d                             |
| image                       | Debian-10 (ea....5f-e72d-4da3-8f04-5d........3c)                 |
| key_name                    | ssh-rsa-etienne                                                  |
| name                        | sandbox-test-user1                                               |
| progress                    | 0                                                                |
| project_id                  | 71............................3d                                 |
| properties                  |                                                                  |
| security_groups             | name='ssh'                                                       |
| status                      | ACTIVE                                                           |
| updated                     | 2021-05-19T15:44:56Z                                             |
| user_id                     | 8e............................................................00 |
| volumes_attached            |                                                                  |
+-----------------------------+------------------------------------------------------------------+

Et son status est bien ACTIVE. Bravo.

Comment s'y connecter ?

Pour s'y connecter, dans l'immédiat, le plus facile est de lui assigner une floating IP. C'est une IP "publique" qu'on attache à la VM pour pouvoir la joindre depuis l'extérieur d'openstack. Sans cela, la VM existe, certes, mais vous ne pouvez pas vous y connecter directement.

J'imagine que maintenant, vous devez savoir comment procéder. On commence par lister les floating IP dosponible, pour ensuite en attacher une à la VM.

> openstack floating ip list
+--------------------------------------+---------------------+------------------+--------------------------------------+--------------------------------------+----------------------------------+
| ID                                   | Floating IP Address | Fixed IP Address | Port                                 | Floating Network                     | Project                          |
+--------------------------------------+---------------------+------------------+--------------------------------------+--------------------------------------+----------------------------------+
| 02....03-ad67-40f8-b580-cb........d1 | 10.8.X.Y            | None             | None                                 | 08....56-76ca-4c85-b0d9-bb........6e | 71............................3d |
| 19....32-72b4-494e-9bcb-2e........c0 | 10.8.X.Y            | 192.168.X.Y      | 04....16-0e56-4ad5-ae87-ac........c1 | 08....56-76ca-4c85-b0d9-bb........6e | 71............................3d |
[...]
+--------------------------------------+---------------------+------------------+--------------------------------------+--------------------------------------+----------------------------------+

Ici, on voit que la 1e floating IP est disponible, alors que la seconde non.

> openstack server add floating ip sandbox-test-user1 10.8.X.Y

Plus qu'à s'y connecter :

> ssh debian@10.8.X.Y
Linux sandbox-test-user1 4.19.0-10-amd64 #1 SMP Debian 4.19.132-1 (2020-07-24) x86_64

The programs included with the Debian GNU/Linux system are free software;
the exact distribution terms for each program are described in the
individual files in /usr/share/doc/*/copyright.

Debian GNU/Linux comes with ABSOLUTELY NO WARRANTY, to the extent
permitted by applicable law.
debian@sandbox-test-user1:~$

Bravo !

Ça sera tout pour aujourd'hui.

Openstack étant pensé en architecture micro-service, Horizon est le nom donné au service qui fait tourner la webui. ↩
Keystone est le micro-service chargé de tout ce qui a rapport à l'authentification au sein d'openstack. ↩

La passion dans l'informatique n'est pas synonyme de qualité de code

2020-03-23T19:00:00+01:00

Je suis un passionné

J'adore coder.

Que ça soit dit et compris, j'adore l'informatique.

Ce que je trouve génial, en tant que développeur, c'est qu'on peut batir un monde. On peut littéralement construire des mondes, des univers qui n'existent pas, et cela comme on l'entend. C'est encore mieux qu'un architecte, qu'un chef de chantier, qu'un manoeuvre, qu'un ouvrier, même tous ensemble. C'est la transposition des jeux de lego et meccano de mon enfance à l'age adulte et à l'échelle supérieure. Je ne suis plus limité par la taille de ma chambre, la fortune (ou plutôt son absence) de mes parents ou la mienne. Mon imagination devient ma seule limite.

Je code sur mon temps libre (enfin, beaucoup moins depuis que je suis marié puis papa). Et je batis des trucs. Vraiment.

A un moment, j'ai codé un SGBD, juste parce que je voulais savoir comment MySQL marchait (à ne pas utiliser en prod, SVP). A un autre moment, j'ai codé un moteur de recherche, juste parce que je voulais savoir comment google fonctionnait. Et il utilisait le SGBD précédemment cité. Et puis, j'ai aussi codé un site web d'aggrégation d'articles d'actualité, parce que je voulais créer un robot-écrivain et que je me suis dit que ça serait bête de perdre toute la matière première. J'ai même gagné de l'argent avec. J'ai commencé un nombre incalculable de projets perso, juste parce que je pouvais le faire : un jeu vidéo de sous-marin pour aveugle, un livre (oui, je code un livre, et alors), un système pour pouvoir lire mes BD/Comics/Mangas depuis n'importe où sans perdre l'avancement, un bot de trading de crypto-monnaie (à ne pas utiliser en vrai), des sites web pour la famille et les amis, plusieurs jeux vidéos mobiles qui ne sont jamais arrivés en prod, et pleins d'autres choses.

Alors, oui, j'aime vraaaaiiiiment coder. Mais ce n'est pas pour ça que je vais passer ma vie à le faire. Et encore moins coder 12h par jour pour un employeur.

Je suis aussi un professionnel

Mais au fait, pourquoi ne suis-je pas développeur ?

Aujourd'hui, je suis AdminSys Linux/SRE/DevOps, selon la définition que vous accordez à chacun de ces mots. En gros, je ne code pas tant que ça, au niveau professionnel. Je "code" pour industrialiser et automatiser de l'infra, mais je ne code pas d'appli/site web/logiciel que des clients finaux utiliseront.
Il y a plusieurs raisons simple à cela. Le première, c'est que j'aime coder, certes, mais le code ne fait pas tout. Le code doit tourner sur quelque chose, et ce quelque chose m'intéresse tout autant. La seconde, c'est que parfois "passion" et "profession" ne font pas bon ménage.

Tout le monde connait cette maxime :

Choisis un travail que tu aimes, et tu n'auras pas à travailler un seul jour dans ta vie.

Oui mais non, en fait.

Prenons l'exemple de la construction d'un pont. Construire un pont en lego/meccano/imprimante 3D peut être génial, apporter du fun, être une passion, etc... Mais ça n'a rien à voir avec la construction d'un pont sur lequel des trains ou des semi-remorques pleins devront passer. Les contraintes ne sont pas les mêmes. Les responsabilités aussi. L'écroulement d'un pont en lego dans ma chambre n'aura pas les mêmes conséquence que l'écroulement d'un pont autoroutier. Il en va de même pour beaucoup de passions. J'aime écouter et jouer de la musique (>30ans d'expérience d'instrument) et sonoriser pour mon association, et pourtant je ne sonoriserais jamais pour la radio/télé/enregistrement ou un concert live ou ne jouerais de la musique contre de l'argent.

C'est pareil pour le code. J'adore coder, mais coder en environnement professionnel n'est pas pareil que coder par passion.

Quand je code mon projet pour le fun, je n'ai pas la responsabilité de la vie de gens. On reparle de Boeing et du MCAS de ses 737-Max ? Ou des programmes en milieux hospitalier ? Dans ma vie professionnelle, j'ai eu à administrer des serveurs informatiques hospitaliers. Si ça ne marche pas, des gens meurent.

Je ne pense pas qu'une passion devrait avoir ce genre de responsabilités.

L'informatique est aussi une industrie, comme l'industrie nucléaire ou l'industrie automobile. Quand on pratique une activité professionnelle, certaines pratiques viennent se greffer. C'est aussi le cas dans l'informatique. En simplifiant, il y a beaucoup de bonnes pratiques, en informatique, qui devraient être des contraintes fortes quand on code de manière professionnelle. Pour l'industrie automobile, il y des crash-tests, des obligations de ceintures, d'airbags et d'émission de CO2, des vérifications de ceci et de cela. Il existe des bonnes pratiques qui correspondent à la même chose : tests unitaires, d'intégrations, d'intrusion, test-driven development, CI/CD, etc... et j'en passe.

Et ces bonnes pratiques devraient, à mon avis, être autant obligatoires et contraignantes que ne le sont les obligations et tests dans l'automobile. Et toutes ses choses, sont nécessaires.

Mais elle ne sont pas fun (au moins pour moi). Elles ne sont pas passionnantes, mais il faut les faire.
Je ne cherche pas à m'en convaincre, je le suis déjà et autant que je le peux, j'essaye d'obliger mes co-équipiers à les pratiquer. Mais ce n'est pas comme ça que je code pour la passion. Oui, c'est un fait, la plupart de mes projets perso n'ont pas de tests unitaires. Même si mes projets perso sont en partie en CI/CD, ils ne sont pas "test-driven", etc...

C'est pour ça que coder n'est pas mon activité professionnelle principale.

On ne code pas de la même manière pour une passion que pour son job.

D'un autre côté, c'est également pour ça aussi, qu'ayant bien compris l'importance de ces contraintes, mon poste actuel me permet d'essayer de les faire appliquer autant que je le peux. Au travail. Pas sur mes projets perso chez moi.

Pour que la passion reste une passion

Dernière raison que je vais détailler ici : il faut que la passion reste.

Coder est une de mes passions. J'en ai d'autres. Et j'aimerais qu'elles restent à leurs place de passion. Je ne veux pas perdre la passion de coder. Car à imposer des contraintes (même si elles sont nécessaire), la passion peut partir. C'est pour cela que mes projets perso n'ont (pour la plupart) pas de tests unitaires, etc... et que je m'impose à moi une règle impérieuse : je fais mes horaires.

Ca ne veut pas dire que je serais pointilleux à la minutes près et sous-performant au travail, loin de là. Ca ne veut pas dire que je ne ferais pas un peu d'heure sup' de temps en temps, ou en cas de coup dur, mais ça doit rester anecdotique. Ca ne veut pas dire que je n'aime pas mon travail, pas du tout.

Faire uniquement mes heures, ça veut dire plusieurs choses pour moi :

Ca veut dire que je respecte un contrat. Parfois, on a tendance à oublier, mais un contrat n'est pas à prendre à la légère, il a une valeur juridique et comporte des clauses contraignantes pour le bon profit de 2 parties : moi et mon employeur. Par exemple, je reçois une compensation financière pour le temps dont mon employeur profite de ma science. Travailler plus pour le même salaire rompt virtuellement le contrat en cela qu'il devient plus profitable pour mon employeur que pour moi.
Ca veut dire que je dispose de temps pour me reposer et profiter de ma famille. Je serais donc plus performant (en qualité de travail, ainsi qu'en quantité de travail par unité de temps), si je suis reposé.
Ca veut finalement dire que je disposerais aussi de temps pour assouvir et entretenir mes passions, y compris le code.

In fine, ça me permet de pratiquer ma passion et donc d'être meilleur dans ma passion. Pour mon code. Et donc, aussi pour mon travail.

En conclusion, quand je vois des offres d'emplois qui demandent des gens "passionnés", j'ai toujours tendance à me méfier. Pas parce que je ne suis pas passionné, loin de là. Mais parce que coder par passion, n'est pas pareil que coder pour un employeur. Et s'ils ne veulent que des développeurs passionnés, je ne veux pas imaginer la qualité de ce qu'ils produisent.

Je ne code pas de la même manière pour le fun ou pour le travail.

Si vous m'embauchez, vous embauchez un professionnel, qui fera un travail de qualité professionnelle. Avec tests unitaires, "test-driven", et cetera... Pas un amateur qui code par passion. Ca, je le réserve pour l'amusement chez moi.

L'interview qui dérappe

2019-08-29T15:00:00+02:00

Les prémices

Dernièrement, je passais un entretien pour un job de "DevOps Senior" (hors SSII, précision importante). Au bout de 3 entretiens, on me prévient que le prochain sera technique. Normal, me direz-vous. Je tique quand même un peu qu'il faille autant d'entretiens : on en sera au 4e, toujours sans avoir vu de RH, et sans l'ombre d'une proposition.

Là où ça se gâte, c'est que je devrais passer cet entretien technique après 20h, en remote synchrone, de chez moi. Donc, après ma journée de travail normale, et après mon second "boulot" de papa. Oui, j'ai 2 enfants en bas-âge dont je m'occupe en rentrant du boulot : préparation du souper, distribution du souper aux enfants, bains des enfants, coucher des enfants (avec l'histoire et tout le rituel). Tout parent de jeunes enfants sait que ce n'est pas de tout repos. A 20h, on n'a qu'une envie (pire qu'une envie, j'oserais parler même de capacité physique et intellectuelle), c'est de s'écrouler dans un canapé après une douche régénératrice.

L'entretien

Voici le problème que m'a proposé la personne au téléphone et sur un tableau blanc partagé via internet :
Etant donnée cette entrée : [2, 98, 67, 33, 42, 50, 58, 50, 50], codez la fonction qui donne cette sortie : [(2,98), (67,33), (42,58), (50,50)].

J'ai bien demandé avant de coder, il ne regardait pas à la qualité du code pour cet entretien, il faut juste que ça marche. OK. Je propose une première solution quick&dirty fonctionnelle au bout de 10 minutes (je rappelle qu'il est passé 20h, après une journée bien remplie de support).

Ca marche, parfait. L'examinateur change alors l'énoncé avec cette entrée : [2, 98, 67, 33, 42, 50, 58, 50, 50, 50] pour cette sortie : [(2,98), (67,33), (42,58), (50,50), (50,50)]. En changeant l'entrée ainsi, mon code précédent ne renvoie pas la bonne sortie.

Je passe donc les 20-30 prochaines minutes à galérer pour corriger/produire un code qui répond au nouveau problème, tout en répondant aux questions techniques (de programmation, ce détail à son importance) de l'examinateur.

Il est 20h30-20h40 quand je sors enfin un code fonctionnel répondant au problème. Voici mon code final :

input = [2, 98, 67, 33, 42, 50, 58, 50, 50, 50]
output = []

print('input', input)
for i in input:
        try:
                counter_index = input.index(100-i)
                counter = input.pop(counter_index)
                output.append((i, 100-i))
        except:
                pass
print('output', output)

Sortie :

etienne@computer:~/code$ python3 temp.py
input [2, 98, 67, 33, 42, 50, 58, 50, 50, 50]
output [(2, 98), (67, 33), (42, 58), (50, 50), (50, 50)]

La suite

Quelle a été la suite ?
Hé bien, d'après le ton de sa voix et les questions qu'il a posé ensuite, l'examinateur doutait clairement de mes compétences et de mon CV.

C'était il y a plus d'un mois, et je n'ai jamais eu de retour. Pas de mail, ni d'appel téléphonique. Rien. Nada. Silence radio.

Pourquoi ça a foiré, de mon point de vue de candidat ?

faire un entretien après 20h est une très mauvaise idée. Pour de multiples raisons :
- organisation familiale : un "senior" a au moins 10 ans d'expérience, et donc plus de 30 ans et une forte probabilité d'avoir des enfants. Passer un entretien en journée, ça se fait bien, en terme d'organisation. En soirée, il faut composer avec le conjoint et les enfants et l'organisation qui tourne autour (repas de la famille à cuisiner/manger/faire manger, toilettes des petits enfants, devoirs des grands enfants, moments familliaux, etc...).
- fatigue : à 20h, la fatigue se fait sentir après une journée normale et complète de travail. Et de vie de famille.
l'entretien technique n'était pas du tout adapté ni au candidat (moi), ni au poste (de ce que j'avais pu en comprendre dans les 3 entretiens précédents) :
- juger un adminsys/devops (c'est mon job actuel, et depuis 2012 (pour moi, DevOps/SRE, c'est de l'adminsys 2.0 (oui, ça se discute))) sur ses compétences en programmation/algorythmie est une très mauvaise idée. Pour paraphraser Albert, c'est comme juger un poisson sur sa capacité à grimper un arbre.
- juger quelqu'un qui a 10 ans d'expérience avec un problème théorique scolaire (clairement, le problème posé est ce qu'on donne en exercice aux étudiants) et attendre une réponse scolaire (répondre au tableau ou sur papier en 2 minutes avec un code fonctionnel pendant que l'examinateur pose des questions), c'est faire un oubli total et volontaire de son expérience et de tout ce qu'il a fait depuis qu'il est sorti d'école.

Effectivement, vu comme ça, j'ai été particulièrement mauvais : j'ai mis 40 minutes à pondre un bout de code répondant à un problème scolaire d'algorythmie pour développeurs débutants.

En regardant le contexte, on comprend pourquoi : il était 20h (11h du matin pour mon examinateur), j'étais fatigué de ma journée de travail normale et de ma seconde vie de papa, et je n'ai pas codé comme ça/ce genre de chose depuis plus de 10 ans.

Mon examinateur n'a pas du tout vu le contexte et m'a catalogué/black-listé.

Dommage.

Programmer l'exécution d'un script en avance sur linux

2019-07-30T12:00:00+02:00

Besoin : lancer un script sur des serveurs linux à une heure donnée, sans jenkins

On doit parfois lancer un script bash sur des serveurs linux (par exemple pour faire de la maintenance ou redémarrer un service hors horaires d'utilisation). Si on a un jenkins avec ansible et une connexion directe aux serveurs, on va dire que c'est facile.

Mais comment faire quand on a pas de jenkins ou pas une connexion stable. On peut utiliser le cron local à chaque serveur.

L'astuce, c'est de lancer le script avec une tâche cron et de supprimer cette tâche cron immédiatement après son lancement.

Solution : tâche cron auto-destructible

Passons au code directement, les explications après :

$ crontab -l
0 20 * * * bash /opt/cron/mon_script.sh

$ cat /opt/cron/mon_script.sh
#!/usr/bin/env sh

# Remove self from cron
crontab -l | grep -v '/opt/cron/mon_script.sh'  | crontab -

# Changement de la version dans la conf nrpe
sed -i 's#command\[check_app_version\].*#command\[check_app_version\]=/usr/lib64/nagios/plugins/check_app_version 1.9.45#' /etc/nrpe.d/common.cfg
# Restart le service nrpe
systemctl restart nrpe

# do the stuff here
# par exemple, met à jour l'appli
# blablabla

Ok, décortiquons.

En premières lignes, on voit que le script bash /opt/cron/mon_script.sh est croné tous les jours à 20h.
Ensuite, on a le détail du-dit script.

Et sa première action est de s'enlever de cron.
Voilà.
Fin de l'astuce.

Bon, comme on essaye de faire des choses bien, et qu'il n'y aura pas retour sur l'action entreprise, la deuxième chose faite est de modifier la supervision pour dire "on s'attend à être dans cet état-là". Comme ça, si jamais la suite ne se passe pas bien, un coup d'oeil à la supervision nous l'indiquera avec une belle alerte.

Découverte du format HDF5 en python

2019-07-08T15:00:00+02:00

La map d'un jeu open-world, ça représente quoi ?

Ceux qui me connaissent savent que je code sur mon temps libre. Et il y a quelques temps, je me suis mis en tête de coder pour le fun un petit jeu open-world sur le thème du monde sous-marin. Très vite, la problématique du stockage de la carte de ce jeu s'est posée. Comment stocker ça correctement.

En gros, voilà comment ça se présente : on est dans un jeu sous-marin, donc je dois pouvoir stocker la profondeur (on utilisera un integer pour faire simple) de n'importe quel endroit sur la carte. En partant sur une granularité de 1m², si je veux une carte de 5km*5km, ça donne 5000*5000=25 millions de points à stocker¹.

25 millions d'integer, ça prend grosso-modo 50Mo. Sans structure et en utilisant des short int de 2 octets. Cool !

En RAM, ça passe large, même sur un raspberry pi ! Plus qu'à stocker ça sur disque.

Place au code

Flat

Pour le dev, on va commencer par stocker ça dans des fichiers "flat", tout simple.

Admettons que j'ai une fonction depth(x,y) qui pour chaque coordonnée (x,y) me génère une profondeur.

Génération de ce fichier map flat :

data = ''
for y in range(0, int(GAME_HEIGHT)):
    for x in range(0, int(GAME_WIDTH)):
        data += '{} '.format(int(depth(x,y)))
    data += '\n'
with open(output_file, "w") as f:
    f.write(data)

Facile !

Et ça donne un fichier d'un peu moins de 100Mo. Et 12Mo gzippé. Par contre, ça veut dire que pour l'utiliser, il faut éventuelle le dézipper et écrire toute la mécanique d'import du fichier en RAM, et de requêtage.

Ca reste clairement jouable !

Sqlite

Et si on avait envie d'utiliser un format de BDD parce qu'on aime ça ? genre du sqlite, ça donnerait quoi ? En plus, c'est fourni en standard dans python.

import sqlite3
conn = sqlite3.connect(output_file+'.tmp')
cur = conn.cursor()
cur.execute('CREATE TABLE map (x SMALLINT, y SMALLINT, h SMALLINT);')
for y in range(0, int(GAME_HEIGHT)):
    for x in range(0, int(GAME_WIDTH)):
        c = int(depth(x,y))
        cur.execute("INSERT INTO map VALUES (?,?,?)", (x, y, c))

conn.commit()
cur.execute('VACUUM;')
conn.close()

Bon, par contre, ça nous donne un fichier d'un peu plus de 400Mo, pour les mêmes données que précédemment. Plutôt embêtant. Et même inenvisageable.

HDF5

Devant les résultats obtenus pour Sqlite, je me suis mis en tête de chercher un autre format de fichier à-la sqlite, mais qui donnerait des fichiers plus petits. Et j'ai fini par trouvé le HDF5. En python, ça s'utilise avec la lib h5py ou pytables. Je suis parti avec le dernier.

import tables
db_struct = {
    'x': tables.Int16Col(),
    'y': tables.Int16Col(),
    'h': tables.Int16Col()
}

h5file = tables.open_file(output_file, mode="w", title='Map')
filters = tables.Filters(complevel=9)       # petit truc ici : je demande la compression au max avec les algo de commpresison standards par defaut de hdf5
group = h5file.create_group('/', 'group', 'Group')
table = h5file.create_table(group, 'map', db_struct, filters=filters)

heights = table.row

for y in range(0, int(GAME_HEIGHT)):
    for x in range(0, int(GAME_WIDTH)):
        heights['x'] = x
        heights['y'] = y
        heights['h'] = int(depth(x,y))
        heights.append()

table.flush()
table.flush()
h5file.close()

Là, c'est tout de suite mieux ! On a directement un fichier de 12Mo, et qui s'utilise peu ou prou comme un fichier Sqlite :

h5file = tables.open_file(self.m5p, mode='r')
rows = self.h5file.root.group.map.row.table
depth = rows.read_where('((x=={}) & (y=={}))'.format(x,y))['h'][0]
h5file.close()

Banco pour HDF5, alors !

5km*5km, c'est juste le début, j'espère bien en générer des plus grande, mais là, je bloque sur d'autres choses :-) ↩

Faire une demande d'intervention

2019-05-10T09:00:00+02:00

Contexte professionnel

Hier, un dev m’a taggé sur un ticket relatif à la prod bleue. Avec « Prod Bleue » indiqué dans le titre et dans les commentaires/tags/whatever.
Il m’a demandé de regarder un problème de connexion. Je regarde et ne trouve rien. Je creuse les logs, les services systèmes, toujours rien. Je l’appelle par skype, on cherche ensemble, j’indique à l’oral toutes les opérations que je fais et sur quels serveurs je regarde, mais je ne trouve rien alors que lui oui. Jusqu’à ce qu’il me dise que son problème était sur un serveur copieprod-jaune, 15-20 minutes plus tard.

Certes ce cas est extrême. Mais il s'est bien produit et n'aurait jamais dû arrivé. Et ce n'était pas la première fois depuis que je suis arrivé à mon poste actuel.
Avec les bonnes informations tout de suite, le problème aurait été résolu en quelques secondes, au lieu de la bonne demi-heure du cas ci-dessus qui a tendance à se reproduire de plus en plus dernièrement.

Cet état de fait me pose problème pour 3 raisons :

Je perds du temps à faire des choses, alors qu’avec les bonnes informations, ça pourrait être résolu rapidement
C’est du temps que je ne passe pas à améliorer notre infra/supervision/scripts de déploiement/etc…
Ça m’énerve (littéralement) que certains gens ne sachent pas ce qui me semblait être la base d’une demande d’intervention

Du coup, j’ai créé une page sur le wiki de l'équipe avec le contenu ci-après.

L’idée derrière tout ça est de formaliser le minimum d'information à me fournir pour toute demande d’intervention (« ça marche pas, tu peux regarder ? »), d’en informer tout le monde, et de renvoyer vers cette page sans vergogne toutes les demandes ne fournissant pas ce dont j’ai besoin pour ne pas perdre du temps¹.

Petite précision : dans mon environnement professionnel actuel, on déploie les appli/BDD/etc... directement sur des VMs, sans utiliser docker.

Etant seul pour gérer toute l'administration système (cf métriques Nagios : pas loin de 100 serveurs dont 60 en production et on en rajoute 5-10 chaque mois) et faire du support aux développeurs/testeurs/etc... en plus des développements propres à l'adminsys/devops, j'ai besoin que vous suiviez quelques règles pour que contacter l'adminsys soit rapide et efficace pour vous comme pour moi.

Contexte : Où, Quoi, Pourquoi

La règle d'or

Voici une règle d'or que doit contenir toute demande : un contexte.
C'est obligatoire pour que la demande soit traitée efficacement.

Toute demande sans contexte se verra systématiquement rejetée avec un lien vers cette page

Le plus simple pour me fournir un contexte est de répondre à ces 3 questions : où ?, quoi ?, pourquoi ?

Où : quel environnement ? prod ou pas prod ? quel serveur ? le plus simple est de fournir son adresse IP ou l'URL sur laquelle apparaît le problème
Quoi : que se passe-t-il ? que voyez-vous ? quel est le message d'erreur ?
Pourquoi : Pourquoi est-ce une erreur pour vous ? à quoi vous attendiez-vous ?

Moyen mnémotechnique :

Pour vous rappeler cette règle d'or, dites-vous que l'adminsys est occupé à autre chose avant que vous ne le contactiez.

occupé => OQP => Où, Quoi, Pourquoi

Précision

Parce que le diable se cache dans les détails, il faut s'appliquer à être le plus précis possible.

Précision du Où

"Il y a un problème sur l'environnement fushia" n'est pas précis : quel "fushia" (prod-fushia, test-fushia, uat-fushia) ? Quel serveur (serveur web, serveur bdd) ?

Simple et précis : l'adresse IP

Les serveurs ont cela de facile qu'il dispose d'un identifiant absolument unique qui les caractérise bien plus qu'un nom : une adresse IP. Soyez précis, fournissez l'adresse IP du serveur où vous constatez l'erreur.

Précision du Quoi

Une capture d'écran seule n'est pas suffisante. Par contre, accompagnée d'une explication de ce qu'il faut regarder dessus, avec citation du texte important à lire est bien mieux.
Pour qu'une ligne de log soit précise, elle doit contenir un horodatage (date + heure à la seconde près) et une indication succincte et explicite du problème.

Exemple de ce qu'il ne faut pas faire :
"Bonjour, il y a eu un problème hier sur le serveur 12.34.56.78. Voilà l'erreur : "java.lang.NullPointerException", tu peux regarder au plus vite ?"

Il n'y a pas d'horodatage précis (hier n'est pas précis quand on traite des opérations à la milliseconde près), et indiquer uniquement "java.lang.NullPointerException" ne permet pas d'analyser, donc de corriger le problème au plus vite, ce n'est donc pas une indication succincte et explicite.

Précision du Pourquoi

Une description d'une erreur n'est pas suffisante s'il n'y a pas d'indication de l'état normal.

Exemple :
"Bonjour, quand j'interroge le webservice http://example.com/api/getToto, ça me renvoie {"result": "tata"}, tu pourrais corriger ça ?"

Pour corriger, encore faut-il savoir ce que le webservice aurait dû répondre. D'où la nécessité de l'indiquer pour permettre de corriger le problème au plus vite.

Pourquoi imposer cette règle ?

Trouver et résoudre un problème avec un contexte se fait généralement en quelques minutes, voire en quelques secondes.
Sans contexte, il faut commencer à trouver le contexte, avant même de pouvoir chercher le problème, et cela prend souvent plusieurs dizaines de minutes (10 à 40 minutes).

Juste pour avoir un ordre d'idée :

10m : temps de déploiement d'une copie-prod
20m : temps de build d'une nouvelle version de l'application
40m : temps qu'il faut pour télécharger un nouvel ear sur tous les serveurs en même temps

Et tout ça, sans intervention de l'adminsys.
Si trouver le contexte d'un problème prend plus de temps que de déployer une copie-prod-X, c'est que la demande n'a pas été formulée avec assez de précision.

Le temps c'est de l'argent, et je coûte environ 1€/minute à l'entreprise pour laquelle je travaille. Alors, vous voulez la payer combien, votre résolution de bug ? en fournissant les bonnes informations tout de suite : 1€, sans fournir les bonnes informations : 30€. ↩

Watchtower, garder ses docker container à jour

2019-03-19T15:00:00+01:00

Garder ses soft tournant avec Docker à jour

Docker, c'est chouette. On peut faire tourner en totale autarcie n'importe quelle logiciel. Plus besoin de dédier une VM à un serveur applicatif.

Problème : comment on fait pour garder tout ça à jour. En effet, dans le cas "VM", un apt update && apt upgrade ou un yum update suffit dans la plupart des cas. C'est toujours valable pour les serveurs sur lesquels tournent docker, ainsi que pour le daemon docker lui-même, mais pour les soft tournant sous docker ?

Jusque là, je le faisais à la main : je récupèrais le flux RSS des releases (sur github ou sur le gitlab ou sur le blog sur soft) dans mon super lecteur de flux RSS autohébergé. Et quand une nouvelle release arrivait, j'exécutais à la main (ou via ansible) docker stop MonServiceHerberge && docker pull editeur/mon_service_herberge:latest && docker run --blablabla MonServiceHeberge.

Quand on a 2 ou 3 services hébergés, c'est encore gérable, mais quand on en a plusieurs dizaines et qu'en plus, ils ont chacun plusieurs briques (au hasard, nginx, par exemple), ça devient plus long à s'en occuper. Et je ne parle même pas des mises-à-jour des layers dockers. Alpine linux pour ne citer que lui.

Watchtower

Et c'est là que j'ai découvert Watchtower.

Je vous copie-colle sa description :

A process for watching your Docker containers and automatically restarting them whenever their base image is refreshed.

Belle promesse ! et en plus, on peut le déployer dans un docker.

Ok, comment ça marche ? Repompons sans vergogne la documentation officielle :

docker run -d \
  --name watchtower \
  -v /var/run/docker.sock:/var/run/docker.sock \
  v2tec/watchtower

Et concrêtement

Personnellement, en plus de serveurs git/jenkins/... codés par d'autres, j'héberge également des trucs que j'ai créé moi-même et que je mets moi-même à jour régulièrement. Et j'ai pu observé watchtower interférer dans ces derniers, les arrêter sans les redémarrer, etc..., alors qu'il est sans problème sur les images dockers récupérées depuis DockerHub.

Voici donc la configuration que j'utilise (codé dans ansible, non mais) :

docker run -d \
  --name Watchtower \
  -v /var/run/docker.sock:/var/run/docker.sock \
  --label=com.centurylinklabs.watchtower.enable=true
  v2tec/watchtower --cleanup --label-enable -s '@weekly'

Avec les variables d'environnement qui vont bien pour recevoir un rapport par e-mail à chaque update de docker. Ca lancera une vérification par semaine sur les docker containers qui ont le bon label (com.centurylinklabs.watchtower.enable=true) et il fera un peu de ménage dans les images qui ne sont plus utilisées.

Il ne me reste plus qu'à rajouter le label com.centurylinklabs.watchtower.enable=true à tous les docker containers dont je veux la mise-à-jour automatique. Les autres, ne seront pas toucher.

Ca me permet d'avoir l'esprit tranquille : j'ai des nextcloud, jenkins, gitea, openvpn, traefik, etc... qui sont toujours à jour. Et ça, c'est top !

SMTP-sink, tester l'envoi de mail

2019-03-11T17:30:00+01:00

La demande : fake-smtp pour l'envoi de mail pour tests

A mon boulot actuel, j'ai eu une demande intéressante : les développeurs désiraient avoir un serveur SMTP pour tester l'envoi de mail, y compris avec des data de prod (et donc les vraies adresses e-mail des clients), mais sans que les e-mails soient reçus par les clients.

Le plus simple était de démarrer un serveur postfix en interne et de tout envoyer dans /dev/null.

Mais les dev voulaient aussi pouvoir accéder aux e-mails envoyés pour pouvoir vérifier le formatage, le MIME, etc... Tout envoyer dans /dev/null ne peut pas convenir. J'ai donc mis en place un combo smtp-sink + partage samba sur un petit serveur linux.

La solution : smtp-sink

SMTP-sink est un soft de la suite postfix. Ca s'installe avec le package postfix (apt-get ou yum, à votre convenance), tout simplement.

Il a ça d'interessant qu'il est un serveur SMTP normal, qui accepte tout mail entrant, et le met dans un fichier sur disque. C'est tout ce qu'il fait. Il ne fera rien d'autre des e-mail que de les mettre dans un fichier. Il ne les enverra pas ailleurs. C'est parfait pour du debug !

ATTENTION : à ne pas faire sur un serveur qui écoute sur internet. Uniquement en interne et pour tests.

Ca s'utilise comme ça (en root pour pouvoir écouter sur le port 25) :

[root@outils-fakesmtp ~]# smtp-sink :25 100

Dans mon cas, voici l'exacte ligne de commande utilisée. Bon, OK, j'aurais du en faire un service (pas inclu dans le package postfix), je note ça dans ma TODO liste.

[root@outils-fakesmtp ~]# screen -dmSL smtp-sink smtp-sink -u mail -d '%Y%m%d-%Hh%M.' -R /var/mail/ -c :25 100

Expliquons :

screen : pour le lancer dans un screen, comme ça on peut le détacher et ça continuera à fonctionner. C'est d'ailleur ce qui est fait avec les options suivantes.
-dmSL smtp-sink : on crée puis détache le screen, avec du logging et comme nom de session "smtp-sink"
smtp-sink : la commande en elle-même
-u mail : le user avec lequel smtp-sink doit tourner, on ne va pas le laisser tourner en root
-d %Y%m%d-%Hh%M. : comment on nomme les fichiers (${année}${mois}${jour}-${heure}h${minute}.hash dans ce cas-ci). A noter qu'un hash est toujours ajouté en fin de fichier
-R /var/mail : où stocker les fichiers

C'est chouette, on peut voir les e-mails dans /var/mail :

[root@outils-fakesmtp ~]# ls /var/mail/
20190310-08h15.0ad30c02  20190311-08h46.2dfc539b

Il n'y a plus qu'à partager ce répertoire avec samba.

L'astuce en plus

Les dev peuvent parfois être et pointilleux et ignares (nul n'est parfait, et surtout pas moi 😜 ), et donc, quand ils ouvrent leur navigateur de fichier dans \\outils-fakesmtp\mail\, ils ne voient pas des "e-mails" qu'ils peuvent ouvrir en double-cliquant, uniquement des fichiers "bizarres".

Le plus simple est de renommer les fichiers pour leur ajouter une extension .eml, et comme on est DevOps, autant l'automatiser avec cette commande en tâche cron qui tournera toutes les minutes :

for f in `ls /var/mail/* | grep -v '.eml'`; do mv $f /var/mail/`basename $f `.eml; done; find /var/mail/ -type f -name '*.eml' -mtime +1 -exec rm {} \\;

(Pour ceux qui liront cette ligne de commande, vous noterez que la dernière commande est une commande de nettoyage pour éviter d'avoir un répertoire qui se rempli ad vitam æternam)

Je conviens que ce n'est pas optimal, mais je ne vais pas tout faire pour vous. 😉

Docker, LibVirt, Iptables

2019-01-07T09:00:00+01:00

Je fais tourner pour mon plaisir et mon auto-formation un homelab sur lequel il y a des VMs KVM. Dernièrement, j'ai revu une partie de mon infrastructure est me suis tourné vers docker pour certains services.

J'aurais pu faire tourné ces services dockers dans leur propre VM, mais j'ai voulu les mettre directement en bar-metal.

Problème, docker vient foutre la grouille dans mes règles pare-feu iptables, rendant impossible l'accès au réseau à mes VM. Honnêtement, quand on ne sait pas, on se dit que la cohabitation docker+KVM va être compliquées. Mais en fait, non, il y a une solution simple.

Demander à docker de ne pas intervenir dans iptables

Première possibilité : demander à docker de ne pas toucher à iptables. ça se fait relativement simplement en ajoutant --iptables=false à la ligne de commande qui démarre le daemon docker. C'est plutôt bien documenté sie le blog fralef.me.

Ou ajouter une clef:valeur "iptables": "false" dans le fichier de configuration de docker /etc/docker/daemon.json.

Le problème maintenant, c'est que vous allez devoir gérer les redirection de ports, etc... normalement gérés par docker en sous-main vous-même. Cf la doc officielle chez docker.

Remettre le forward accept dans iptables

La meilleur solution, à mon avis est de laisse docker son affaire, il le fait pas trop mal, mais juste remettre une seule rêgle iptables qui règlera tout (merci Paul Gorman) :

iptables -I FORWARD -i vbr0 -o vbr0 -j ACCEPT

N'oubliez-pas de sauver cette règle dans votre configuration iptables-persistant et vous serez bon.

Un temps pour tout (bis)

2018-05-29T19:00:00+02:00

J'ai lancé What.IsUp il y a quelques temps, maintenant.

Au départ, c'était uniquement à usage personnel, pour remplacer mon lecteur de flux RSS. Et je me suis dit, "Si ça me sert, ça pourrait aussi servir à d'autres, autant le mettre public sur internet". C'est comme cela qu'est né What.IsUp.

Le temps passe, et le site reçoit vraiment des visiteurs, jusqu'à des pics à 1500 visiteurs par jours. Moi, ça me fait halluciner.

Aujourd'hui, le serveur souffre beaucoup, le temps d'accès à chaque page s'est allongé à plusieurs secondes, ce qui est inadmissible. Les visiteurs ne sont plus là, ça se comprends parfaitement.

Le truc, c'est que je l'avais dimensionné pour environ 1 visiteur de temps en temps, pas autant que cela. Le serveur souffre, alors pour corriger cela, il faut modifier l'architecture du site, la base de donnée, les scripts d'analyse, etc... J'y ai déjà pas mal passé de temps pour améliorer ça, mais ce n'est pas assez, il faut prendre encore plus de temps pour revoir le fonctionnement dans sa globalité.

Malheureusement, ce temps, je ne l'ai plus. Ou plutôt, le temps que j'ai, je le passe à d'autres choses. Genre mon épouse et les 2 enfants que j'ai eu entretemps.

La décision a aussi été précipité à cause d'une future loi européenne qui pourrait porter préjudice à ce site : Les sites d'agrégation d'articles de journaux pourraient avoir à payer les journaux. Vu le "bénéfice" que je fais sur ce site, autant le fermer.

Pour être totalement honnête, voici quelques chiffres au moment où je ferme ce site :

en moyenne 300-400 visiteurs par jours, à comparer à la moyenne de 1200 il y a 2 ans.
101 journaux analysés toutes les heures
2748122 articles analysés depuis le debut du site (vous ne rêvez pas, ça fait bien 2,7 millions)
11Go de disque pris par la base de donnée.
120€ rapportés par la pub sur toute la durée de vie du site. Cela représente environ 5€/mois dans les meilleurs mois. Et moins d'1€/mois juste avant de le fermer. Ne pensez pas que je sois soudainement devenu riche, le serveur seul coute 12€/mois.

Un site meurt proprement, mais d'autres choses naissent en parallèle. A bientôt, peut-être, pour de nouvelles avantures ;-)

Servir son contenu statique avec Docker

2018-05-17T19:00:00+02:00

Docker est la technologie incontournable dans le monde de l'IT d'aujourd'hui. Elle peut être utilisée pour beaucoup de chose, mais ici, nous allons voir un cas d'usage simple : servir un contenu web statique en l'utilisant. En étant le plus minimaliste et le plus simple dans notre approche.

On va aussi se rajouter une contrainte supplémentaire, sinon, c'est pas drôle : je veux que le docker container soit aussi le plus minimaliste en termes d'utilisation ressources (disque, RAM, CPU), une fois en route. Et aussi, il faut que ça soit un peu rigolo à faire et sans prise de tête à configurer.

La voie royale : Nginx

Le plus simple et qui vient immédiatement à l'esprit est Nginx. Enfin, dans mon cas, car je le connais plutôt bien et qu'il est vraiment performant.

Pourquoi

Heu... vous connaissez Nginx, bien sûr, non ?

Ok, alors, présentons Nginx :

Nginx (pronounced "engine-x") is an open source reverse proxy server for HTTP, HTTPS, SMTP, POP3, and IMAP protocols, as well as a load balancer, HTTP cache, and a web server (origin server). The nginx project started with a strong focus on high concurrency, high performance and low memory usage.

En gros, Nginx est ultra performant pour du servir du contenu statique, il a été conçu pour ça et est beaucoup plus performant qu'Apache à tout point de vue pour cet usage particulier.

Code

Ok, comment fait-on, alors ? Simple : mettez juste le Dockerfile qui suit à la racine du contenu que vous voulez servir, buildez, et runnez, et fini.

FROM nginx:alpine
COPY . /usr/share/nginx/html

En détail, placez un fichier Dockerfile avec le contenu précédent (oui, juste ces 2 lignes) à la racine de votre dépôt git contenant vos fichiers statiques, puis faites ceci :

docker build -t static-content-server .
docker run -d -p "80:80" --name static-server static-content-server

Voilà. Je peux pas faire plus simple, je vous promets.

La voie de l'amusement

Le serveur web proprement dit

"Dis papa, comment on fait les serveurs web ?"
"Regarde ma fille, c'est facile. Tu peux même le faire toi-même"

Bon, c'est faisable en 15 lignes en go, mais si on en veut plus, un serveur web, avec doc incluse et quelques options sympa, ça se fait en ~250 lignes de go sur https://github.com/halverneus/static-file-server/blob/master/serve.go

Il faut git-cloner ce code, le builder et ensuite, on peut l'utiliser en l'incluant facile dans nos propre dépôt git.

D'abord, on build :

git clone https://github.com/halverneus/static-file-server.git
cd static-file-server
docker build -t static-file-server .

On met ça à la racine de notre dépôt git contenant les ressources statiques à servir:

FROM static-file-server
COPY . /web

Et ensuite, il faut builder et runner ce nouveau docker :

docker build -t static-content-server .
docker run -d -p "80:8080" --name static-server static-content-server

Avec Ansible

Et si on rajoutait du fun avec Ansible ? Commençons par un état des lieux :

user@computer:~/code$ tree startpage/
startpage/
├── Dockerfile
├── index.html
└── robots.txt

0 directories, 3 files

user@computer:~/code$ git -C startpage/ remote -v
origin  ssh://git@git.example.net/user/startpage.git (fetch)
origin  ssh://git@git.example.net/user/startpage.git (push)

user@computer:/home/code$ cat startpage/Dockerfile
FROM registry.example.net/static-file-server
COPY . /web

(Parce que je suis trop fainéant pour vous mettre des captures d'écran de dépôts git)

Voilà un petit playbook Ansible qui buildera, mettra dans une registry privée et fera tourner le serveur web pour vous servir le contenu de notre startpage contenu dans le dépôt git git.example.net/user/startpage.git.

- hosts: mon-super.serveur-perso.example.net
  tasks:

    - name: Get static-file-server code
      git:
              repo: https://github.com/halverneus/static-file-server.git
              dest: "{{ app_code_dir }}/static-file-server"
      register: git_pull_server

    - name: Build static-file-server
      docker_image:
              path: "{{ app_code_dir }}/static-file-server"
              name: medusa
              tag: latest
              push: yes
              force: yes
              repository: registry.example.net/static-file-server
      when: git_pull_server.after != git_pull_server.before

    - name: Get StartPage code
      git:
              repo: ssh://git@git.example.net/user/startpage.git
              dest: "{{ app_code_dir }}/startpage"
              key_file: "{{ app_data_dir }}/.ssh/id_rsa"
      register: git_pull

    - name: Build Startpage
      docker_image:
              path: "{{ app_code_dir }}/startpage"
              name: startpage
              tag: latest
              push: yes
              force: yes
              repository: registry.example.net/startpage
      when: git_pull.after != git_pull.before

    - name: Deploy StartPage
      docker_container:
              pull: yes
              name: StartPage
              image: registry.example.net/startpage:latest
              ports:  
                      - "80:8080"
              restart_policy: unless-stopped

PS : le playbook ansible est moche, il faut le découper en rôles, avec des handler, et tout et tout, mais ça, je vous laisse le faire ;-)

Pourquoi une startup ne devrait pas se fermer à l'embauche d'expérimentés

2018-01-30T19:00:00+01:00

Je suis depuis peu en écoute très forte du marché du travail. Les quelques entretiens téléphoniques que j'ai déjà eu m'ont amené à remettre en cause ma vision des startup et à sortir ce blogpost.

Startup = jeunes

Dans l'imaginaire collectif, la population qui monte une startup est généralement jeune. Genre fraichement sortie d'école de commerce ou d'ingénieur. C'en est tellement caricatural que même les créateurs de startup vont chercher à n'embaucher que des jeunes.

Caricatures de jeunes

Voyons ensemble quels sont les raisons à cela. Généralement, les jeunes :

coûtent moins cher (et le combo (véridique) : on est une startup, donc on est cool, par contre, on paye pas beaucoup, mais regarde, on aime Star Wars)
ont des horaires trèèèès flexibles (Les soirées pizza et les week-ends "hackaton", ils en sont même friants, autant leur proposer le plus possible)
sont facilement "enthousiasmable" (je vous invite d'ailleurs à lire l'origine de ce terme, c'est très intéressant : littérallement un enthousiaste est "en présence d'un dieu, possédé par un dieu")

Les vieux sont cons. D'ailleurs, ne les appelle-t-on pas "vieux cons" ?

A l'opposé, les moins jeunes (grosso-modo à partir du moment où le candidat est marié avec enfants) :

coûtent plus cher (conjoint+enfants+crédit, ça coûte cher)
ont des horaires pas du tout flexible (les enfants à couduire/chercher à l'école, et je ne parle pas des petits à emmener aux urgences parce que ces cons-là sont tout le temps malades)
sont plus critiques. Genre à voir qu'arriver au produit final va prendre tant de temps et coûter autant plutôt que de se mettre à coder tout de suite.

Et si le monde n'était pas aussi binaire

Pourtant, avoir un "sénior" pourrait être d'une grande valeur pour une startup. En effet, ils ne sont pas chers pour rien : leurs quelques années d'expérience leur permet d'être réalistes, de voir les problèmes arriver en avance et de coder plus vite et efficacement.

Expérience = Assurance

L'expérimenté a déjà vu beaucoup de problèmes. Et surtout, leur correction. Et encore mieux : comment les éviter. Je ne parle pas forcément de bug type "oubli de virgule", ça arrive même aux meilleurs. Par contre, l'intérêt du CI/CD, des tests, la bonne manière de bien architecturer son projet et son code, etc... pour éviter d'éventuels problèmes futurs.

Expérience = Visibilité sur le futur

A partir d'un moment, le prototype fonctionne, on a une belle app/site/whatever, et il faut la mettre en prod. Les premiers clients arrivent, et là c'est le drâme. Ca ne tient pas a charge. Sauf si vous avez prévu la scalabilité du machin. Et ça, à moins d'être un dieu, un jeune diplômé ne sait pas. Par contre, l'expérience peut jouer.

Expérience = Bonne Planification

La planification fait aussi parti du savoir-faire du vieux con. Il sait combien de temps il va prendre pour faire telle fonctionnalité ou installer tel service. Par exemple, il vous faut combien de temps pour installer un cluster Elasticsearch ? Quite à faire plaisir à ces investisseur, c'est mieux de dire (et de le tenir) "un premier proto sera dispo dans 2 mois avec une mise en prod prévu pour dans 9 mois" que de sortir le classique "ça sera prêt quand ça sera prêt"...

Expérience = Efficacité

L'expérience si ch€r€ correspond à autant de try&fail et de leçons apprises par la personne qu'elle ne refera pas dans la startup. Généralement, l'expérience produira moins de code jetable qu'il faudra tout recoder l'année d'après pour scaller. Cela permet de coder plus vite et surtout plus efficace.

Et aussi cela lui évite de passer une éternité pour installer/coder quelque chose ou de rester bloqué sur une autre chose. La personne code droit au but et fonctionnel.

Être plus efficace permet au à l'expérimenté d'abattre la même quantité de travail, voir plus, entre 9h et 17h qu'un fraichement diplômé entre 11h et 23h.

Mariés, 2 enfants

En résumé, un informaticien expérimenté :

code plus vite
anticipe les problèmes et les résoud plus rapidement/facilement
anticipe la montée en charge et le dimensionnement de l'infra
planifie son travail
fourni plus de travail par unité de temps

En gros, un informaticien plus expérimenté est plus efficace. Et coûte moins cher sur le long terme.

Embauchez-moi ?

Ansible, WTF

2017-11-29T19:00:00+01:00

Ansible est l'une des techno à la mode en ce moment dans le monde de l'IT. Je bosse avec depuis quelques semaines et j'ai quelques griefs à son encontre que je vous propose de voir ici.

NOTE : Ce blogpost est loin d'être impartial

ELK "as a service"

Au niveau professionel, j'opère une plateforme ELK. Son déploiement s'est effectué avec des scripts bash, il y a quelques années. Il m'a été demandé il y a quelques semaines de revoir notre procédure d'installation de cette plateforme pour automatiser cela avec Ansible.

Notre infrastructure est basée sur celle décrite dans mon blogpost idoine. Nous sommes passé en 3 ans d'une infra à 5 serveurs à une infra à 17 serveurs (dont 12 serveurs pour le cluster Elasticsearch), avec une vision sur l'année prochaine de tout redéployer from scratch pour tout mettre à jour et monter ça à 20 serveurs (+3 pour le cluster ES).

Notre équipe installe cette infrastructure et la maintient en condition de fonctionnement, mais elle est ouverte à l'usage pour les équipes connexes à la notre. Notre chef n+2 aime parler de "as a service".

Pour ce "as a service", les autres équipes peuvent envoyer leurs logs dans notre ELK et les parser. Le point particulier du parsage est qu'il est de leur responsabilité d'écrire ces règles, et de les tester, avant de faire une pull request sur un dépôt git contenant toutes les règles de parsage utilisées.

Ce point est important pour la suite car il a été le déclencheur de ce billet d'humeur.

Ansible est (très) verbeux

Installer logstash, elasticsearch ou kibana en ansible, ça se fait. Surtout qu'on n'a que des serveurs Ubuntu, donc, pas besoin de s'occuper de la distro-agnosticité de notre ansible.

Il faut juste écrire 1045 lignes de YAML répartis dans 20 fichiers, sans compter les rôles pour elasticsearch qui existent déjà, et qu'on n'a pas à faire soit-même. En tout, on a ça :

etienne@computer:~/code/ansible_for_ELK$ find roles/ group_vars/ *.yml -type f | grep -v '.git' | wc -l
186
etienne@computer:~/code/ansible_for_ELK$ wc -l $(find roles/ group_vars/ *.yml -type f | grep -v '.git')
[...]
8579 total

ARE YOU FUCKING SERIOUS ?

8579 lignes dans 186 fichiers ? Sérieusement, WHAT THE FUCK ?

Tout ça pour quelques apt-get install et quelques sed dans des fichiers de conf ?

Je veux bien que ça soit verbeux, mais quand même, c'est pire que du Java !

Et je ne parle pas d'ansible en lui-même (et du python qu'il faut installer sur la machine, plus le virtual env, etc...), sinon ça ne serait pas équitable.

Ha, oui, et ça ne contient pas non plus la configuration du logstash indexer (nous y reviendrons plus tard).

Comparons avec nos anciens scripts, à base de bash et de Dockerfile :

etienne@computer:~/code$ find elk_installation/ -type f | grep -v '.git' | wc -l
56
etienne@computer:~/code$ wc -l$(find elk_installation/ -type f | grep -v '.git')
1437 total

Donc, en l'état actuel, on a 1437 lignes de code/config/commentaires/whatever dans 56 fichiers.

Et dedans, il est aussi compté les 104 lignes dans 4 fichiers README et surtout TOUTE la configuration du logstash indexer (300 lignes dans 21 fichiers).

Petite apparté : nous imposons un formalisme particulier pour notre configuration de logstash indexer pour éviter que toutes les équipes qui l'utilise ne se marchent dessus lors de l'ajout de leurs règles de parsage et qu'elles ne pète pas la conf d'une autre par inadvertance. Cela explique les 21 fichiers de conf pour le logstash indexer

Dis, Ansible, tu m'expliques un peu ?

Exemple

Prenons un exemple judicieusement choisi qui m'a fait m'arracher les cheveux cette semaine. Voici ce que je cherche à faire :

git cloner la configuration du logstash indexer sur le serveur
changer une chaine de caractère dans les fichiers de conf (il s'agit d'un changement de path entre l'ancienne infra et la nouvelle. Le truc, c'est qu'il faut maintenir les 2 en même temps, le temps de finir de migrer)
faire un lien symbolique entre le dépôt fraichement git cloné et le répertoire de conf normal

Voici en bash ce qui était fait :

# Remove old conf, for clean setup/update
rm -rf /etc/logstash/conf.d /srv/indexer_conf
# Get the actual conf
git clone ssh://git@git.entreprise.net/server_install/logstash-indexer.git /srv/indexer_conf
# Install the conf in the right place
ln -s /srv/indexer_conf/config /etc/logstash/conf.d
# Replace the patterns_dir path to the right one
sed -i 's#[\t ]+patterns_dir\s+=>\s+\[?".*"\]?#patterns_dir => "/etc/logstash/conf.d/patterns"' /etc/logstash/conf.d/*.conf
# Restart logstash
service logstash restart

Et en Ansible :

---

- name: Remove old logstash conf
  file:
    state: absent
    path: "/etc/logstash/conf.d"

- name: git clone/pull lastest logstash-indexer conf
  git:
    repo: "{{ indexer_git_repo }}"
    dest: "/srv/indexer_conf"
    force: yes

- name: Link indexer conf to logstash
  file:
    state: link
    src: "/srv/indexer_conf/config"
    dest: "/etc/logstash/conf.d"

- name: find the file to edit
  find:
    paths: "/etc/logstash/conf.d"
    patterns: "*.conf"
  register: tmp_glob

- name: Replace pattern path references
  replace:
    path: "{{ item.path }}"
    regexp: '[\t ]+patterns_dir\s+=>\s+\[?".*"\]?'
    replace: 'patterns_dir => "/etc/logstash/conf.d/patterns"'
  with_items: "{{ tmp_glob.files }}"


- name: Restart logstash
  service:
    name: logstash
    state: restarted

...

Verbeux, n'est-ce pas ?

Mais ce n'est pas le point le plus intéressant. Non, le point intéressant, c'est que Ansible ne sait pas faire le sed -i 'blabla' *.conf d'un seul coup.

Naïvement, on peut penser que le sed pourrait se faire ainsi :

- name: Replace pattern path references
  replace:
    path: "{{ item.path }}"
    regexp: '[\t ]+patterns_dir\s+=>\s+\[?".*"\]?'
    replace: 'patterns_dir => "/etc/logstash/conf.d/patterns"'
  with_fileglob: "/etc/logstash/conf.d/*.conf"

Mais ça ne marche pas. Et vous savez pourquoi ?

Parce que, c'est con, hein ?, mais cette instruction-là est exécutée en local et non en remote.

Vous m'avez bien lu. Toutes les instructions au-dessus (file, git, ...) et en-dessous (service) sont exécutées sur le serveur distant, mais pas le replace. A cause du with_fileglob.

Mais ça, rien ni personne ne nous le dit ! pas même la doc officielle. Et c'est pas l'erreur file not found renvoyée qui va vous aider à le découvrir.

Sérieusement, quel est le crétin qui s'est dit que cette instruction-là précisément, contrairement aux autres, serait exécutée localement ?

Et comme ça n'a pas été prévu de faire un sed * en remote, il faut utiliser le subterfuge des ligne 20-24 : faire un ls * remote, stocker la réponse dans une variable et itérer sur cette dernière dans la commande replace.

J'ai envie de dire "Bien joué" !

Récapitulons

Ansible est beaucoup plus verbeux que du bash
Ansible exécute parfois des trucs en local, et parfois en remote, mais ne te le dit jamais
Ansible a besoin de python + les bonnes libs qui vont bien. Et encore, en fonction de ce que l'on veut faire, il faut en rajouter. Soit en remote, soit en local. C'est toujours la même histoire
Les API d'Ansible ne sont pas stables. Sérieusement, il y a des trucs qui sont ajoutés et surtout supprimés (ou des mot-clés qui changent, ce qui est pire) d'une version à une autre
Impossible d'exécuter uniquement une partie d'un script/role/playbook/whatever, c'est tout ou rien
Ansible a 5 ans, et avant, le truc à la mode, c'était Puppet (tout au moins, dans mon monde). Par quoi devrons-nous le remplacer dans 5 ans ?
Quel sera le coût de sorti d'Ansible ? Ansible est compatible uniquement avec Ansible. Le jour où on ne veut plus d'Ansible, comment fait-on ?

(true story pour Puppet. A la mode pendant quelques années, avec formations, conférences, "workshops", etc... on passe tout à Puppet. Et depuis 1 an, Puppet s'est fait détrôné par Ansible)

De l'autre côté :

Bash est plus concis, même avec des commentaires pour expliquer des trucs pas évidents (genre des regexp)
Bash est exécuté en remote ou en local, mais uniquement l'un ou l'autre, et c'est le user qui maitrise ça
Bash est installé en standard sur toutes les distrib, tous les serveurs du monde
Bash est stable. Et il n'y a pas d'API, ni de DSL à la con (vivent les buzzword)
Tu peux copier-coller le contenu d'un fichier .sh dans un terminal, ça juste marche. Même un petit morceau
Bash existe depuis 1989, et est fourni en standard partout. Il est juste pas à la mode des informaticiens bobo-POO-TDD-WTF

Quitte à avoir du python, pourquoi se palucher un DSL en YAML ? On en perd toute la puissance de python...

Pour moi, c'est clair, il n'est pas encore arrivé celui qui détrônera bash.

<3 Bash

Elasticsearch, suppression de SPOF

2017-10-31T19:00:00+01:00

Note : Pour plus de détails sur Elasticsearch, voyez ma série sur ce thème.

Il était une fois Bitbucket

Contexte

Qu'est-ce ?

L'entreprise pour laquelle je travaille en ce moment utilise Bitbucket pour stocker tout son code source. Il s'agit d'un concurrent de Github, Gitlab ou Gitea que les entreprises peuvent héberger en interne.
Tout le monde connait Github, tout au moins tout informaticien sorti de sa grotte il y a moins de 5 ans. Il est surtout connu pour son instance gratuite qu'utilise le monde de l'open source.
Et, pour mon usage personnel, j'utilise Gitea dont je suis très content.

Le pourquoi

La version 4.6 de Bitbucket imposait l'utilisation d'un serveur Elasticsearch pour fonctionner.
La raison était la recherche de code.
Avant, Bitbucket ne permettait de faire des recherches que sur le nom des projets ou des dépôts git.
A partir de cette version, on pouvait enfin chercher dans le code. On pouvait chercher une fonction, une variable, ce que l'on veut dans tout le code source stocké.
Et c'est à cela que va servir Elasticsearch.

Absurdités

Malheureusement, Atlassian (l'éditeur de ce logiciel) ne sait pas comment fonctionne Elasticsearch, ni quelles sont ses capacités. Cela l'a poussé a divers absurdités :

Imposer une version obsolète d'Elasticsearch (v2.3.5), totalement dépréciée depuis le 30 Septembre 2017
Recommander une installation mono-node d'Elasticsearch
Ou héberger son cluster Elasticsearch chez Amazon
Ou rajouter encore un SPOF supplémentaire avec un proxy devant (toujours la même page)
Hardcoder le nombre de shard et de replica (respectivement 5 et 0)

Prenez "recommander" dans le sens "si le client fait autrement, et que des merdes lui arrivent, même si elles sont causées parce qu'on ne sait pas coder, il se débrouille tout seul, même s'il paye un contrat de support d'1 million d'euros par an."

Je ne parlerais pas du "il faut sécuriser votre elasticsearch avec notre propre plugin qui n'est compatible qu'avec telle version d'elasticsearch. Et sinon, y'a aussi le truc officiel, mais on est pas sûr que ça marchera et de tout façon, on le supporte pas".

Voyons un peu plus les détails.

Architecture du service Bitbucket

Commençons par le début, comment ça marchait Bitbucket, avant.

Sans Elasticsearch

Dans le cadre d'une petite équipe, ou d'une petite entreprise, l'architecture du service Bitbucket, ressemblait à toute autre :

Avec Elasticsearch

Avec l'ajout de la dépendance obligatoire Elasticsearch, ça donne ça :

Le problème

Le truc, avec mon fournisseur de travail actuel, c'est qu'il est trop gros pour utiliser Bitbucket comme cela.
En effet, plusieurs centaines de développeurs git clonant et git pushant régulièrement tous les jours mettent par terre le service tel quel.

Grosse archi

Bitbucket Datacenter

Ce qu'il s'est passé, c'est que mon $JOB_ACTUEL a travaillé avec Atlassian pour avoir un truc qui scale un peu plus, et Atlassian a sorti une version dite "datacenter". En gros, ça donne ça :

Et comme il fallait un truc bien robuste pour de la bonne grosse prod, le proxy est redondant en n+2 avec fail-over automatique (c'est bibi qui s'en est occupé de cette partie-là).
Pour la DB, j'imagine que les DBA ont fait la même chose, ainsi que l'équipe d'infra qui nous fourni le stockage.

Bitbucket nouvelle version

Bon, et voilà ce que ça donnerai avec les recommendations d'Atlassian.

Et dans la vraie vie ?

Le problème avec cela, c'est que dans la vraie vie, ça ne tient pas du tout la charge, ou alors à quel prix.
Et surtout, il y a 2 problèmes immédiat :

Ca ne scale pas du tout
Ca introduit un nouveau SPOF dans notre belle infra critique de prod

Voyons ensemble les contraintes que nous avions.

Les besoins de stockage

Commençons par le stockage. Au moment de l'update, l'infra bitbucket occupait un peu moins d'1To de disque. Autant dire qu'1To réparti dans quelques milliers de dépôt git, c'est pas petit !

Notre équipe qui s'occupe de Bitbucket a procédé à quelques tests, pour savoir ce que cela prendrait comme disque une fois répliqué dans elasticsearch. Et elle a trouvé qu'il y avait un rapport 1.33 entre l'espace occupé brut et l'espace disque dont aura besoin elasticsearch.

Avec un peu de marge, on se retrouve avec un besoin immédiat d'1,5To. Avec une courbe de croissance estimée à environ +60Go/mois

Les contraintes de notre équipe d'infra

Notre équipe d'infra a elle aussi quelques contraintes, avec ses +8000 serveurs gérés :

Elle ne fourni que des VM, pas de machine bare-metal.
Chaque serveur ne pourra avoir que 500Go de disque attaché, au maximum
Le moins on utilise d'espace disque, le mieux c'est

D'un autre côté, quelles sont les possibilités d'Elasticsearch ?

Comme déjà vu ensemble, Elasticsearch est hautement distribué et scalable.
Et il a une fonctionnalité qui nous intéresse aussi, c'est son utilisation en tant que "proxy", avec une configuration "no-data,no-master".

La solution

L'archi actuelle

L'idée principale est de mettre un noeud elasticsearch "proxy" en local sur chaque noeud bitbucket. Ainsi Bitbucket se connecte au cluster elasticsearch sur l'URI http://localhost:9200/.

Avec cette configuration, la perte d'un noeud elasticsearch ou bitbucket, quelqu'il soit n'entraine pas de perturbation.

Ajouté à cela qu'après discussions avec Atlassian, nous avons pu avoir la possitilité de changer le nombre de shard et de replica, via des variables de configuration non-documentées.

Quelques chiffres clefs

Nous avons actuellement un cluster de 15 noeuds. Chaque noeud a 400Go de disque, 4vCPUs et 16Go de RAM.
Nous avons aujourd'hui de configuré 15 shards et 1 replica
3To de disque utilisés sur les 6To de disponible
>160 milliards de documents stockés
Temps de réponse moyen d'Elasticsearch <50ms
Pas de SPOF : en test, on a perdu 2 noeuds sur les 15 sans aucun impact (pas de perte de data, pas d'interruption de service)
Possibilité de scaler pour suivre l'utilisation du service

Note : si c'était à refaire (et c'est ce qui sera fait prochainement), et que nous avions les ressources matérielles que nous voulions, nous aurions pris 45 shards et 2 replica répartis sur 20 VMs. Cela nous aurait permis de mieux scaler et sur plus longtemps. Dans notre cas, nous avons été surpris par un taux de croissance plus important que ce que nous prévoyions qui nous amène à changer nos plans dans peu de temps.

Elasticsearch, Creation d'un template d'index

2017-10-20T19:00:00+02:00

Lorsque l'on envoie des logs parsés par Logstash à Elasticsearch, si on ne spécifie pas de type lors de la création de l'index, tout sera considéré comme du texte par défaut. Mais cela nous empêche d'exploiter correctement certains champs (IP, nombres typiquement). Voyons comment arranger cela.

Log parsé

Prenons une ligne d'access log nginx que l'on va parser avec Logstash :

192.168.6.66 app.serveur.entreprise.net - [20/Oct/2017:08:38:04 +0000] "GET /page/visitee.php HTTP/1.1" 200 387 "http://app.serveur.entreprise.net/page/precedente.php" "Mozilla/5.0 (Windows NT 6.1; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/61.0.3163.100 Safari/537.36" "-"

Voici grosso-modo ce que l'on obtiendra après parsing par Logstash (article qui reste à écrire) :

{
"message": "192.168.6.66 app.serveur.entreprise.net - [20/Oct/2017:08:38:04 +0000] \"GET /page/visitee.php HTTP/1.1\" 200 387 \"http://app.serveur.entreprise.net/page/precedente.php\" \"Mozilla/5.0 (Windows NT 6.1; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/61.0.3163.100 Safari/537.36\" \"-\"",
"@timestamp": "2017-10-20T08:38:04.000Z",
"file": "/var/log/nginx/access.log",
"host": "serveurhostname",
"type": "nginx",
"app": "app.serveur",
"env": "production",
"clientip": "192.168.6.66",
"domain": "app.serveur.entreprise.net",
"auth": "-",
"timestamp": "20/Oct/2017:08:38:04 +0000",
"verb": "GET",
"pathrequest": "/page/visitee.php",
"httpversion": "1.1",
"coderesponse": "200",
"bytesresponse": "387",
"referrer": "http://app.serveur.entreprise.net/page/precedente.php",
"useragent": "\"Mozilla/5.0 (Windows NT 6.1; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/61.0.3163.100 Safari/537.36\""
}

Vous pouvez remarquer que tous les champs et leur valeurs sont quotés, entre doubles-quotes. Même les valeurs de type IP et numérique. Elasticsearch risque de les stocker en tant que valeur textuelle.

Index templating

Pour remédier à cela, il faut utiliser l'index templating.

Voyons ce que cela donnerait pour nous. le champ "clientip" est une adresse IP, le "bytesresponse" est un nombre. "httpversion" sera gardé comme texte ainsi que "coderesponse". Pour ce dernier, il s'agit d'un code de statut, on ne va pas l'additionné, le multiplier our faire ce genre d'opération. On aurait pu mettre "tout_bon" que cela aurait été exactement pareil.

Allons-y :

curl -XPUT 'http://ELASTICSEARCH_SERVER_ADDRESS:9200/_template/default_log?pretty' -d '
{
  "template": "logstash-*",
  "mappings": {                                                                                      
    "nginx": {
      "properties": {
        "bytesresponse": {"type": "long"},
        "clientip": {"type": "ip"}
      }                
    },         
  }
}'

Et voilà !

Ok, et en détail ?

template: indique à quels nom d'index seront appliqué ce template. Dans notre cas, si l'index créé commence par "logstash-", il s'appliquera, sinon, il ne s'appliquera pas.
mappings: mot clef pour indiquer que l'on va mapper des champs avec des types
nginx: correspond au champ "type" de vos enregistrement. Donc "nginx" dans notre exemple. Cela aurait pu être autre chose car (nous le verrons au § suivant), les rêgles ne s'appliqueront pas qu'aux enregistrements de type nginx.
properties: mot clef

Pour plus d'information, je vous invite à vous référer à la documentation très complète sur le site officiel.

A savoir : globalité et disponibilité

Attention, il y a quelques subtilités à savoir quand on crée un index template : la globalité de la configuration et le fait qu'il ne s'applique aux futurs index créés, pas au anciens.

Potentiels conflits de typage

En effet, et il s'agit d'une limitation connue et documentée, tous les champs "bytesresponse" et "clientip" dans notre exemple doivent de type "long" et "ip" respectivement. Même s'ils sont dans le résultat de parsing d'une autre application.

Et méconnaire cette contrainte peut entrainer des problèmes : dans le cas où un enregistrement arriverait dans le cluster elasticsearch avec un champ "clientip" non castable en IP (s'il y a un reverse DNS appliqué et qu'il est fournit un hostname au lieu de l'ip, par exemple), l'enregistrement ne s'effectuera pas, sera perdu et une erreur sortira dans les logs d'elasticsearch.

Application du template uniquement sur les futurs index

La seconde chose à savoir est qu'un index template ne s'appliquera que sur les index qui seront créés après la création du template. Ce n'est pas un problème si vous utilisez Elasticsearch comme une base de données comme une autre dans laquelle vous avez un schéma dès le départ (équivalent au CREATE TABLE... en SQL).

Si par contre, vous stockez des logs et n'avez pas défini de template avant de les envoyer dans elasticsearch, il va y avoir un petit temps de latence entre la création de cet index template et sa totale opérabilité. En effet, les index créés avant la création du template n'en bénéficieront pas sauf à tout ré-indexer. Généralement, on attend plutôt que tous les vieux index sans template disparaissent avec leur durée de rétention.

Une erreur de débutant

2017-07-30T19:00:00+02:00

La semaine dernière, j'ai eu un problème sur une infrastructure ELK de logs. Je vous propose de décortiquer içi ce qu'il en est ressorti. Spoiler : j'ai fait une erreur de débutant.

Dabord, un petit rappel de l'architecture de notre infrastructure pour parser et stocker les logs.

Symptômes

En arrivant le matin au bureau, j'ai eu une alerte de mon monitoring sur l'occupation RAM du serveur buffer.

Le scénario classique, quand la RAM monte sur le redis, qui sert de mémoire tampon pour lisser l'arrivées des logs dans notre infra, c'est :

soit un gros pic de log. Comme nous connaissons les équipes qui nous envoi des logs, et surtout l'audience des appli qui nous envoient leurs logs, c'est souvent dû à un développeur qui active l'envoie de log en debug sur son instance de test/intégration/pré-prod/whatever qui subit des tests de perf/montée en charge. Ca se règle avec une petite gueulante parce qu'il "ne faut pas faire ça sur l'infra de prod". Ca se règle assez vite.
soit un/plusieurs noeuds de parsing est tombé. Dans l'urgence en relancer des nouveaux, et voir pourquoi certains sont mort. Cela prend un peu plus de temps.

Notre monitoring nous montre aussi depuis quand ça monte : le matin à minuit.

Actions entreprises

Les logstash de parsing

Dans l'urgence, je me suis logué sur les serveurs de parsing et j'ai redémarré les logstash. Pendant qu'ils redémarraient, j'en ai profité pour lire les logs (du redémarrage et d'avant).

Et j'ai stoppé l'entrée de nouveau log dans le buffer redis. Histoire d'éviter que celui-là n'explose aussi.
Il n'y a rien a craindre pour les logs. Ceux qui sont sur le serveur de buffers seront traités quand tout sera remis en place et ceux qu'on empêche d'être envoyé restent bien au chaud sur les serveurs et rejoindront le buffer quand on rouvrira les vannes.

En attendant, les logs des logstash de parsing nous donnent : ils n'arrivent pas à envoyer les logs parsés au cluster elasticsearch. Eclair de génie (en vrai, j'ai honte, j'aurais dû le faire avant) : quel est l'état de notre cluster elasticsearch ?

Le cluster elasticsearch

Un petit coup de curl 'http://un_serveur_elasticsearch/_cluster/health?pretty=true' => "status" : "yellow",. Aïe ! Il y a des unassigned_shards.

Sortons notre script magique, inspiré de cette réponse sur Stackoverflow. Ce script nous permet de forcer l'assignation de shard sur un noeud donné du cluster. Ca surcharge temporairement ce noeud-là, le temps que la magie du cluster fasse son effet et ne redispatche la charge sur l'ensemble du cluster.

Réponse du script : Erreur. Il ne peut pas forcer parce que... parce que QUOI ??? il ne reste que 85% d'espace disque, alors Elasticsearch refuse la création d'un nouvel index. WTF ? Connexion sur un des noeud pour vérifier, effectivement, il reste un peu moins de 15% d'espace libre.

"Expected behavior". Bon, OK. Dans l'urgence, je supprime des vieux logs. On a normalement 30 jours de rétention, je n'en garderais que 28, ça devrait permettre de résorber temporairement cette situation.

Application de notre 2e script magique, largement inspiré de celui-ci. Résultat : l'occupation disque redescend à 55%. C'est à la fois cool, parce que tout repart, la machine se remet en branle, et à la fois pas cool, parce que 2 jours de rétention, ça ne fait pas 30% de notre capacité.

La suite

Fin de l'incident

A ce stade, je remets tout en route, j'attends que le buffer se vide un peu avant de rouvrir les vannes. En quelques minutes, tout est rentré dans l'ordre.

Fin de l'incident.

La vraie raison

A ce stade, tout est fonctionnel, mais je n'ai toujours pas la root cause, la raison première de cet incident.

Je creuse un peu du côté des 30% de capacité en 2 jours. C'est louche.

Nous avons un script qui tourne toutes les nuits qui supprime les logs trop vieux, au delà des 30 jours de rétention. En regardant les graph de notre solution de monitoring, on peut voir clairement que l'espace à commencé à grossir il y a 2 semaines. Ce script n'avait pas tourné depuis 2 semaines. Pourquoi ?

Il requêtait un serveur appartenant au cluster qui a été décommissionné il y a 2 mois et supprimé il y a 2 semaines. Vous le voyez, le pebkac ?

Comment faire pour que cela ne se reproduise plus ?

Plusieurs choses ont été faites pour que je ne rencontre plus ce problème dont je suis indirectement en partie la cause.

Descendre les seuils d'alerte pour l'espace disque du cluster elasticsearch, on est passé de 85-95 à 70-80.
Réfléchir à l'éventuelle modification du paramètre cluster.routing.allocation.disk.watermark.low
Superviser l'exécution du script de suppression des vieux enregistrements
Superviser le nombre de jour de log stockés dans elasticsearch

Les points 3. et 4. auraient déjà dû être fait bien avant, dès la mise en place de l'infra. C'est un gros oubli. C'est là qu'a été mon erreur.

Jouons avec les script-kiddies

2017-07-18T19:00:00+02:00

Depuis bien 10 ans, je gère des serveurs directement accessibles sur internet. J'ai commencé par auto-héberger quelques trucs pour moi quand j'étais étudiant sur un PC de récupération, avant d'en faire mon métier.

Aujourd'hui, j'auto-héberge toujours des outils/blog/projets perso pour le fun.

L'une des premières proccupations que l'on doit avoir quand on met un serveur sur le wild internet, c'est ça sécurisation. Il n'y a pas forcément besoin d'être expert en sécurité pour appliquer quelques règles minimales. On pense typiquement à la connexion SSH uniquement par clefs, quelques règles iptables, fail2ban, etc...

Je ne m'étendrais pas sur ces mesures nécessaires, mais plutôt sur un comportement très particulier de script kiddies et comment on peut s'amuser un peu avec eux (enfin, à leur dépend).

Je n'utilise pas Wordpress

Constatations

Commençons par le commencement : je n'utilise pas wordpress. Par contre, ça ne m'empèche pas de voir ce genre de chose dans mes logs de serveur web (Nginx pour moi) :

X.X.X.X - - [12/Jul/2017:16:23:34 +0200] "GET /wp-login.php HTTP/1.1" 404 408 "-" "Mozilla/5.0 (Windows NT 6.1; WOW64; rv:40.0) Gecko/20100101 Firefox/40.1"
X.X.X.Y - - [12/Jul/2017:16:27:50 +0200] "GET /wp-login.php HTTP/1.1" 404 408 "-" "Mozilla/5.0 (Windows NT 6.1; WOW64; rv:40.0) Gecko/20100101 Firefox/40.1"
X.X.X.Z - - [12/Jul/2017:16:32:17 +0200] "GET /wp-login.php HTTP/1.1" 404 408 "-" "Mozilla/5.0 (Windows NT 6.1; WOW64; rv:40.0) Gecko/20100101 Firefox/40.1"
X.X.X.A - - [12/Jul/2017:16:35:37 +0200] "GET /wp-login.php HTTP/1.1" 404 408 "-" "Mozilla/5.0 (Windows NT 6.1; WOW64; rv:40.0) Gecko/20100101 Firefox/40.1"
X.X.X.B - - [12/Jul/2017:16:51:58 +0200] "GET /wp-login.php HTTP/1.1" 404 408 "-" "Mozilla/5.0 (Windows NT 6.1; WOW64; rv:40.0) Gecko/20100101 Firefox/40.1"

Décriptons vite fait pour ceux qui n'aurait jamais vu de log de serveur web : mon serveur web Nginx se voit demandé par plusieurs IP différentes de servir la page wp-login.php, mais comme elle n'existe pas renvoie une erreur 404.

Décryptage

Pourquoi ces logs ?

Parce que wordpress, dans sa configuration par défaut, utilise cette page wp-login.php pour authentifier les utilisateurs. D'autres pages propres à wordpress sont aussi demandées, toujours sans exister chez moi : wp-content, xmlrpc.php, etc...

Ces pages pouvant présenter des vulnérabilités sur d'anciennes version de Wordpress, si des apprentis hackeurs les trouvent, ils auront tôt fait de le vérifier et de s'approprier le site vulnérable.

Zip-Bomb

Origine

Suite à un article de Korben, adapter le concept de la Zip Bomb pour défendre son site web des scripts kiddies, je me suis mis en tête de l'appliquer sur un de mes serveurs.

Problème, je n'utilise pas du tout PHP, sur aucun des sites que j'héberge sur le serveur choisi.

Qu'à cela ne tienne, il doit bien y avoir moyen de faire quelque chose quand même avec la configuration du serveur web directement.

Explication

Le but du jeu est de faire crasher le logiciel ou carrément l'ordinateur du malheureux méchant qui voudrait accéder à la page wp-login.php.

Le principe de la Zip-Bomb est simple : on va donner à l'attaquant un petit fichier compressé de 10Mo (inofencif pour nous), mais qui une fois décompressé fait 10Go. Un petit ordre 1000, oui. La plupart du temps, les ordinateurs ne supporteront pas bien cette décompression par manque de RAM (qui à 10Go de RAM de libre ?) ou par manque de place disque.

Mise en place

Créons la zip bomb. Sur votre serveur linux faites :

dd if=/dev/zero bs=1M count=10240 | gzip > /srv/badrobots/10G.gzip

Et voilà.
Vérifiez, le fichier compressé fait environ 10Mo.

La suite se trouve dans la configuration nginx :

server {
    listen 80;
    listen [::]:80;
    server_name mon_super_nom_de_domaine.tld;
    ...
    location ~ (wp-login|wp-content|xmlrpc) {rewrite ^/.* /10G.gzip;}
    location /10G.gzip {alias /srv/badrobots/10G.gzip; more_set_headers 'Content-Type: text/html' 'Content-Encoding: gzip';}
    ...
}

Note : J'utilise ici le plugin nginx "more_set_headers" au lieu du simple "add_header". Dans notre cas, il faut changer le champ "Content-Type", et l'usage de la directive "add_header" ne fait que rajouter un header "Content-Type" supplémentaire. Et au final ça ne marchera pas, le client web ne prenant pas le bon header "Content-Type". Sur système type Debian, installez le package "nginx-extras" plutôt que les "nginx-light" ou "nginx-full".

Expliquons : pour toute requête contenant wp-login ou wp-content ou xmlrpc, on va ré-écrire la requête pour demander à se faire servir le path "/10G.gzip". Pour ce path particulier, on va servir le fichier qui nous intéresse et ajouter/modifier des headers HTTP. On modifie le "Content-Type" pour indiquer que c'est une page HTML si on ne fait pas ça, Nginx indique un type binaire et donc le client demandera juste à l'utilisateur où il veut télécharger le fichier. On ajoute le header "Content-Encoding" pour indiquer au navigateur qu'il faut qu'il décompresse ce qu'on lui a envoyé.

Pour faire court : pour toute requête contenant wp-login ou wp-content ou xmlrpc, on va plutôt leur servir la zip bomb.

Et voilà !

Résultats

Pour voir ce que cela fait, vous pouvez soit tentez par vous-même, en allant http://blog.etienne-magro.fr/wp-login.php, soit en lisant le blogpost de l'auteur de l'idée qui a fait les tests pour vous ;-)

En résumé, ça fait planté certains navigateurs.

Fail2ban

Ha oui, aussi, n'oubliez pas de mettre à jour vos filtres fail2ban.

En effet, là où avant, nginx répondait une erreur 404 Not Found, maintenant, il répond 200 en envoyant la zip bomb. Vos regex fail2ban pour wordpress ne vont plus fonctionner.

Les logs maintenant :

X.X.X.X - - [18/Jul/2017:18:20:09 +0200] "GET /wp-login.php HTTP/1.1" 200 10420385 "-" "Mozilla/5.0 (Windows NT 6.1; WOW64; rv:40.0) Gecko/20100101 Firefox/40.1"

Récapitulons : non seulement on fait crasher l'ordinateur du script kiddie avec notre conf nginx, mais une fois crashé, on le ban avec fail2ban.

Qu'est-ce qu'on s'amuse :-)

Bonus

Bonus 1 : Mauvais nom de domaine

Petit bonus pour toutes les requêtes qui arrivent sur le serveur avec un mauvais nom de domain :

$ cat /etc/nginx/sites-enabled/default
server {
    listen 80 default_server;
    listen [::]:80 default_server;
    server_name _;
    location / {rewrite ^/.* /10G.gzip;}
    location /10G.gzip {alias /srv/badrobots/10G.gzip;more_set_headers 'Content-Type: text/html' 'Content-Encoding gzip';}
}

Bonus 2 : Règles plus complètes

Pour finir, quelques règles plus complètes qui prend aussi les phpmyadmin et 2-3 autres merdes.

Cadeau !

$ cat /etc/nginx/conf.d/zipbomb.conf
map $location $bad_location {
    default 0;
    ~*(?i)(wp-login|wp-content|wp-admin|wp-signup|xmlrpc|typo3|xampp|pma|(php)?[Mm]y[Aa]dmin) 1;
}

$ cat /etc/nginx/site-enabled/my-site.conf
server {
    listen 80;
    listen [::]:80;
    server_name mon_super_nom_de_domaine.tld;
    ...
    if ($bad_location) {rewrite ^/.* /10G.gzip;}
    location /10G.gzip {alias /srv/badrobots/10G.gzip;more_set_headers 'Content-Type: text/html' 'Content-Encoding: gzip';}
    ...
}

Un temps pour tout

2017-07-12T12:00:00+02:00

Il y a maintenant 3 ans, je tentais de lancer un business sur internet : le monitoring de site web doublé d'un outils d'analitics.

Ce site, c'était isup.ws.

Aujourd'hui, 3 ans après, le site n'a pas fait un seul client, et surtout n'a pas de traffic (<5 visiteurs par mois).

Il est temps pour moi de tirer un trait dessus. D'arrêter de le développer ou même de le maintenir.

C'est pour cette raison que j'ai décidé de le retirer d'internet.

Le code reste bien au chaud dans mon dépôt git, comme dans un musée, mais restera dans cet état, et le domain redirige maintenant vers ce blogpost.

J'ai peut-être euthanasié ce site, mais d'autres tournent toujours plutôt bien :

What.Isup (lancé il y a plus de 2 ans) avec plus de 600 visiteurs par jour
Vente Filante fait environ 50 visiteurs par jour depuis son lancement il y a quelques mois
le petit dernier Info-Medoc qui existe depuis le mois dernier
et ce blog-ci

Elasticsearch, Architecture pour les logs

2017-07-03T19:00:00+02:00

L'un des usages principaux d'Elasticsearch est le stockage de logs. Voyons sans détour comment bien architecturer et dimensionner une infrastructure complète à fin de parsing et stockage des logs.

Découpage des rôles

On peut distinguer plusieurs étapes/rôles dans une architecture ELK :

une étape facultative pour récupérer/centraliser les logs
il faut parser les logs
puis les stocker
et enfin pouvoir les consulter

L'envoi des logs

Le parsing des logs peut se faire en local sur chaque serveur. Dans le cas d'une petite infrastructure, pourquoi pas. Mais qui a envie de lancer du code JRuby sur son serveur applicatif/web/DB/whatever de production ?

Dans ce cas, le plus simple est de centraliser le parsing sur un/des serveurs qui seront dédiés à cela et ne pénaliseront pas la prod.

Le serveur qui centralisera les logs en attente de parsing sera un redis, et pour envoyer les logs vers lui, on utilisera filebeat, un petit utilitaire en Go, minimaliste pour ne pas plomber la prod.

Le parsing des logs

Nous allons partir sur un serveur dédié au parsing des logs. Cela sera le travail de Logstash.

Nous pourrions envoyer les logs directement dans Elasticsearch, mais les parser va nous permettre de chercher plus facilement dedans, de faire des stats/board, de la corrélation, etc... Autant le faire, ça vaut vraiment le coup.

Le stockage des logs

Elasticsearch est le logiciel le plus performant pour stocker et interroger des logs. Autant partir dessus.

la consultation des logs

En complément d'Elasticsearch, Kibana est le plus adapté à la consultation des logs.

Résumé

Un bon schéma vaut mieux qu'on long discours, voici ce vers quoi nous nous dirigeons.

Dimensionnement

Voici quelques estimations sur lesquelles vous pouvez vous baser pour faire un premier dimensionnement de votre architecture :

Logstash parse ~1000 lignes de logs par seconde par GHz de CPU
Elasticsearch utilise 1Mo de disque dur pour 1000 lignes de logs par jour par jour de rétention

Explicitons cela ensemble.

Redis

Le redis n'a pas forcément besoin d'être particulièrement gros. Son rôle est la centralisation des log ainsi que le buffering. Dans un cas optimal, le redis sera toujours vide car tout ce qui lui sera envoyé devrait être consommé par les logstash immédiatement.

RAM

La chose à particulièrement surveiller va être la RAM. En effet, si vous avez un pic de production de log, il faut que le redis puisse l'absorbé, le temps que les logstash consomme ce pic. Si les logstash n'arrivent pas à consommer les logs suffisamment rapidement, votre redis va exploser. Dans ce cas, il fera office de fusible.

Quand vous choissirez la taille de votre VM/serveur (RAM surtout), il faudra impérativement le mettre en perspective avec la capacité que vous allouerez à votre logstash.

Logstash/Parsing

Logstash, le service de parsing, va prendre les logs depuis le redis et les parser. Cela consistente basiquement en l'application d'une regexp pour extraire différentes informations de la ligne de log.

Ce service est stateless, car aussitôt les informations extraites, tout est envoyé dans l'elasticsearch. Logstash ne stocke aucune donnée.

Les paramètres important à regarder dans le dimensionnement d'un serveur de parsing logstash sont : le CPU (surtout) et la RAM (moins).

RAM

Evacuons tout de suite la RAM. Pourquoi faut-il se préoccuper de la RAM ? parce que vous aller tourner un logiciel écrit en JRuby. En raccourci, du Ruby interprété en Java. Oui, une JVM. C'est mieux si elle est à l'aise.

CPU

Le CPU est directement relié à la vitesse avec laquelle vos logs seront analysées. Donc, plus il y a de CPU mieux c'est. Au doigt mouillé, en première estimation, vous pouvez utiliser cette règle : Logstash parse ~1000 lignes de logs par seconde par GHz de CPU. Bien entendu, cela va dépendre de la complexité de vos règles de parsing, etc... mais c'est une bonne approximation de départ.

Parallélisation

Ce qu'il y a de bien avec un logiciel stateless, c'est que vous pouvez en démarrer autant que vous le souhaitez en parallèle, l'analyse de vos logs n'iront que plus vite. 2 serveurs 2 CPU iront 4 foix plus vite qu'un serveur 1 CPU (cadensé à la même vitesse). Pas besoin d'avoir un seul gros serveur. Plusieurs petits feront autant le travail. Sans compter sur la résilience. Mais nous verrons cela plus tard.

Elasticsearch

Elasticsearch un système de base de donnée NoSQL distribué et hautement scalable. Donc, il stocke des données. Et nous allons stocker beaucoup de données. Que devons-nous regarder pour dimensionner notre service Elasticsearch ? Le disque dur, bien évidemment ! mais aussi la RAM et dans une moindre mesure le CPU.

Pour plus de détails, vous pouvez vous reporter à la page officielle dans la doc elasticsearch.

Disque dur

Pour le stockage disque, pour faire votre dimensionnement prévisionnel, vous pouvez vous baser sur cette règle : Elasticsearch utilise 1Mo de disque dur pour 1000 lignes de logs par jour par jour de rétention. J'évacue volontairement la question de la réplication des données que nous verrons un peu plus tard. Comment appliquer cela ? Prenons comme hypothèses :

que vous voulez garder votre historique de log pendant 15 jours avant de le supprimer
que vous allez stocker les logs d'appli qui produisent en moyenne 1 millions de lignes de log par jour

Avec cela, vous allez avoir besoin de 15Go de disque dur.

RAM

Pour la RAM, il y a 2 choses à garder en mémoire : 1)Elasticsearch est codé en Java, donc vous allez faire tourner une JVM et 2) Comme toute BDD, plus vous lui fournissez de RAM, meilleures seront les performances.

Hautement distribué

Dernière chose, et qui fait la force d'Elasticsearch, c'est qu'il est totalement distribué. Si vous ne pouvez pas tout faire tenir sur un seul serveur, alors utilisez-en plusieurs, ça ne sera pas plus difficile. C'est même recommandé. Un exemple de configuration vous a été fourni, c'est la configuration que j'utilise sur un petit cluster de production de 12 serveurs.

Conclusion

Avant de plongé plus loin dans la technique et la configuration proprement dite de cette architecture, récapitulons.

Nous voulons centraliser, parser et stocker des logs dans une infrastructure "ELK".

Nous avons tout découpé en étapes unitaires et les avons isolé.

Nous avons regardé les paramètres hardware important pour le dimensionnement de notre infra pour chaque étape.

Voici le workflow complet :

Vos serveurs applicatifs/web/DB/etc... vont envoyés leurs logs à un serveur redis à l'aide de filebeat
Le serveur redis concentrera les logs en faisant également office de buffer et de fusible
Le/Les serveurs Logstash consommeront les logs et les analyseront avant d'envoyer le resultat du parsing au cluster elasticsearch
Le cluster elasticsearch sera chargé de stocker les logs
Un petit serveur kibana nous aidera à requêter les logs et à faire quelques graphiques et dashboard

Prochaine étape : faisons-le pour de vrai avec de vrais morceaux de bash et de configuration en se basant sur une vraie infrastructure ELK en production.

Info-Medoc.fr, Présentation

2017-07-02T19:00:00+02:00

La semaine dernière, j'ai lancé un nouveau site : info-medoc.fr. C'est parti d'une idée toute bête : je voulais savoir si mes médicaments étaient remboursables par la sécu et si oui, dans quelle proportion. Problème, je ne trouvais l'information nul part.

Open-Data

Après moult recherches, je suis tombé sur http://medicaments.gouv.fr/, qui mettait à disposition la base de donnée des médicaments à la vente en France via http://base-donnees-publique.medicaments.gouv.fr/.

Avant cela, petit point "OpenData" :

L'open data ou donnée ouverte est une donnée numérique dont l'accès et l'usage sont laissés libres aux usagers. Elle peut être d'origine publique ou privée, produite notamment par une collectivité, un service public (éventuellement délégué) ou une entreprise. Elle est diffusée de manière structurée selon une méthode et une licence ouverte garantissant son libre accès et sa réutilisation par tous, sans restriction technique, juridique ou financière.

Ni une, ni deux, je vérifie les conditions qui sont très permissives. Merci l'état Français !
Le contenu des fichiers est très bien expliqué avec un beau fichier PDF. Merci encore une fois aux personnes qui s'en sont chargé, ce n'était pas couru d'avance.

Importation de la base de donnée

Commençons le code pour importer tout ça dans une base de donnée. Vue la taille des fichiers, une base SQLite ira très bien.

Commençons par décrire notre base de donnée. D'après le document descriptif nous pouvons créer la première table ainsi :

CREATE TABLE CIS_bdpm (cis INT,
    denomination TEXT,
    forme TEXT,
    administration TEXT,
    status_amm TEXT,
    type_amm TEXT,
    etat_com TEXT,
    date_amm DATE,
    statut_bdm TEXT,
    autorisation_euro TEXT,
    titulaire TEXT,
    surveillance BOOL
    );

Je ne vais pas détailler les autres tables, tout est disponible sur ce gist github.

Mettons tout ça dans du code python :

import sqlite3
import urllib.request

conn = sqlite3.connect('medocs_db.sqlite3')
cur = conn.cursor()

# Téléchargement du fichier
response = urllib.request.urlopen(db['url'])
data = response.read().decode('latin_1')

# Creation la DB
cur.execute(db['sql_create'])

for line in data.split('\n'):
    # Insertion ligne par ligne dans la DB
    cur.execute(db['sql_insert'], elements)

conn.commit()
conn.close()

Avec ça, on a la base. Il manque un peu d'enrobage et on est bon.
Pour le code complet de l'importation, ça se passe aussi sur github (il faut combiner avec le fichier de settings).

Nous disposons maintenant d'un magnifique fichier de base de donnée SQLite avec toutes les informations disponibles en opendata sur la base de donnée publique des médicaments.

Bénéfices

C'est bien, d'avoir cette base de donnée. Mais qu'en faire ?
On peut en extraire pas mal de données. Celles qui viennent le plus à l'esprit sont de savoir si un médicament est remboursable par la sécu.
Heureusement ! C'était quand même le point de départ de ce projet. Et aussi si le médicament est disponible en automédication ou uniquement sur prescription.

En gros, un petit site web en a émergé : info-medoc.fr.

On peut aller plus loin en extrayant quelques stats. En voici quelques exemples :

il y a 620 laboratoires qui vendent 14583 médicaments en France.
moins d'un quart des médicaments qui ne nécessitent pas de prescription.
environ la moitié des médicaments ne sont plus remboursables par la sécu.

Elasticsearch, Configuration

2017-06-26T19:00:00+02:00

Les paramètres par défaut d'Elasticsearch ne sont pas mauvais, mais je vais détailler ici la configuration qu'il faut vérifier, et éventuellement modifier pour avoir un cluster près pour la production.

Attention: La configuration qui sera donnée ici n'est pas une configuration "aux petits oignons" pour une production exigeante. Il s'agit surtout de montrer la configuration minimale à modifier pour avoir un cluster Elasticsearch prêt à fonctionner dans de bonnes conditions, redondant et scalable.

Toute la configuration se fait dans un fichier elasticsearch.yml. Vous trouverez plus de documentation sur la page officielle.

Paths

Il y a 2 paramètres path.* à regarder, dont un particulièrement important :

#################################### Paths ####################################

# Path to directory where to store index data allocated for this node.
#
path.data: /mnt/data

# Path to log files:
#
path.logs: /var/log/elasticsearch

Je ne m'étendrais que sur path.data. C'est là que vont se retrouver les fichiers utilisés par Elasticsearch pour le stockage de ses donnnées. Il est de bon ton de les mettre sur une partition séparée, la plus grosse possible, en fonction de la quantité de données que vous pensez devoir stocker.

Cluster Name

Le paramètre cluster.name est important car votre serveur Elasticsearch ne pourra rejoindre qu'un seul cluster, et ce cluster aura le nom configuré avec ce paramètre.

################################### Cluster ###################################

# Cluster name identifies your cluster for auto-discovery. If you're running
# multiple clusters on the same network, make sure you're using unique names.
#
cluster.name: elk4logs-int

Assurez-vous que ce nom est unique au sein de votre réseau, sinon vous pourriez vous retrouvez avec un serveur joignant le mauvais cluster.

Node Name

Chaque serveur Elasticsearch doit avoir un nom unique qui l'identifie au sein de son cluster. Vous pouvez, soit lui indiquer un nom , celui que vous souhaitez, soit juste mettre le hostname.

#################################### Node #####################################
node.name: ${HOSTNAME}

Si votre serveur/VM a déjà un nom identifiable, utilisez-le, c'est le plus simple.

Memory

Elasticsearch est un logiciel écrit en Java, et il est donc important que votre JVM ne swappe pas. Pour cela, mettez à true le memory_lock.

################################### Memory ####################################

# Elasticsearch performs poorly when JVM starts swapping: you should ensure that
# it _never_ swaps.
#
# Set this property to true to lock the memory:
#
bootstrap.memory_lock: true

Attention : Pour que ce paramètre fontionne correctement, il y a quelques manipulations à effectuer sur votre système linux avant.

Network

Par défaut, Elasticsearch bind sur 127.0.0.1. Il n'écoutera que les connexions locales. Pour se mettre en cluster, il faut pouvoir écouter sur le réseau.

################################### Network ###################################
network.host: 192.168.1.10

Attention : Ici se place un potentiel problème de sécurité. Soyez sûr que votre serveur Elasticsearch est bien protégé. Typiquement, il ne doit jamais écouter sur le WAN (internet). Elasticsearch, par défaut n'embarque pas de mécanisme d'authentification/autorisation d'accès. Il doit être protégé avec des règles pare-feu qui vont bien.

Discovery

Il faut indiquer à vos serveurs Elasticsearch au moins un autre serveur qui fera parti du même cluster que lui (dans le cas d'une installation en cluster). Cela se fait avec discovery.zen.ping.unicast.hosts.

Il n'est pas important d'y faire figurer tous les serveurs d'un même cluster. Typiquement, si vous montez un cluster de plusieurs dizaines ou centaines de nœuds, cela rendrait votre configuration horrible et inutile. Un seul suffit, mais si vous avez plus de 3 serveurs, indiquer ici 3 IP/hostname me semble pas mal.

Le second paramètre discovery.zen.minimum_master_nodes indique le nombre minimum de serveurs capable d'agir en tant que master qui doivent se voir pour commencer à former un cluster. Ce point est important pour éviter un split-brain du cluster. plus d'informations sur elastic.co.

################################## Discovery ##################################

# Pass an initial list of hosts to perform discovery when new node is started:
#
discovery.zen.ping.unicast.hosts:
   - 192.168.1.10:9300
   - 192.168.1.11 
   - seeds.mydomain.com

# Prevent the "split brain" by configuring the majority of nodes (total number of nodes / 2 + 1):
#
discovery.zen.minimum_master_nodes: 2

Shards & Replica

Pour terminer, je vous recommande également de configurer un nombre de shards et de replica par défaut. Ces valeurs peuvent être modifiées lors de la création d'une nouvelle "database" dans Elasticsearch, mais j'aime en mettre pour les cas où l'appli qui utilisera Elasticsearch ne le ferait pas elle-même.

Idéalement, le nombre de shards devrait être suppérieur ou égal au nombre total de nœuds de stockage prévu au final. Cela peut paraître compliqué/vague, mais je développerai cela dans un prochain blogpost.

################################ Shards & Replica #############################
index.number_of_shards: 12
index.number_of_replicas: 1

Exemple

Voici en example un fichier de configuration elasticsearch.yml complet que j'utilise sur un de mes clusters actuellement en prod (petit cluster de 12 nœuds utilisé pour le stockage de logs).

L'avantage de ce fichier de configuration est qu'il est le même pour tous mes serveurs propres au cluster team_ELK. Le seul paramètre unique à chaque serveur est network.publish_host que je change avec un petit sed à l'installation pour mettre l'IP locale de la machine. (Et cette configuration fonctionne aussi en docker ;-))

#################################### Paths ####################################

# Path to directory where to store index data allocated for this node.
#
path.data: /mnt/data

# Path to temporary files:
#
path.work: /tmp/ELK-elasticsearch

# Path to log files:
#
path.logs: /srv/app/log

# Path to where plugins are installed:
#
path.plugins: /srv/app/src/plugins

################################### Cluster ###################################

# Cluster name identifies your cluster for auto-discovery. If you're running
# multiple clusters on the same network, make sure you're using unique names.
#
cluster.name: team_ELK

################################### Memory ####################################

# Elasticsearch performs poorly when JVM starts swapping: you should ensure that
# it _never_ swaps.
#
# Set this property to true to lock the memory:
#
bootstrap.mlockall: true

# Make sure that the ES_MIN_MEM and ES_MAX_MEM environment variables are set
# to the same value, and that the machine has enough memory to allocate
# for Elasticsearch, leaving enough memory for the operating system itself.
#
# You should also make sure that the Elasticsearch process is allowed to lock
# the memory, eg. by using `ulimit -l unlimited`.

############################## Network And HTTP ###############################

# Set the bind address specifically (IPv4 or IPv6):
#
network.bind_host: 0.0.0.0

# Set the address other nodes will use to communicate with this node. If not
# set, it is automatically derived. It must point to an actual IP address.
#
network.publish_host: 192.168.6.1

# Set both 'bind_host' and 'publish_host':
#
#network.host: 192.168.0.1

# Set a custom port for the node to node communication (9300 by default):
#
transport.tcp.port: 9300

# Set a custom port to listen for HTTP traffic:
#
http.port: 8888

# --------------------------------- Discovery ----------------------------------
#
# Pass an initial list of hosts to perform discovery when new node is started:
#
discovery.zen.ping.unicast.hosts: ["elkdb01.ma.superboite.net:9300", "elkdb02.ma.superboite.net:9300", "elkdb03.ma.superboite.net:9300"]
#
# Prevent the "split brain" by configuring the majority of nodes (total number of nodes / 2 + 1):
#
discovery.zen.minimum_master_nodes: 7


# ------------------------------ Shards & Replica ------------------------------
index.number_of_shards: 12
index.number_of_replicas: 1
cluster.routing.allocation.enable: all

Elasticsearch, comment l'installer

2017-06-13T16:00:00+02:00

Elasticsearch est un logiciel écrit en java et peut sembler compliqué à installer. Détrompons-nous, c'est on ne peut plus simple.

Pour cela, je vous propose 2 manières d'installer elasticsearch : avec et sans Docker.

Installer Elasticsearch avec Docker

Je vais supposer que vous avez déjà Docker d'installé sur votre machine. Autrement, je vous laisse regarder la documentation officielle.

Pour référence, voici le guide officiel d'installation d'Elasticsearch en utilisant Docker.

Installation rapide, pour tests

docker pull docker.elastic.co/elasticsearch/elasticsearch:5.4.1
docker run -p 9200:9200 -e "http.host=0.0.0.0" -e "transport.host=127.0.0.1" docker.elastic.co/elasticsearch/elasticsearch:5.4.1

Et voilà. Vous avez maintenant un serveur elasticsearch pour test qui tourne sur votre machine.

Installation propre

Docker officiel

Créez un fichier custom_elasticsearch.yml et montez-le dans le docker. Pareil, ne placez pas les fichier de DB dans le docker, montez plutôt un dossier qui les contiendra.

docker run -p 9200:9200 -v full_path_to/custom_elasticsearch.yml:/usr/share/elasticsearch/config/elasticsearch.yml -v /mnt/elasticsearchdata:/usr/share/elasticsearch/data docker.elastic.co/elasticsearch/elasticsearch:5.4.1

Custom docker héritant du docker officiel

Créez un fichier Dockerfile comme suit :

FROM docker.elastic.co/elasticsearch/elasticsearch:5.4.1
ADD elasticsearch.yml /usr/share/elasticsearch/config/
USER root
RUN chown elasticsearch:elasticsearch config/elasticsearch.yml
USER elasticsearch

Puis exécutez-le :

docker build --tag=elasticsearch-custom .
docker run -ti -v /usr/share/elasticsearch/data elasticsearch-custom

Vous avez aussi la possibilité de créer vous-même votre Dockerfile, en partant de FROM ubuntu, par exemple, mais je vous laisse le faire. Le moins compliqué sera de s'inspirer des l'installation sans docker et de mettre ça dans un Dockerfile.

Installer Elasticsearch sans Docker

Je vais supposer que la dernière version de Java est déjà installé sur votre serveur. Pour rappel, Elasticsearch recommande Java 8.

Pour référence, voici le guide officiel d'installation d'Elasticsearch.

Installation rapide pour tests

Téléchargez la dernière version d'elasticsearch

curl -L -O https://artifacts.elastic.co/downloads/elasticsearch/elasticsearch-5.4.1.tar.gz

Extrayez-le
```
tar -xvf elasticsearch-5.4.1.tar.gz
```

Lancez le serveur Elasticsearch

cd elasticsearch-5.4.1/bin && ./elasticsearch

Installation propre

Je ne couvrirais pas l'installation en utilisant les packages système (.deb et .rpm), uniquement l'installation "à la main" (qui pourra et devrait être automatisée) car elle permet de garder facilement la main sur les numéros de version du soft (ce qui peut être utile en prod).

Pour une installation prod-ready, nous verrons cela dans un autre blogpost, nous y verrons notamment les paramètres elasticsearch et système à vérifier.

En résumé :

cd /opt
wget https://artifacts.elastic.co/downloads/elasticsearch/elasticsearch-5.4.1.tar.gz
curl https://artifacts.elastic.co/downloads/elasticsearch/elasticsearch-5.4.1.tar.gz.sha1
sha1sum elasticsearch-5.4.1.tar.gz # devrait renvoyer exactement la même chose que la ligne précédente
tar -xzf elasticsearch-5.4.1.tar.gz
ln -s /opt/elasticsearch /opt/elasticsearch-5.4.1
cd elasticsearch

Créez votre propre elasticsearch.yml ou modifiez celui présent dans /opt/elasticsearch/config/elasticsearch.yml. (Pour plus d'information sur ce fichier de configuration reportez-vous au post elasticsearch_conf).

Puis, récupérez le fichier de service systemd ici : https://github.com/elastic/elasticsearch/blob/master/distribution/src/main/packaging/systemd/elasticsearch.service et installez-le :

wget -O /etc/systemd/system/elasticsearch.service https://github.com/elastic/elasticsearch/raw/master/distribution/src/main/packaging/systemd/elasticsearch.service

Vous pouvez maintenant démarrer/arrêter Elasticsearch comme un service système.

Elasticsearch, Pourquoi l'utiliser

2017-06-10T12:00:00+02:00

Nous avons vu précédemment qu'Elasticsearch était un serveur de base de donnée NoSQL et en quoi cela le distinguait des serveur de BDD SQL habituels.

Mais maintenant, quand faut-il l'utiliser, dans quels cas faut-il l'utiliser ?

On distingue 2 grandes usages principaux à Elasticsearch : le stockage spécialisé de logs et l'usage en base de donnée "normale".

Le stockage de logs

Le rêve des administrateurs système et DevOps

Je ne vous ferais pas l'affront de vous expliquer ce que sont des logs. Par contre, quand vous avez quelques dizaines/centaines/milliers de serveurs dont vous vous occupez et que vous devez investiguer pourquoi tel grappe de serveur est partie en caraffe, c'est vite fastidieux de parcourir tous les logs systèmes de toutes les machines.

La seule solution vraiment intéressante, c'est de centraliser. Tous vos logs.

Et si en plus, on pouvait chercher facilement dedans et faire de la corrélation, ça serait le top.

Bienvenue dans le monde merveilleux d'elasticsearch et de ses amis filebeat, logstash et kibana.

Le but vers lequel tendre pour les dev

Un bon soft est toujours accompagné de bons logs applicatifs. Si votre super appli web ultra-responsive écrite en go+react ne produit pas de logs, correctement formatés, significatifs, etc... ce n'est pas un bon soft.

Ok, les logs, c'est pas sexy, mais pourtant, ça sauve la vie quand tout plante.

Vous pouvez faire simple : tout envoyer dans un fichier, sans formatage, et c'est l'adminsys qui s'occupera du reste. Mais vous pouvez (et c'est très fortement conseillé) convenir d'un format de log facilement parsable qui sera plus facilement utilisable. Le top, étant de les envoyer directement dans un elasticsearch.

Mais qu'est-ce que les dev en retire ? De belles métriques à présenter aux managers/commerciaux, des débogages (post-mortem ou pas) à coups de requêtes simili-SQL. Le tout dans une super interface ou une API simple (REST).

La base de donnée "normale"

Sur ce point, je vais vous faire pointer vers le graph fait par The HFT guy pour un résumé très visuel.

Contrainte forte sur le temps de réponse

Elasticsearch a été construit pour répondre à n'importe quelle requête très vite. Quelque soit la requête. Par défaut, tout est analysé et indexé pour permettre des temps de réponse très bas. Par exemple, sur un de mes systèmes en production actuellement, quelque soit la requête, elle est répondu en un temps moyen de 20ms, et un maximum de 200ms (et un temps median à 10ms).

Elasticsearch a été codé pour la vitesse. Et il va vraiment vite.

Scalabilité

Ce système de base de donnée peut tourner en test sur votre ordinateur portable, en intégration sur un petit cluster de 2 noeuds et en production sur un cluster de dizaines ou centaines de serveurs.

Il peut stocker plusieurs peta-octets de données, tout en garantissant les temps de réponse aux requêtes, la facilité d'accès à vos données.

Et ce qu'il y a de beau dans tout cela, c'est la facilité que vous aurez à augmenté la capacité de stockage de votre base de donnée : installez Elasticsearch sur un nouveau serveur, modifiez un seul paramètre dans son fichier de configuration, et voilà. Votre capacité a été augmentée.

Cela vous permettra de gagner en capacité aisément, même si vous ne l'aviez pas planifié au départ.

Bonus

En complément, viennent nativement avec Elasticsearch :

Full-text search
Facilité d'installation et de maintenance

Elasticsearch, qu'est-ce que c'est

2017-06-08T19:00:00+02:00

Elasticsearch est une technologie à la mode, avec de belles promesses, mais concrètement, c'est quoi ?

En résumé, Elasticsearch est un système de base de donnée NoSQL hautement distribué et scallable.

NoSQL

Serveurs SQL traditionnels

Lorsqu'une application interroge un serveur de base de donnée, généralement, il s'agit de requêtes SQL envoyées à des serveurs Oracle, MySQL/MariaDB ou PostgreSQL pour les plus connus. Cela impose quelques contraintes :

Utilisation d'un language additionnel, le SQL
Définition d'un schéma figé CREATE TABLE ma_table(id INT, colonne1 TEXT, colonne2 INT);, aux changements compliqués
Installation/Import des drivers propres au serveur de BDD
Utilisation d'un unique serveur non-scalable et non-distribué (même si cela devient tout doucement possible, ça reste réellement compliqué)

Elasticsearch

De son côté, Elasticsearch permet d'enlever certaines de ces contraintes :

Utilisation de requêtes REST (Json over HTTP)
Le schéma n'est pas figé, et l'ajout d'un champ se fait à la volée
Pas besoin de drivers puisque que le protocol est vraiment standard (même votre navigateur internet peut le faire)
Elasticsearch a été pensé dès le début pour être distribué et scallabe

Inconvénients

D'un autre côté, tout n'est pas rose pour elasticsearch, loin de là. Chaque système a ses avantages et ses inconvénients. Typiquement, Elasticsearch est un gouffre à ressource (disqur dur/RAM) et ne pas avoir de schéma figé ne veut pas dire qu'il ne faut pas avoir de schéma tout court. Au contraire. Elasticsearch sera d'autant plus utilisable et performant que votre base de donnée aura un schéma.

Hautement distribué et scallable

L'intérêt d'avoir sa BDD éclatée sur plusieurs serveurs

Un système est dit "distribué" quand il ne réside pas sur un seul serveur, mais plusieurs.

Par exemple, MySQL est un système qui ne peut être installé que sur un seul serveur. Si vous installé un 2e serveur MySQL, il vous sera impossible d'accéder aux données présentes sur le 1e serveur en l'interrogeant. (En vrai, c'est possible, mais après moults efforts fait par un/des experts).

Dans le cas d'Elasticsearch, installez-en un, puis un deuxième, puis un centième si vous le voulez, ils partageront leurs données que vous pourrez récupérer en interrogeant le serveur de votre choix.

Comment vont grossir vos données

Admettons que d'ici quelques semaines ou mois vos données auront doublé de volume. Et que la semaine prochaine vous aurez atteind les limites de capacité de votre serveur.

Comment cela se passe pour un serveur traditionnel SQL ? Facile, vous achetez un autre serveur plus gros (ou vous demander un nouvelle VM plus grosse), et vous déplacez les données dessus. Cela peut prendre de quelques heures à quelques semaines pour mener à bien cette opération, en fonction de la taille de vos données, des applications les utilisant, des administrateurs, etc...

Et pour Elasticsearch, me direz-vous ? Demandez un nouveau serveur ou une nouvelle VM, mais au lieu de migrer les données dessus, vous l'ajoutez au groupe de serveur. Les serveurs vont alors se répartir les données équitablement, comme si vous aviez ajouté à chaud du disque, de la RAM et du CPU sur un serveur, et vous voilà reparti pour un tour. Cela prend entre 5 minutes et une demi-journée. Et sans downtime. Aucun.

Usage

Attention. Elasticsearch, que nous allons étudier dans cette série de post, a beau être une technologie merveilleuse, il n'en faut pas pour autant remiser vos serveurs SQL.

Ce sont 2 technologies différentes qui n'adressent pas les même usages.

Relationnelle

Les jointures sont propres au système SQL et n'existent pas dans le monde NoSQL. Ou sont bien moins performante.

Typiquement, les relations qu'il peut y avoir entre enregistrements (on parle souvent de base de donnée relationnelle) n'existent qu'en SQL. Si cela est important pour vous ou votre application, passez votre chemin. Ou changez votre manière de penser et votre application de fond en comble.

Grossissement dans le temps

Si vous savez que vous n'allez pas avoir plus de données dans le futur, ou que le grossissement se fera à un taux dérissoir, prenez une base de donnée SQL. Dans le cas contraire, regardez les système NoSQL de près, cela pourrait vous sauvez la vie dans un futur pas si lointain.

Au final, je vous renvoie vers cet excellent post thehftguyblogpost, en particulier le graphique de décision qui y est attaché. (voir en plus grand)

Analysez l'information !

2016-01-28T19:00:00+01:00

Suite à la disparition du blog de What.IsUp, les blogposts ont été déplacés ici pour ne pas les perdre.

What.IsUp est heureux de vous annoncer une nouvelle rubrique sur notre site : "Analyse de l'actualité", et avec elle arrive un premier blog dont c'est la thématique : Crashdebug.fr.

Réfléchissons

Passivité de l'information

Quand on regarde le journal télévisé, on avale de l'information pré-machée. "Avalez, voici la vérité, il n'y a rien à penser d'autre". Le format même de la télévision nous empêche de prendre du recul, d'analyser ce qui est dit, de croiser les sources et de se faire une opinion propre.

Croiser les effluves

What.isup a été créé dans l'idée de croiser les informations, de ne plus ingurgiter l'actualité telle quelle, mais de naviguer entre différents thèmes, différentes sources pour justement reprendre le pouvoir sur notre opinion, sur notre manière de consommer l'information

Blog d'analyse

Nouvelle rubrique

Dans cet optique, nous avons le plaisir d'ouvrir une nouvelle page sur What.isup qui regroupera divers blogs et sites d'actualité décodée : "Analyse de l'actualité"

Premier blog

Et c'est donc avec une grande joie que nous accueillons le premier blog de cette catégorie : Crashdebug.fr. Avec un nouvel article par jour, il nous permet de décrypter l'actualité et de mieux comprendre le monde dans lequel nous vivons.

La suite

Il a été vite rejoint par d'autres media : AgoraVox, Reflets.info, et bien d'autres.

Penser l'information autrement

2016-01-04T19:00:00+01:00

Suite à la disparition du blog de What.IsUp, les blogposts ont été déplacés ici pour ne pas les perdre.

"Les infos"

Quand on pense informations, actualités, On pense au journal télévisé que l'on regarde le soir chez soi. Là, on a le choix entre le journal de 20h sur la chaîne 1 ou la 2, ou celui de la 3 ou la 4, etc... Mais pas tous en même temps. Comment était-ce du temps des journaux papiers ?

Facile :

Vous avez le choix entre une multitude de journaux. Ils parlent en partie de la même chose, avec parfois des points de vue différents, ou sont des copier-coller les uns des autres, et dans une autre mesure, ils ont des sujets qu'ils ne partagent pas, mais qui peuvent se trouver être moins intéressants.

En un coup d'oeil

Si vous voulez faire un rapide tour de toute l'actualité, d'un coup d'oeil, qu'avez-vous ? Google News ou MSN actu ou Yahoo actualité. Ou alors une myriade de flux RSS que vous avez collecté en suant eau et sang sur chaque site internet qui vous intéresse.

Pour creuser un sujet

Si vous voulez approfondir un sujet d'actualité qui vous tient à coeur ou croiser les sources, comment faites-vous ? Vous avez le choix : vous ne le faites pas parce que vous regarder le journal de 20h, ou vous faites une recherche sur votre moteur de recherche préféré ou alors vous allez voir un par un chaque site internet que vous avez répertorié et cherchez dessus.

What.isup

Et si je vous proposais un outil qui vous facilite tout ça. Oui, tout ça. C'est à dire un endroit où l'information est disponible d'un coup d'oeil, mais où vous avez la possibilité de comparer différentes sources.

L'actu en 10 secondes

Être au courant de l'actualité entre deux rendez-vous est possible si l'information est triée, condensée et correctement présentée. 10 secondes est le temps qu'il vous faudra pour voir l'ensemble des sujets d'actualité les plus importants.

L'actu en 1 heure

La possibilité de croiser les sources, de choisir ce qui vous intéresse vraiment et d'aller plus loin ne vous est cependant pas enlevée. Je dirais même qu'elle est encouragée. Vous vous ferez une bien meilleure idée d'un sujet si la lecture de plusieurs sources est facilitée.

L'outil

Après quelques semaines de développement, après quelques semaines de test et de nourrissage de la DB, je suis fier de vous présenter What.IsUp.

Aujourd'hui, 99 sources d'information différentes, 6000 nouveaux articles d'actualité enregistrés par jour, plus de 7000 articles analysés toutes les heures. Pour vous présenter l'actualité importante en première page et ouvrir le champ des possibilités à portée de clic. Et demain, toujours plus.

Il répond au cahier des charges et ne croule pas sous les pub. Pourquoi ne l'utilisez-vous pas encore ? ;-)