Soit proche de tes amis et encore plus de tes AI


par Pilulu

Sommaire

  • IA est-tu là ?
  • Il y a pas que les LLMs dans la vie
  • Raison d'être (ou ne pas être ?)
  • Concept
  • Booms de 2012 et 2017, en direct de CNN des Transformers dans nos rues 🚙🤖
  • Rammène ta frAIse
  • A Consommer avec modération

IA est-tu là ?

OCR et Tri-postal

  • Reconnaissance des caractères manuscrits
  • Reconnaissance des addresses (ville lue vs code postal et pays)

Une librairie : https://github.com/tesseract-ocr/tesseract

Usage industriel

Quel tension et temps de soudure selon :

  • Le nombre de soudre déjà effectuées
  • La température ambiante
  • L'humidité ambiante
  • Les caractéristiques de la pince

Détection fuite eau

  • Reconnaissance sonore
  • Triangulation entre différentes sondes

Un reportage : https://www.tf1info.fr/high-tech/videos/video-des-micros-intelligents-contre-les-fuites-d-eau-5105-2393344.html

Il y a pas que les LLMs dans la vie

Acronyme : Large Language Model

  • LLM : Mistral / ChatGPT / LLM / Grok / Deepseek
  • LLM en entrée mais pas en sortie (Multimoda texte->image) : Midjourney
  • WaveNet : Génération pure audio
  • Speech To Text : Whisper ASR
  • Détection de chute via Audio pour les personnes agées
  • Prédiction de signal (donnée visuelle / tendance boursière, tendance humaine, ...)
  • ...

A partir du moment ou une information ou un ensemble d'informations (signal, image, video, donnée structurée, ...) est numérisée et qu'un résultat est attendu, elle peut faire l'objet d'un algorithme ou d'une IA

Raison d'être (ou ne pas être ?)

Un algorithme a des contours parfaitement définis et les paramètres de sa mise en place sont connus.

  • Courbe mathématique
  • Pathfinder
  • Filtrage ou amplification de signaux

Ses limites sont celles que l'on peut concevoir, même itérativement, avec une successions d'opérations.

L'informatique reste du traitement de données numériques, même pour le texte.

  • Quel est l'algorithme pour reconnaitre un caractère, selon plusieurs écritures
  • Quel sont les différentes amplitudes selon une décomposition de signal pour identifier une chute
  • Quel est l'équation de ma courbe et sa valeur si je sort des données en abscisse ?
  • Quels sont les documents, et donc les données numériques les plus proche sémantiquement de mon texte

Les équations ou algorithmes sont parfois trop complexes à concevoir.
Entrainons un paquets de neurones pour trouver la super-équation à mon problème

Concept

Objectif : Créer une super-équation que je ne sait pas résoudre moi-même

Une équation est, en mathématiques, une relation (en général une égalité) contenant une ou plusieurs variables.

  • 1 Neurone avec une entrée: F(y) = sin(a1 * w1) ou F(y) = round(a1 * w1)
  • 3 Neurones (2 neurones couche 1 +1 couche de sortie): F(y) = sin(sin(a1 * w1) * w3 + sin(a2 * w2) * w4)
    Les w sont les pondérations à trouver via l'apprentissage automatisée du modèle.

Différentes fonctions pour différents usages

Quel résultat pour quelle donnée en entrée

  • Image fournie en entrée
  • Plusieurs couches de neurones traversés et reliés entre eux
  • Comparaison du résultat
  • Ajustement des pondérations en faisant un retour en arrière de l'erreur
  • Algorithmes pour rétropropager l'erreur sur chaque couche et chaque liaison
  • Un ou plusieurs neurones en sortie

  • Données préparées en entrée (filtrage, simplification et enfin identification)
  • Plus on extrait de "signatures" d'un signal, plus son identification ou traitement sera efficace
Convolution (!Convulsion)

Booms de 2012 et 2017, en direct de CNN des Transformers dans nos rues 🚙🤖

Avant 2017

  • Identification de différentes architectures selon le traitement
  • Création de nouveaux types de neurones LSTM (mémorisation), GRU (idem optimisé) et ELMO (NLP et prédiction de mot suivant)

2012 Convolutional neural network

  • Extraction d'informations en 3 dimensions (ex: pixels x, y, couleur)
  • Cascade de filtres (contours, relief, contrastes, ...)
  • Simplification des informations pour obtenir des signatures
  • Parfait pour la classification d' images mais manque de mémoire pour le traitement du language

2017 Transformers (ex: Generative Pre-trained Transformer => GPT)

  • Encodeur pour convertir la demande en notion
  • Décodeur pour générer le résultat depuis la notion
  • Multiples séquences de décodage/encodage avec des traitements parallèles
  • Ajout d'une notion de mémoire avec pondération selon les traitements (pramètre d'attention)
https://lbourdois.github.io/blog/nlp/Transformer/

Rammène ta frAIse

  • Faire tourner une LLM : Ollama https://ollama.com/
  • Trouver des modèles : Hugging Face https://huggingface.co/
  • Interface plus agréable : Open Web UI https://github.com/open-webui/open-webui
  • Créer des modèles : Torchstudio https://www.torchstudio.ai/
  • Base de donnée vectorielle : Milvus https://milvus.io/fr
Pas toujours besoin d'un monstre pour faire tourner une IA, mais ça aide

A consommer avec modération

Quelques chiffres

Source
  • Dix fois plus gourmand que Google
  • 3 % de la consommation électrique d'ici 2030
  • 300 tonnes de CO2
  • 6,6 milliards de mètres cubes d'eau en 2027
  • 2 600 tonnes de déchets électroniques

Les tâches examinées dans notre étude et la quantité moyenne d’émissions de carbone qu’elles produisent (en g de 𝐶𝑂2𝑒𝑞) pour 1 000 requêtes. N.B. L’axe des y est en échelle logarithmique https://www.polytechnique-insights.com/tribunes/energie/ia-generative-la-consommation-energetique-explose

Privilégiez un algorithme à une IA !

A suivre

    • Tools et Agents
    • Le RAG