IA Monthly #04 : Juin 2025

Juin 2025 a été intense : Gemini 2.5 Pro s’équipe d’un mode Deep Think, Midjourney passe à la vidéo, et côté open-source, Gemma 3n, Magistral Small & Mistral Small 3.2 brillent enfin en local.

🍵 Prenez votre boisson préférée (vous avez essayé les Bubble Tea?) : le mois de juin a filé comme un commit --amend sur le tronc principal de l’IA. Entre mastodontes propriétaires qui rêvent d’occuper toutes les fermes GPU et pépites open‑source à compiler sur un NUC, il y avait de quoi remplir plusieurs flux RSS. J’ai farfouillé blogs, repos GitHub, keynotes et fils X pour vous concocter un condensé aussi gourmand qu’un fondant au chocolat… mais zéro calories côté vie privée. On y va !

(Moi, j’aime bien celui à la poudre de taro et aux perles de tapioca :D)


Panorama express

Commençons par prendre un peu de recul. Juin a Ă©tĂ© marquĂ© par cinq dynamiques fortes :

  1. L’hyper‑scaling des géants : Google pousse Gemini 2.5 Pro dans des contextes d’un million de tokens, tandis qu’Elon réplique en installant Grok 3 sur l’infra costaude d’Oracle. Côté multimodal, Imagen 4 et Midjourney V1 allument respectivement la fibre créative (images nettes, texte lisible) et la fibre cinéphile (clips vidéo générés en un prompt).
  2. Le grand retour du libre : Gemma 3n, Magistral Small, Mistral Small 3.2, Qwen3 Embedding ou encore SigLIP 2 prouvent qu’il est possible de conjuguer performance et licence permissive. Les projets auto‑hébergés ont le sourire.
  3. Des outils pour tous : Gemini CLI et Qodo Gen CLI transforment la ligne de commande en véritable panneau de contrôle IA, sans quitter son terminal favori (Tilix avec Oh My Zsh par exemple :D).
  4. Des deals qui dessinent l’avenir : xAI signe avec Oracle, Google s’immisce dans les écoles aux côtés de Pearson, Tesla lâche sa flotte Robotaxi dans un quartier bouclé d’Austin. Les applications deviennent concrètes… et commerciales.
  5. Recherche & éthique main dans la main : DeepMind décortique l’ADN, OpenAI publie un rapport anti‑abus touffu, et Wikipédia temporise son expérimentation d’IA générative. L’innovation avance, mais la vigilance citoyenne ne s’endort pas.

Voilà pour le décor. Entrons dans les coulisses.


Les modèles phares côté « gros serveurs »

🧠 Gemini 2.5 Pro – réflexion longue distance

Le nouveau cru de Google double la mise : jusqu’à un million de tokens de contexte, un mode Flash qui rĂ©pond Ă  la vitesse de l’éclair quand on lui pose une question de routine, et surtout Deep Think, bouton magique qui consent Ă  cogiter plus longtemps pour gagner en profondeur d’analyse. Le tout s’entremĂŞle Ă  la synthèse vocale maison ; pratique pour ceux qui rĂŞvent d’un assistant qui change de langue et de modalitĂ© sans cligner des yeux. Petit bĂ©mol : toujours pas d’exĂ©cution « full on‑device », mĂŞme si Google jure qu’un chiffrement de bout‑en‑bout arrive.

🛰️ Grok 3 – l’effet de levier Oracle

xAI a trouvĂ© chez Oracle Cloud Infrastructure un terrain de jeu Ă  sa mesure. RĂ©sultat : des endpoints annoncĂ©s sans rĂ©tention de log, un tarif au token plus doux pour les très gros volumes, et un pipeline taillĂ© pour entraĂ®ner Grok 4 sans changer de datacenter. Les premiers retours d’intĂ©grateurs parlent d’un dĂ©bit soutenu autour de 400 requĂŞtes par seconde sur de longs contextes. Reste Ă  voir si la promesse « moins woke / plus factuel » se concrĂ©tise !

🎨 Imagen 4 & 🎬 Midjourney V1 – l’art en deux actes

  • Imagen 4 apporte enfin des lettres lisibles dans les posters gĂ©nĂ©rĂ©s ; fini le charabia en police 3 pt. Un filtre « brand‑safe » coupe automatiquement nuditĂ© et violence, plutĂ´t pratique pour les Ă©quipes marketing qui ne veulent pas jouer les censeurs.
  • Midjourney V1 passe, lui, Ă  la vidĂ©o de 5 à 10 secondes. Les crĂ©atifs saluent la direction artistique très « clip MTV** ». Attention, chaque rendu grignote vos prĂ©cieuses fast‑minutes Discord : Ă  rĂ©server pour les projets qui mĂ©ritent la dĂ©pense.

🤖 Redwood – l’IA ménagère

Chez 1X Technologies, Redwood AI sert de quadriceps cérébral à NEO l’humanoïde. Grâce à un entraînement sur plusieurs millions de séquences robotiques, le robot sait désormais ouvrir une porte, manipuler une tasse sans la briser et, point de test ultime, plier un T‑shirt sans le transformer en boule. Derrière la démo se cache une vraie prouesse : toute l’inférence tourne on‑device, sans renvoi dans le cloud. Imaginez la même chose dans une usine ou une maison connectée sans fibre.


Focus Open‑Source : les pĂ©pites de juin 2025

🌱 Gemma 3n – mini, mais pas timide

Google frappe oĂą on ne l’attend pas : un duo 2 B / 4 B paramètres, architecture MatFormer Ă  commutation dynamique. Sur un laptop milieu de gamme, le modèle tourne en local, accepte texte, image, audio et tient sous 2 Go de RAM en quantisation 4‑bit. Licence Apache 2.0 et conteneur Docker clĂ© en main : ollama pull gemma:3n et on discute.

🏹 Magistral Small & Mistral Small 3.2 – la touche française

Mistral ne se contente plus de gros modèles : avec Magistral Small (24 B) il vise le reasoning pur et chatouille dĂ©jĂ  les scores d’AIME. Sa petite sĹ“ur Mistral Small 3.2 pousse la fenĂŞtre de contexte Ă  128 k tokens ; de quoi ingĂ©rer un livre blanc Ă©pais sans se perdre. Les deux arrivent quantisĂ©es dès la sortie et gardent le drapeau Apache 2.0 hissĂ© bien haut.

🔗 Qwen3 Embedding – moteur de recherche maison

Alibaba propose une famille embedding / reranker multilingue qui s’empare du trône MTEB. Idéal pour bâtir un moteur interne, ou remplacer Google sur votre navigateur, tout en supportant plus de cent langues. Dans nos tests, le modèle retrouve un paragraphe obscur de documentation YunoHost caché au fond d’un PDF. Prometteur.

👀 SigLIP 2 – quand l’image parle toutes les langues

DeepMind ouvre les poids de SigLIP 2, encodeur visuel‑langagier qui sait lier une photo Ă  sa description sans tergiverser. Checkpoints FP16 et INT8 prĂŞts Ă  l’emploi, latence gentille (< 100 ms sur RTX 4090) ; parfait pour un classifieur en temps rĂ©el ou un moteur de recherche iconographique auto‑hĂ©bergĂ©.


Outils & Frameworks qui changent la vie des devs

đź’» Gemini CLI – le copilote qui respecte votre shell

Un binaire open‑source, authentification Google et c’est parti : vous tapez gai run, il gĂ©nère la fonction manquante ; gai explain, il clarifie un diff abscons ; gai img, il appelle Imagen. Limite gratuite honnĂŞte pour le perso, et surtout hooks Python ouverts pour brancher votre wiki maison ou votre forge Gitea. Pratique pour garder les mains sur le clavier plutĂ´t que dans la doc.

🛠️ Qodo Gen CLI – un agent, un YAML, c’est livrĂ©

qodo init vous crée un agent.yaml où vous décrivez déclencheur, actions, backend LLM. Push, et l’usine à conteneurs sort un micro‑service autonome qui écoute vos webhooks GitLab et commente les merge requests. Les équipes DevOps annoncent déjà un gain de productivité à deux chiffres. Reste à voir si la plomberie tient sur des dépôts géants.


Deals & intĂ©grations : les coulisses du business

  • xAI et Oracle signent pour mettre Grok 3 Ă  l’abri de la pĂ©nurie GPU. Pour nous, c’est la promesse d’une alternative “cloud souverain” Ă  Azure + OpenAI, encore faudra‑t‑il vĂ©rifier la rĂ©alitĂ© des endpoints sans log.
  • Google et Pearson injectent Gemini dans des milliers de salles de classe britanniques. Retour terrain : correction instantanĂ©e des devoirs et feedback vocal personnalisĂ©. Ça impressionne, mais la question de la donnĂ©e Ă©lève reste posĂ©e.
  • Tesla Robotaxi tourne dĂ©sormais dans un quartier balisĂ© d’Austin. Quelques freinages fantĂ´mes ont dĂ©jĂ  attirĂ© l’œil de la NHTSA, mais les passagers saluent une note moyenne de confort « au‑dessus du VTC lambda ».

Recherche & percées : l’IA qui creuse profond

  • AlphaGenome assemble des centaines de millions de variants rĂ©gulateurs et entraĂ®ne un Transformer qui raccourcit d’un facteur 10 l’annotation d’un exome complet. La mĂ©decine personnalisĂ©e n’a jamais Ă©tĂ© aussi proche d’un mode “fast preview”.
  • OpenAI publie un rapport trente scĂ©narios d’abus, de la fraude vocale Ă  la bio‑menace, avec un K‑Index pour mesurer le risque. Vous voulez durcir votre pipeline ? Les check‑lists valent le dĂ©tour.
  • WikipĂ©dia suspend sa fonctionnalitĂ© AI‑preview après une fronde interne : hallucinations, erreurs de citations, bref, rien que du connu… mais Ă  l’échelle de l’encyclopĂ©die, ça fait des vagues.
  • ElevenLabs v3 place la barre haute en synthèse vocale : balises [whisper] ou [shout] dĂ©tectĂ©es dynamiquement, intonations fluides, bref le futur du doublage indĂ©.

Dans la marmite X (ex‑Twitter)

Chez les micro‑bloggers, ça discute surtout :

  • du hashtag #MJVideo et de ses fan‑edits façon Studio Ghibli rencontre Terminator ;
  • des comparaisons entre Gemini CLI et Copilot, GitHub promettant dĂ©jĂ  ses “Copilot Agents” pour l’été ;
  • du teasing d’Elon, qui jure que Grok 4 sera « plein de franc‑parler et dĂ©nuĂ© de copier‑coller mainstream » ;
  • et, plus terre‑à‑terre, des licenciements chez Amazon AWS, officiellement imputĂ©s Ă  « l’automatisation via l’IA ». L’impact social ne se discute plus, il se vit.

Ce qu’on guette pour juillet

  1. L’arrivée (en théorie) de GPT‑5 et le benchmark qui l’accompagnera.
  2. Les premiers retours on‑device de Gemma 3n sur smartphones Android et même sur Raspberry Pi 5.
  3. Une rumeur insistante d’un DeepSeek R2 open‑source en 16 B paramètres, qui viendrait bousculer le ranking.

Conclusion

Juin n’a pas simplement ajouté des briques à la tour IA ; il a rappelé que l’innovation n’est pas l’ennemi de l’autonomie. Avec autant de modèles open‑source, jamais il n’a été aussi simple d’auto‑héberger un assistant, un moteur de recherche ou un générateur d’images. Alors, quel modèle allez‑vous tester ? Je vote Gemma 3n sur un mini‑PC fanless et vous ?

On se retrouve sur X (@AekoneTheGreat) pour continuer la discussion, partager nos découvertes ou râler sur la dernière mise à jour trop bavarde d’un modèle. Suivez-moi si ce genre de veille vous plaît, et comme toujours : prenez soin de vos données, et de votre cerveau numérique aussi !

Ak1 🙌


Newsletter

Recevez ma newsletter mensuelle afin de ne rien rater. Inscrivez-vous ici :

Laisser un commentaire

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *