IA Monthly #04 : Juin 2025

Juin 2025 a Ă©tĂ© intense : Gemini 2.5 Pro s’équipe d’un mode Deep Think, Midjourney passe Ă  la vidĂ©o, et cĂŽtĂ© open-source, Gemma 3n, Magistral Small & Mistral Small 3.2 brillent enfin en local.

đŸ” Prenez votre boisson prĂ©fĂ©rĂ©e (vous avez essayĂ© les Bubble Tea?) : le mois de juin a filĂ© comme un commit --amend sur le tronc principal de l’IA. Entre mastodontes propriĂ©taires qui rĂȘvent d’occuper toutes les fermes GPU et pĂ©pites open‑source Ă  compiler sur un NUC, il y avait de quoi remplir plusieurs flux RSS. J’ai farfouillĂ© blogs, repos GitHub, keynotes et fils X pour vous concocter un condensĂ© aussi gourmand qu’un fondant au chocolat
 mais zĂ©ro calories cĂŽtĂ© vie privĂ©e. On y va !

(Moi, j’aime bien celui à la poudre de taro et aux perles de tapioca :D)


Panorama express

Commençons par prendre un peu de recul. Juin a Ă©tĂ© marquĂ© par cinq dynamiques fortes :

  1. L’hyper‑scaling des gĂ©ants : Google pousse Gemini 2.5 Pro dans des contextes d’un million de tokens, tandis qu’Elon rĂ©plique en installant Grok 3 sur l’infra costaude d’Oracle. CĂŽtĂ© multimodal, Imagen 4 et Midjourney V1 allument respectivement la fibre crĂ©ative (images nettes, texte lisible) et la fibre cinĂ©phile (clips vidĂ©o gĂ©nĂ©rĂ©s en un prompt).
  2. Le grand retour du libre : Gemma 3n, Magistral Small, Mistral Small 3.2, Qwen3 Embedding ou encore SigLIP 2 prouvent qu’il est possible de conjuguer performance et licence permissive. Les projets auto‑hĂ©bergĂ©s ont le sourire.
  3. Des outils pour tous : Gemini CLI et Qodo Gen CLI transforment la ligne de commande en vĂ©ritable panneau de contrĂŽle IA, sans quitter son terminal favori (Tilix avec Oh My Zsh par exemple :D).
  4. Des deals qui dessinent l’avenir : xAI signe avec Oracle, Google s’immisce dans les Ă©coles aux cĂŽtĂ©s de Pearson, Tesla lĂąche sa flotte Robotaxi dans un quartier bouclĂ© d’Austin. Les applications deviennent concrĂštes
 et commerciales.
  5. Recherche & Ă©thique main dans la main : DeepMind dĂ©cortique l’ADN, OpenAI publie un rapport anti‑abus touffu, et WikipĂ©dia temporise son expĂ©rimentation d’IA gĂ©nĂ©rative. L’innovation avance, mais la vigilance citoyenne ne s’endort pas.

Voilà pour le décor. Entrons dans les coulisses.


Les modĂšles phares cĂŽtĂ© « gros serveurs »

🧠 Gemini 2.5 Pro – rĂ©flexion longue distance

Le nouveau cru de Google double la mise : jusqu’à un million de tokens de contexte, un mode Flash qui rĂ©pond Ă  la vitesse de l’éclair quand on lui pose une question de routine, et surtout Deep Think, bouton magique qui consent Ă  cogiter plus longtemps pour gagner en profondeur d’analyse. Le tout s’entremĂȘle Ă  la synthĂšse vocale maison ; pratique pour ceux qui rĂȘvent d’un assistant qui change de langue et de modalitĂ© sans cligner des yeux. Petit bĂ©mol : toujours pas d’exĂ©cution « full on‑device », mĂȘme si Google jure qu’un chiffrement de bout‑en‑bout arrive.

đŸ›°ïž Grok 3 – l’effet de levier Oracle

xAI a trouvĂ© chez Oracle Cloud Infrastructure un terrain de jeu Ă  sa mesure. RĂ©sultat : des endpoints annoncĂ©s sans rĂ©tention de log, un tarif au token plus doux pour les trĂšs gros volumes, et un pipeline taillĂ© pour entraĂźner Grok 4 sans changer de datacenter. Les premiers retours d’intĂ©grateurs parlent d’un dĂ©bit soutenu autour de 400 requĂȘtes par seconde sur de longs contextes. Reste Ă  voir si la promesse « moins woke / plus factuel » se concrĂ©tise !

🎹 Imagen 4 & 🎬 Midjourney V1 – l’art en deux actes

  • Imagen 4 apporte enfin des lettres lisibles dans les posters gĂ©nĂ©rĂ©s ; fini le charabia en police 3 pt. Un filtre « brand‑safe » coupe automatiquement nuditĂ© et violence, plutĂŽt pratique pour les Ă©quipes marketing qui ne veulent pas jouer les censeurs.
  • Midjourney V1 passe, lui, Ă  la vidĂ©o de 5 à 10 secondes. Les crĂ©atifs saluent la direction artistique trĂšs « clip MTV** ». Attention, chaque rendu grignote vos prĂ©cieuses fast‑minutes Discord : Ă  rĂ©server pour les projets qui mĂ©ritent la dĂ©pense.

đŸ€– Redwood – l’IA mĂ©nagĂšre

Chez 1X Technologies, Redwood AI sert de quadriceps cĂ©rĂ©bral Ă  NEO l’humanoĂŻde. GrĂące Ă  un entraĂźnement sur plusieurs millions de sĂ©quences robotiques, le robot sait dĂ©sormais ouvrir une porte, manipuler une tasse sans la briser et, point de test ultime, plier un T‑shirt sans le transformer en boule. DerriĂšre la dĂ©mo se cache une vraie prouesse : toute l’infĂ©rence tourne on‑device, sans renvoi dans le cloud. Imaginez la mĂȘme chose dans une usine ou une maison connectĂ©e sans fibre.


Focus Open‑Source : les pĂ©pites de juin 2025

đŸŒ± Gemma 3n – mini, mais pas timide

Google frappe oĂč on ne l’attend pas : un duo 2 B / 4 B paramĂštres, architecture MatFormer Ă  commutation dynamique. Sur un laptop milieu de gamme, le modĂšle tourne en local, accepte texte, image, audio et tient sous 2 Go de RAM en quantisation 4‑bit. Licence Apache 2.0 et conteneur Docker clĂ© en main : ollama pull gemma:3n et on discute.

đŸč Magistral Small & Mistral Small 3.2 – la touche française

Mistral ne se contente plus de gros modĂšles : avec Magistral Small (24 B) il vise le reasoning pur et chatouille dĂ©jĂ  les scores d’AIME. Sa petite sƓur Mistral Small 3.2 pousse la fenĂȘtre de contexte Ă  128 k tokens ; de quoi ingĂ©rer un livre blanc Ă©pais sans se perdre. Les deux arrivent quantisĂ©es dĂšs la sortie et gardent le drapeau Apache 2.0 hissĂ© bien haut.

🔗 Qwen3 Embedding – moteur de recherche maison

Alibaba propose une famille embedding / reranker multilingue qui s’empare du trĂŽne MTEB. IdĂ©al pour bĂątir un moteur interne, ou remplacer Google sur votre navigateur, tout en supportant plus de cent langues. Dans nos tests, le modĂšle retrouve un paragraphe obscur de documentation YunoHost cachĂ© au fond d’un PDF. Prometteur.

👀 SigLIP 2 – quand l’image parle toutes les langues

DeepMind ouvre les poids de SigLIP 2, encodeur visuel‑langagier qui sait lier une photo Ă  sa description sans tergiverser. Checkpoints FP16 et INT8 prĂȘts Ă  l’emploi, latence gentille (< 100 ms sur RTX 4090) ; parfait pour un classifieur en temps rĂ©el ou un moteur de recherche iconographique auto‑hĂ©bergĂ©.


Outils & Frameworks qui changent la vie des devs

đŸ’» Gemini CLI – le copilote qui respecte votre shell

Un binaire open‑source, authentification Google et c’est parti : vous tapez gai run, il gĂ©nĂšre la fonction manquante ; gai explain, il clarifie un diff abscons ; gai img, il appelle Imagen. Limite gratuite honnĂȘte pour le perso, et surtout hooks Python ouverts pour brancher votre wiki maison ou votre forge Gitea. Pratique pour garder les mains sur le clavier plutĂŽt que dans la doc.

đŸ› ïž Qodo Gen CLI – un agent, un YAML, c’est livrĂ©

qodo init vous crĂ©e un agent.yaml oĂč vous dĂ©crivez dĂ©clencheur, actions, backend LLM. Push, et l’usine Ă  conteneurs sort un micro‑service autonome qui Ă©coute vos webhooks GitLab et commente les merge requests. Les Ă©quipes DevOps annoncent dĂ©jĂ  un gain de productivitĂ© Ă  deux chiffres. Reste Ă  voir si la plomberie tient sur des dĂ©pĂŽts gĂ©ants.


Deals & intĂ©grations : les coulisses du business

  • xAI et Oracle signent pour mettre Grok 3 Ă  l’abri de la pĂ©nurie GPU. Pour nous, c’est la promesse d’une alternative “cloud souverain” Ă  Azure + OpenAI, encore faudra‑t‑il vĂ©rifier la rĂ©alitĂ© des endpoints sans log.
  • Google et Pearson injectent Gemini dans des milliers de salles de classe britanniques. Retour terrain : correction instantanĂ©e des devoirs et feedback vocal personnalisĂ©. Ça impressionne, mais la question de la donnĂ©e Ă©lĂšve reste posĂ©e.
  • Tesla Robotaxi tourne dĂ©sormais dans un quartier balisĂ© d’Austin. Quelques freinages fantĂŽmes ont dĂ©jĂ  attirĂ© l’Ɠil de la NHTSA, mais les passagers saluent une note moyenne de confort « au‑dessus du VTC lambda ».

Recherche & percĂ©es : l’IA qui creuse profond

  • AlphaGenome assemble des centaines de millions de variants rĂ©gulateurs et entraĂźne un Transformer qui raccourcit d’un facteur 10 l’annotation d’un exome complet. La mĂ©decine personnalisĂ©e n’a jamais Ă©tĂ© aussi proche d’un mode “fast preview”.
  • OpenAI publie un rapport trente scĂ©narios d’abus, de la fraude vocale Ă  la bio‑menace, avec un K‑Index pour mesurer le risque. Vous voulez durcir votre pipeline ? Les check‑lists valent le dĂ©tour.
  • WikipĂ©dia suspend sa fonctionnalitĂ© AI‑preview aprĂšs une fronde interne : hallucinations, erreurs de citations, bref, rien que du connu
 mais Ă  l’échelle de l’encyclopĂ©die, ça fait des vagues.
  • ElevenLabs v3 place la barre haute en synthĂšse vocale : balises [whisper] ou [shout] dĂ©tectĂ©es dynamiquement, intonations fluides, bref le futur du doublage indĂ©.

Dans la marmite X (ex‑Twitter)

Chez les micro‑bloggers, ça discute surtout :

  • du hashtag #MJVideo et de ses fan‑edits façon Studio Ghibli rencontre Terminator ;
  • des comparaisons entre Gemini CLI et Copilot, GitHub promettant dĂ©jĂ  ses “Copilot Agents” pour l’été ;
  • du teasing d’Elon, qui jure que Grok 4 sera « plein de franc‑parler et dĂ©nuĂ© de copier‑coller mainstream » ;
  • et, plus terre‑à‑terre, des licenciements chez Amazon AWS, officiellement imputĂ©s Ă  « l’automatisation via l’IA ». L’impact social ne se discute plus, il se vit.

Ce qu’on guette pour juillet

  1. L’arrivĂ©e (en thĂ©orie) de GPT‑5 et le benchmark qui l’accompagnera.
  2. Les premiers retours on‑device de Gemma 3n sur smartphones Android et mĂȘme sur Raspberry Pi 5.
  3. Une rumeur insistante d’un DeepSeek R2 open‑source en 16 B paramùtres, qui viendrait bousculer le ranking.

Conclusion

Juin n’a pas simplement ajoutĂ© des briques Ă  la tour IA ; il a rappelĂ© que l’innovation n’est pas l’ennemi de l’autonomie. Avec autant de modĂšles open‑source, jamais il n’a Ă©tĂ© aussi simple d’auto‑hĂ©berger un assistant, un moteur de recherche ou un gĂ©nĂ©rateur d’images. Alors, quel modĂšle allez‑vous tester ? Je vote Gemma 3n sur un mini‑PC fanless et vous ?

On se retrouve sur X (@AekoneTheGreat) pour continuer la discussion, partager nos dĂ©couvertes ou rĂąler sur la derniĂšre mise Ă  jour trop bavarde d’un modĂšle. Suivez-moi si ce genre de veille vous plaĂźt, et comme toujours : prenez soin de vos donnĂ©es, et de votre cerveau numĂ©rique aussi !

Ak1 🙌


Newsletter

Recevez ma newsletter mensuelle afin de ne rien rater. Inscrivez-vous ici :

Laisser un commentaire

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *