🍵 Prenez votre boisson préférée (vous avez essayé les Bubble Tea?) : le mois de juin a filé comme un commit --amend
sur le tronc principal de l’IA. Entre mastodontes propriétaires qui rêvent d’occuper toutes les fermes GPU et pépites open‑source à compiler sur un NUC, il y avait de quoi remplir plusieurs flux RSS. J’ai farfouillé blogs, repos GitHub, keynotes et fils X pour vous concocter un condensé aussi gourmand qu’un fondant au chocolat… mais zéro calories côté vie privée. On y va !
(Moi, j’aime bien celui à la poudre de taro et aux perles de tapioca :D)
Panorama express
Commençons par prendre un peu de recul. Juin a été marqué par cinq dynamiques fortes :
- L’hyper‑scaling des géants : Google pousse Gemini 2.5 Pro dans des contextes d’un million de tokens, tandis qu’Elon réplique en installant Grok 3 sur l’infra costaude d’Oracle. Côté multimodal, Imagen 4 et Midjourney V1 allument respectivement la fibre créative (images nettes, texte lisible) et la fibre cinéphile (clips vidéo générés en un prompt).
- Le grand retour du libre : Gemma 3n, Magistral Small, Mistral Small 3.2, Qwen3 Embedding ou encore SigLIP 2 prouvent qu’il est possible de conjuguer performance et licence permissive. Les projets auto‑hébergés ont le sourire.
- Des outils pour tous : Gemini CLI et Qodo Gen CLI transforment la ligne de commande en véritable panneau de contrôle IA, sans quitter son terminal favori (Tilix avec Oh My Zsh par exemple :D).
- Des deals qui dessinent l’avenir : xAI signe avec Oracle, Google s’immisce dans les écoles aux côtés de Pearson, Tesla lâche sa flotte Robotaxi dans un quartier bouclé d’Austin. Les applications deviennent concrètes… et commerciales.
- Recherche & éthique main dans la main : DeepMind décortique l’ADN, OpenAI publie un rapport anti‑abus touffu, et Wikipédia temporise son expérimentation d’IA générative. L’innovation avance, mais la vigilance citoyenne ne s’endort pas.
Voilà pour le décor. Entrons dans les coulisses.
Les modèles phares côté « gros serveurs »
🧠Gemini 2.5 Pro – réflexion longue distance
Le nouveau cru de Google double la mise : jusqu’à un million de tokens de contexte, un mode Flash qui répond à la vitesse de l’éclair quand on lui pose une question de routine, et surtout Deep Think, bouton magique qui consent à cogiter plus longtemps pour gagner en profondeur d’analyse. Le tout s’entremêle à la synthèse vocale maison ; pratique pour ceux qui rêvent d’un assistant qui change de langue et de modalité sans cligner des yeux. Petit bémol : toujours pas d’exécution « full on‑device », même si Google jure qu’un chiffrement de bout‑en‑bout arrive.
🛰️ Grok 3 – l’effet de levier Oracle
xAI a trouvé chez Oracle Cloud Infrastructure un terrain de jeu à sa mesure. Résultat : des endpoints annoncés sans rétention de log, un tarif au token plus doux pour les très gros volumes, et un pipeline taillé pour entraîner Grok 4 sans changer de datacenter. Les premiers retours d’intégrateurs parlent d’un débit soutenu autour de 400 requêtes par seconde sur de longs contextes. Reste à voir si la promesse « moins woke / plus factuel » se concrétise !
🎨 Imagen 4 & 🎬 Midjourney V1 – l’art en deux actes
- Imagen 4 apporte enfin des lettres lisibles dans les posters générés ; fini le charabia en police 3 pt. Un filtre « brand‑safe » coupe automatiquement nudité et violence, plutôt pratique pour les équipes marketing qui ne veulent pas jouer les censeurs.
- Midjourney V1 passe, lui, à la vidéo de 5 à  10 secondes. Les créatifs saluent la direction artistique très « clip MTV** ». Attention, chaque rendu grignote vos précieuses fast‑minutes Discord : à réserver pour les projets qui méritent la dépense.
🤖 Redwood – l’IA ménagère
Chez 1X Technologies, Redwood AI sert de quadriceps cérébral à NEO l’humanoïde. Grâce à un entraînement sur plusieurs millions de séquences robotiques, le robot sait désormais ouvrir une porte, manipuler une tasse sans la briser et, point de test ultime, plier un T‑shirt sans le transformer en boule. Derrière la démo se cache une vraie prouesse : toute l’inférence tourne on‑device, sans renvoi dans le cloud. Imaginez la même chose dans une usine ou une maison connectée sans fibre.
Focus Open‑Source : les pépites de juin 2025
🌱 Gemma 3n – mini, mais pas timide
Google frappe où on ne l’attend pas : un duo 2 B / 4 B paramètres, architecture MatFormer à commutation dynamique. Sur un laptop milieu de gamme, le modèle tourne en local, accepte texte, image, audio et tient sous 2 Go de RAM en quantisation 4‑bit. Licence Apache 2.0 et conteneur Docker clé en main : ollama pull gemma:3n
et on discute.
🏹 Magistral Small & Mistral Small 3.2 – la touche française
Mistral ne se contente plus de gros modèles : avec Magistral Small (24 B) il vise le reasoning pur et chatouille déjà les scores d’AIME. Sa petite sœur Mistral Small 3.2 pousse la fenêtre de contexte à 128 k tokens ; de quoi ingérer un livre blanc épais sans se perdre. Les deux arrivent quantisées dès la sortie et gardent le drapeau Apache 2.0 hissé bien haut.
🔗 Qwen3 Embedding – moteur de recherche maison
Alibaba propose une famille embedding / reranker multilingue qui s’empare du trône MTEB. Idéal pour bâtir un moteur interne, ou remplacer Google sur votre navigateur, tout en supportant plus de cent langues. Dans nos tests, le modèle retrouve un paragraphe obscur de documentation YunoHost caché au fond d’un PDF. Prometteur.
👀 SigLIP 2 – quand l’image parle toutes les langues
DeepMind ouvre les poids de SigLIP 2, encodeur visuel‑langagier qui sait lier une photo à sa description sans tergiverser. Checkpoints FP16 et INT8 prêts à l’emploi, latence gentille (< 100 ms sur RTX 4090) ; parfait pour un classifieur en temps réel ou un moteur de recherche iconographique auto‑hébergé.
Outils & Frameworks qui changent la vie des devs
💻 Gemini CLI – le copilote qui respecte votre shell
Un binaire open‑source, authentification Google et c’est parti : vous tapez gai run
, il génère la fonction manquante ; gai explain
, il clarifie un diff abscons ; gai img
, il appelle Imagen. Limite gratuite honnĂŞte pour le perso, et surtout hooks Python ouverts pour brancher votre wiki maison ou votre forge Gitea. Pratique pour garder les mains sur le clavier plutĂ´t que dans la doc.
🛠️ Qodo Gen CLI – un agent, un YAML, c’est livré
qodo init
vous crée un agent.yaml
où vous décrivez déclencheur, actions, backend LLM. Push, et l’usine à conteneurs sort un micro‑service autonome qui écoute vos webhooks GitLab et commente les merge requests. Les équipes DevOps annoncent déjà un gain de productivité à deux chiffres. Reste à voir si la plomberie tient sur des dépôts géants.
Deals & intégrations : les coulisses du business
- xAI et Oracle signent pour mettre Grok 3 à l’abri de la pénurie GPU. Pour nous, c’est la promesse d’une alternative “cloud souverain” à Azure + OpenAI, encore faudra‑t‑il vérifier la réalité des endpoints sans log.
- Google et Pearson injectent Gemini dans des milliers de salles de classe britanniques. Retour terrain : correction instantanée des devoirs et feedback vocal personnalisé. Ça impressionne, mais la question de la donnée élève reste posée.
- Tesla Robotaxi tourne désormais dans un quartier balisé d’Austin. Quelques freinages fantômes ont déjà attiré l’œil de la NHTSA, mais les passagers saluent une note moyenne de confort « au‑dessus du VTC lambda ».
Recherche & percées : l’IA qui creuse profond
- AlphaGenome assemble des centaines de millions de variants régulateurs et entraîne un Transformer qui raccourcit d’un facteur 10 l’annotation d’un exome complet. La médecine personnalisée n’a jamais été aussi proche d’un mode “fast preview”.
- OpenAI publie un rapport trente scénarios d’abus, de la fraude vocale à la bio‑menace, avec un K‑Index pour mesurer le risque. Vous voulez durcir votre pipeline ? Les check‑lists valent le détour.
- Wikipédia suspend sa fonctionnalité AI‑preview après une fronde interne : hallucinations, erreurs de citations, bref, rien que du connu… mais à l’échelle de l’encyclopédie, ça fait des vagues.
- ElevenLabs v3 place la barre haute en synthèse vocale : balises [whisper] ou [shout] détectées dynamiquement, intonations fluides, bref le futur du doublage indé.
Dans la marmite X (ex‑Twitter)
Chez les micro‑bloggers, ça discute surtout :
- du hashtag #MJVideo et de ses fan‑edits façon Studio Ghibli rencontre Terminator ;
- des comparaisons entre Gemini CLI et Copilot, GitHub promettant déjà ses “Copilot Agents” pour l’été ;
- du teasing d’Elon, qui jure que Grok 4 sera « plein de franc‑parler et dénué de copier‑coller mainstream » ;
- et, plus terre‑à ‑terre, des licenciements chez Amazon AWS, officiellement imputés à « l’automatisation via l’IA ». L’impact social ne se discute plus, il se vit.
Ce qu’on guette pour juillet
- L’arrivée (en théorie) de GPT‑5 et le benchmark qui l’accompagnera.
- Les premiers retours on‑device de Gemma 3n sur smartphones Android et même sur Raspberry Pi 5.
- Une rumeur insistante d’un DeepSeek R2 open‑source en 16 B paramètres, qui viendrait bousculer le ranking.
Conclusion
Juin n’a pas simplement ajouté des briques à la tour IA ; il a rappelé que l’innovation n’est pas l’ennemi de l’autonomie. Avec autant de modèles open‑source, jamais il n’a été aussi simple d’auto‑héberger un assistant, un moteur de recherche ou un générateur d’images. Alors, quel modèle allez‑vous tester ? Je vote Gemma 3n sur un mini‑PC fanless et vous ?
On se retrouve sur X (@AekoneTheGreat) pour continuer la discussion, partager nos découvertes ou râler sur la dernière mise à jour trop bavarde d’un modèle. Suivez-moi si ce genre de veille vous plaît, et comme toujours : prenez soin de vos données, et de votre cerveau numérique aussi !
Ak1 🙌
Newsletter
Recevez ma newsletter mensuelle afin de ne rien rater. Inscrivez-vous ici :