đ” Prenez votre boisson prĂ©fĂ©rĂ©e (vous avez essayĂ© les Bubble Tea?)âŻ: le mois de juin a filĂ© comme un commit --amend
sur le tronc principal de lâIA. Entre mastodontes propriĂ©taires qui rĂȘvent dâoccuper toutes les fermes GPU et pĂ©pites openâsource Ă compiler sur un NUC, il y avait de quoi remplir plusieurs flux RSS. Jâai farfouillĂ© blogs, repos GitHub, keynotes et fils X pour vous concocter un condensĂ© aussi gourmand quâun fondant au chocolat⊠mais zĂ©ro calories cĂŽtĂ© vie privĂ©e. On y vaâŻ!
(Moi, jâaime bien celui Ă la poudre de taro et aux perles de tapioca :D)
Panorama express
Commençons par prendre un peu de recul. Juin a été marqué par cinq dynamiques fortes :
- Lâhyperâscaling des gĂ©ants : Google pousse GeminiâŻ2.5âŻPro dans des contextes dâun million de tokens, tandis quâElon rĂ©plique en installant GrokâŻ3 sur lâinfra costaude dâOracle. CĂŽtĂ© multimodal, ImagenâŻ4 et MidjourneyâŻV1 allument respectivement la fibre crĂ©ative (images nettes, texte lisible) et la fibre cinĂ©phile (clips vidĂ©o gĂ©nĂ©rĂ©s en un prompt).
- Le grand retour du libre : GemmaâŻ3n, Magistral Small, Mistral Small 3.2, Qwen3âŻEmbedding ou encore SigLIPâŻ2 prouvent quâil est possible de conjuguer performance et licence permissive. Les projets autoâhĂ©bergĂ©s ont le sourire.
- Des outils pour tous : Gemini CLI et QodoâŻGen CLI transforment la ligne de commande en vĂ©ritable panneau de contrĂŽle IA, sans quitter son terminal favori (Tilix avec Oh My Zsh par exemple :D).
- Des deals qui dessinent lâavenir : xAI signe avec Oracle, Google sâimmisce dans les Ă©coles aux cĂŽtĂ©s de Pearson, Tesla lĂąche sa flotte Robotaxi dans un quartier bouclĂ© dâAustin. Les applications deviennent concrĂštes⊠et commerciales.
- Recherche & Ă©thique main dans la main : DeepMind dĂ©cortique lâADN, OpenAI publie un rapport antiâabus touffu, et WikipĂ©dia temporise son expĂ©rimentation dâIA gĂ©nĂ©rative. Lâinnovation avance, mais la vigilance citoyenne ne sâendort pas.
Voilà pour le décor. Entrons dans les coulisses.
Les modĂšles phares cĂŽtĂ© «âŻgros serveursâŻÂ»
đ§ GeminiâŻ2.5âŻPro â rĂ©flexion longue distance
Le nouveau cru de Google double la mise : jusquâĂ un million de tokens de contexte, un mode Flash qui rĂ©pond Ă la vitesse de lâĂ©clair quand on lui pose une question de routine, et surtout DeepâŻThink, bouton magique qui consent Ă cogiter plus longtemps pour gagner en profondeur dâanalyse. Le tout sâentremĂȘle Ă la synthĂšse vocale maison ; pratique pour ceux qui rĂȘvent dâun assistant qui change de langue et de modalitĂ© sans cligner des yeux. Petit bĂ©molâŻ: toujours pas dâexĂ©cution «âŻfull onâdeviceâŻÂ», mĂȘme si Google jure quâun chiffrement de boutâenâbout arrive.
đ°ïž GrokâŻ3 â lâeffet de levier Oracle
xAI a trouvĂ© chez Oracle Cloud Infrastructure un terrain de jeu Ă sa mesure. RĂ©sultatâŻ: des endpoints annoncĂ©s sans rĂ©tention de log, un tarif au token plus doux pour les trĂšs gros volumes, et un pipeline taillĂ© pour entraĂźner Grok 4 sans changer de datacenter. Les premiers retours dâintĂ©grateurs parlent dâun dĂ©bit soutenu autour de 400 requĂȘtes par seconde sur de longs contextes. Reste Ă voir si la promesse «âŻmoins woke / plus factuelâŻÂ» se concrĂ©tise !
đš ImagenâŻ4 & đŹ MidjourneyâŻV1 â lâart en deux actes
- ImagenâŻ4 apporte enfin des lettres lisibles dans les posters gĂ©nĂ©rĂ©sâŻ; fini le charabia en police 3âŻpt. Un filtre «âŻbrandâsafeâŻÂ» coupe automatiquement nuditĂ© et violence, plutĂŽt pratique pour les Ă©quipes marketing qui ne veulent pas jouer les censeurs.
- MidjourneyâŻV1 passe, lui, Ă la vidĂ©o de 5 à  10âŻsecondes. Les crĂ©atifs saluent la direction artistique trĂšs «âŻclip MTV**âŻÂ». Attention, chaque rendu grignote vos prĂ©cieuses fastâminutes Discord : Ă rĂ©server pour les projets qui mĂ©ritent la dĂ©pense.
đ€ Redwood â lâIA mĂ©nagĂšre
Chez 1X Technologies, Redwood AI sert de quadriceps cĂ©rĂ©bral Ă NEO lâhumanoĂŻde. GrĂące Ă un entraĂźnement sur plusieurs millions de sĂ©quences robotiques, le robot sait dĂ©sormais ouvrir une porte, manipuler une tasse sans la briser et, point de test ultime, plier un Tâshirt sans le transformer en boule. DerriĂšre la dĂ©mo se cache une vraie prouesse : toute lâinfĂ©rence tourne onâdevice, sans renvoi dans le cloud. Imaginez la mĂȘme chose dans une usine ou une maison connectĂ©e sans fibre.
Focus OpenâSource : les pĂ©pites de juin 2025
đ± GemmaâŻ3n â mini, mais pas timide
Google frappe oĂč on ne lâattend pas : un duo 2âŻB / 4âŻB paramĂštres, architecture MatFormer Ă commutation dynamique. Sur un laptop milieuâŻdeâŻgamme, le modĂšle tourne en local, accepte texte, image, audio et tient sous 2âŻGo de RAM en quantisation 4âbit. Licence Apache 2.0 et conteneur Docker clĂ© en main : ollama pull gemma:3n
et on discute.
đč Magistral Small & Mistral Small 3.2 â la touche française
Mistral ne se contente plus de gros modĂšles : avec Magistral Small (24âŻB) il vise le reasoning pur et chatouille dĂ©jĂ les scores dâAIME. Sa petite sĆur Mistral Small 3.2 pousse la fenĂȘtre de contexte Ă 128âŻk tokens ; de quoi ingĂ©rer un livre blanc Ă©pais sans se perdre. Les deux arrivent quantisĂ©es dĂšs la sortie et gardent le drapeau ApacheâŻ2.0 hissĂ© bien haut.
đ Qwen3âŻEmbedding â moteur de recherche maison
Alibaba propose une famille embedding / reranker multilingue qui sâempare du trĂŽne MTEB. IdĂ©al pour bĂątir un moteur interne, ou remplacer Google sur votre navigateur, tout en supportant plus de cent langues. Dans nos tests, le modĂšle retrouve un paragraphe obscur de documentation YunoHost cachĂ© au fond dâun PDF. Prometteur.
đ SigLIPâŻ2 â quand lâimage parle toutes les langues
DeepMind ouvre les poids de SigLIPâŻ2, encodeur visuelâlangagier qui sait lier une photo Ă sa description sans tergiverser. Checkpoints FP16 et INT8 prĂȘts Ă lâemploi, latence gentille (<âŻ100âŻms sur RTX 4090)âŻ; parfait pour un classifieur en temps rĂ©el ou un moteur de recherche iconographique autoâhĂ©bergĂ©.
Outils & Frameworks qui changent la vie des devs
đ» Gemini CLI â le copilote qui respecte votre shell
Un binaire openâsource, authentification Google et câest parti : vous tapez gai run
, il gĂ©nĂšre la fonction manquanteâŻ; gai explain
, il clarifie un diff absconsâŻ; gai img
, il appelle Imagen. Limite gratuite honnĂȘte pour le perso, et surtout hooks Python ouverts pour brancher votre wiki maison ou votre forge Gitea. Pratique pour garder les mains sur le clavier plutĂŽt que dans la doc.
đ ïž QodoâŻGen CLI â un agent, un YAML, câest livrĂ©
qodo init
vous crée un agent.yaml
oĂč vous dĂ©crivez dĂ©clencheur, actions, backend LLM. Push, et lâusine Ă conteneurs sort un microâservice autonome qui Ă©coute vos webhooks GitLab et commente les merge requests. Les Ă©quipes DevOps annoncent dĂ©jĂ un gain de productivitĂ© Ă deux chiffres. Reste Ă voir si la plomberie tient sur des dĂ©pĂŽts gĂ©ants.
Deals & intégrations : les coulisses du business
- xAI et Oracle signent pour mettre GrokâŻ3 Ă lâabri de la pĂ©nurie GPU. Pour nous, câest la promesse dâune alternative âcloud souverainâ Ă Azure + OpenAI, encore faudraâtâil vĂ©rifier la rĂ©alitĂ© des endpoints sans log.
- Google et Pearson injectent Gemini dans des milliers de salles de classe britanniques. Retour terrain : correction instantanĂ©e des devoirs et feedback vocal personnalisĂ©. Ăa impressionne, mais la question de la donnĂ©e Ă©lĂšve reste posĂ©e.
- Tesla Robotaxi tourne dĂ©sormais dans un quartier balisĂ© dâAustin. Quelques freinages fantĂŽmes ont dĂ©jĂ attirĂ© lâĆil de la NHTSA, mais les passagers saluent une note moyenne de confort «âŻauâdessus du VTC lambdaâŻÂ».
Recherche & percĂ©esâŻ: lâIA qui creuse profond
- AlphaGenome assemble des centaines de millions de variants rĂ©gulateurs et entraĂźne un Transformer qui raccourcit dâun facteurâŻ10 lâannotation dâun exome complet. La mĂ©decine personnalisĂ©e nâa jamais Ă©tĂ© aussi proche dâun mode âfast previewâ.
- OpenAI publie un rapport trente scĂ©narios dâabus, de la fraude vocale Ă la bioâmenace, avec un KâIndex pour mesurer le risque. Vous voulez durcir votre pipeline ? Les checkâlists valent le dĂ©tour.
- WikipĂ©dia suspend sa fonctionnalitĂ© AIâpreview aprĂšs une fronde interne : hallucinations, erreurs de citations, bref, rien que du connu⊠mais Ă lâĂ©chelle de lâencyclopĂ©die, ça fait des vagues.
- ElevenLabsâŻv3 place la barre haute en synthĂšse vocaleâŻ: balises [whisper] ou [shout] dĂ©tectĂ©es dynamiquement, intonations fluides, bref le futur du doublage indĂ©.
Dans la marmite X (exâTwitter)
Chez les microâbloggers, ça discute surtout :
- du hashtag #MJVideo et de ses fanâedits façon Studio Ghibli rencontre TerminatorâŻ;
- des comparaisons entre Gemini CLI et Copilot, GitHub promettant dĂ©jĂ ses âCopilot Agentsâ pour lâĂ©tĂ©âŻ;
- du teasing dâElon, qui jure que Grok 4 sera «âŻplein de francâparler et dĂ©nuĂ© de copierâcoller mainstreamâŻÂ»âŻ;
- et, plus terreâĂ âterre, des licenciements chez Amazon AWS, officiellement imputĂ©s à «âŻlâautomatisation via lâIAâŻÂ». Lâimpact social ne se discute plus, il se vit.
Ce quâon guette pour juillet
- LâarrivĂ©e (en thĂ©orie) de GPTâ5 et le benchmark qui lâaccompagnera.
- Les premiers retours onâdevice de Gemma 3n sur smartphones Android et mĂȘme sur RaspberryâŻPi 5.
- Une rumeur insistante dâun DeepSeek R2 openâsource en 16âŻB paramĂštres, qui viendrait bousculer le ranking.
Conclusion
Juin nâa pas simplement ajoutĂ© des briques Ă la tour IAâŻ; il a rappelĂ© que lâinnovation nâest pas lâennemi de lâautonomie. Avec autant de modĂšles openâsource, jamais il nâa Ă©tĂ© aussi simple dâautoâhĂ©berger un assistant, un moteur de recherche ou un gĂ©nĂ©rateur dâimages. Alors, quel modĂšle allezâvous tester ? Je vote Gemma 3n sur un miniâPC fanless et vousâŻ?
On se retrouve sur X (@AekoneTheGreat) pour continuer la discussion, partager nos dĂ©couvertes ou rĂąler sur la derniĂšre mise Ă jour trop bavarde dâun modĂšle. Suivez-moi si ce genre de veille vous plaĂźt, et comme toujours : prenez soin de vos donnĂ©es, et de votre cerveau numĂ©rique aussi !
Ak1 đ
Newsletter
Recevez ma newsletter mensuelle afin de ne rien rater. Inscrivez-vous ici :