📰 L'actu
Claude devient l'app n°1 après le bannissement d'Anthropic par le Pentagone: L'assistant d'Anthropic a atteint la première place de l'App Store (thedeepview.com) quelques heures après le conflit avec l'administration, tandis que les désinstallations de ChatGPT bondissaient de 295% (techcrunch.com) suite au partenariat d'OpenAI avec la Défense. Sam Altman a dû défendre la décision en interne face aux critiques de ses propres employés.
Google lance les vidéos cinématiques dans NotebookLM Studio: NotebookLM propose désormais des Cinematic Video Overviews (x.com), des vidéos immersives générées à partir de vos sources grâce à une combinaison de ses modèles les plus avancés. La fonctionnalité, disponible pour les utilisateurs Ultra en anglais, fait évoluer NotebookLM au-delà des résumés audio vers la production vidéo sur mesure.
OpenAI lance GPT-5.3 Instant, son modèle conversationnel le moins "robotique": La mise à jour promet moins de refus inutiles, un ton moins moralisateur (openai.com) et une réduction des hallucinations de 27% avec le web et 20% sans. OpenAI cible ici l'expérience quotidienne plutôt que les benchmarks, en corrigeant les tics de GPT-5.2 comme les préambules défensifs et les "Stop. Respirez un grand coup."
OpenAI dépasse 25 milliards de dollars de revenus annualisés, Anthropic réduit l'écart: OpenAI affiche 17% de croissance depuis fin 2025 (theinformation.com), mais Anthropic a triplé ses revenus sur la même période pour atteindre 19 milliards, porté par le succès de ses outils de code. L'agent Codex d'OpenAI compte 2 millions d'utilisateurs actifs hebdomadaires, ChatGPT plafonne à 920 millions (loin de l'objectif du milliard), et les deux entreprises prévoient de brûler des dizaines de milliards avant d'envisager une introduction en bourse.
Le leader technique de Qwen quitte Alibaba au lendemain du lancement de Qwen 3.5: Junyang Lin, figure centrale du projet Qwen, a annoncé son départ (techcrunch.com) un jour après la présentation des quatre modèles Qwen 3.5 Small (0.8B à 9B paramètres). Plusieurs collègues ont réagi vivement sur X, l'un d'eux écrivant "je sais que partir n'était pas ton choix", suggérant un départ contraint au moment où la famille Qwen rivalisait avec les modèles américains sur les benchmarks.
💡 L'éclairage d'Ethan Mollick
La fin annoncée des modèles open weights de frontière
Ethan Mollick, professeur à Wharton et auteur de Co-Intelligence, estime qu'il est "tout à fait possible" qu'il n'y ait bientôt plus de nouveaux modèles open weights à la frontière. Son raisonnement tient en trois points.
Le premier est économique. Produire un modèle de frontière coûte de plus en plus cher. Contrairement à l'open source logiciel classique (Red Hat, Android), il n'existe pas de mécanisme évident pour récupérer cet investissement une fois les poids publiés. Pas de services complémentaires, pas de verrouillage d'écosystème. Le modèle est dans la nature.
Le deuxième est géopolitique. L'hypothèse que les labs chinois continueront indéfiniment à distribuer leurs modèles gratuitement ne tient pas, selon Mollick. Les récentes tensions entre Washington et Pékin sur l'accès aux modèles d'IA ont montré à quel point ces actifs sont devenus stratégiques. Un gouvernement qui subventionne la création de modèles a tout intérêt à en garder le contrôle, pas à les offrir à ses concurrents.
Le troisième point est technique. Mollick rappelle que "le meilleur outillage du monde ne fera pas d'un modèle vieux de deux ans un modèle de frontière". Les praticiens qui construisent aujourd'hui sur des modèles open weights, que ce soit pour du fine-tuning, du déploiement local ou de la souveraineté des données, pourraient se retrouver avec un choix entre des modèles propriétaires de frontière et des modèles ouverts de plus en plus dépassés.
Le cas Qwen illustre ces risques. Après le départ de Junyang Lin, figure centrale du projet chez Alibaba (voir actu ci-dessus), plusieurs responsables techniques clés (code, post-training, vision) auraient aussi quitté l'équipe, selon Simon Willison, possiblement en réaction à une réorganisation interne. La situation reste floue, mais Willison note que ce serait "une vraie tragédie" si l'équipe se dispersait alors que Qwen 3.5 rivalisait avec les modèles américains dans des tailles toujours plus compactes.
It’s not about junior vs senior, it’s about “good with AI” vs “not good with AI.”
Naval Ravikant, co-fondateur et ancien CEO d'AngelList
🤥 Mensonges
Le consultant
Je mens à Claude.
Pas des gros mensonges. Des petits. Stratégiques. Quand j'ai un document à faire relire, un plan, un texte, des instructions, peu importe, je ne dis pas "voilà ce que j'ai écrit, t'en penses quoi ?". Je dis :
"Regarde ce que le consultant m'a pondu. Tu valides ?"
Et là, Claude se fait plaisir. "La structure est bancale." "Le point 3 est redondant avec le point 1." "Cette partie manque de substance." Des trucs qu'il ne m'aurait pas forcément dits si j'avais présenté le texte comme le mien.
Vous connaissez son penchant pour la flagornerie. En attribuant le texte à quelqu'un d'autre, je la court-circuite. Le modèle n'a plus à me ménager. C'est pas mon texte. C'est celui du consultant. McKinsey, en plus. Autant dire que Claude n'a aucune pitié.
Le consultant, c'est un exemple. J'ai tout un casting. Mon chef qui croit tout savoir. Mon stagiaire. Mon collègue relou.
Le texte est le même. Mot pour mot. Seule l'attribution change. Et ça suffit pour que la réponse soit différente. Toujours biaisée, mais un biais que je contrôle un peu +. Et avec lequel je joue.
Machiavélique ? Ouais. Mais utile. Et, si on y réfléchit, pas si différent de ce qu'on fait entre humains. Vous avez déjà demandé à un ami "un pote m'a dit que..., t'en penses quoi ?" en sachant pertinemment que le pote, c'est vous ?
Encore une astuce bizarre et complètement non documentée.
Bonus
Sur le groupe WhatsApp, quelqu'un a demandé si on utilisait encore le fameux "Tu es un expert en X". Perso, non. Mais ça m'a fait penser à un truc.
"Tu es un expert en marketing", c'est petit joueur. Dites à votre LLM qu'il EST le marketing. Littéralement. Pourquoi s'embêter avec un expert quand on peut parler directement au concept ?
"Tu es la mass salariale de mon entreprise." "Tu es mon pipeline de ventes." "Tu es le code review de mon équipe."
Essayez. C'est marrant.