L'Observatoire de l'IA #04 - 9 au 15 août 2024

FLUX vs Midjourney, Falcon Mamba 7B, robots chez BMW et l'IA dans l'éducation !

Salut tout le monde ! 👋

Bienvenue dans cette quatrième édition de "L'Observatoire de l'IA". 

Des nouveaux modèles FalconMamba 7B et FLUX aux agents autonomes / robotaxis, en passant par les procès d'artistes et les inquiétudes d'OpenAI sur les relations homme-IA, on fait un tour complet de l'actualité !

Les nouveaux modèles à la une ! 🏎️

Falcon Mamba 7B : le petit nouveau du TII

Le Technology Innovation Institute (TII) nous sort un modèle de langage open source qui en a sous le capot ! Le Falcon Mamba 7B utilise une architecture appelée “SSLM” (State Space Language Model) et fait mieux que des modèles avec de plus gros paramètres comme Llama 3.1 8B de Meta. Plus de texte traité, moins de mémoire utilisée : la recette gagnante ?

Source : Maginative

VFusion3D : de la 2D à la 3D en un clic

Meta et l'Université d'Oxford ont concocté VFusion3D, un outil qui transforme vos images 2D en modèles 3D en un clin d'œil. Un outil génial pour les jeux vidéo et la réalité virtuelle. Certaines personnes ont cependant pointé du doigt la question des deepfakes en 3D et des usurpateurs d’identité qui pourraient en profiter.

Source : PCGuide

Le focus de la semaine : FLUX 💫

L’arrivée fracassante de FLUX : concurrent (open-source) direct à MidJourney

Sorti sans prévenir il y a quelques jours, nous assistons à l'émergence d'un nouvel outil qui promet de bouleverser le monde de la génération d'images : Flux. Développé par Black Forest Labs, ce modèle open-source s'impose comme un concurrent sérieux face aux géants du secteur MidJourney et DALL-E. 

L'arrivée surprise de Black Forest Labs

Le 1er août 2024, Black Forest Labs a fait une entrée fracassante sur la scène de l'IA générative. Cette start-up, composée d'anciens de Stable Diffusion, a lancé Flux sans tambour ni trompette, prenant tout le monde de court. 

Leur approche discrète n'a pas empêché le modèle de faire sensation, notamment grâce à ses capacités impressionnantes en matière de génération d'images réalistes et d'intégration de texte.

Une levée de fonds stratégique

L'annonce de Flux s'est accompagnée d'une nouvelle tout aussi importante : une levée de fonds de 31 millions de dollars auprès d'Andreessen Horowitz (a16z). Ce soutien financier d'un des fonds d'investissement les plus prestigieux de la Silicon Valley témoigne de la confiance placée dans le potentiel de Flux. 

Pour mettre les choses en perspective, a16z gère des actifs d'une valeur de 43 milliards de dollars et compte dans son portefeuille des géants tels que Coinbase, Airbnb, et Facebook.

L'open source comme stratégie de disruption

L'un des aspects les plus intéressants de Flux est son caractère open source. Cette décision stratégique ouvre la voie à une innovation collaborative à grande échelle. En permettant à la communauté des développeurs d'accéder librement au code source, Black Forest Labs mise sur l'intelligence collective pour faire évoluer rapidement son modèle. Cette approche rappelle celle adoptée par d'autres acteurs majeurs comme Mistral AI ou Meta avec leur modèle Llama.

Les capacités impressionnantes de Flux

Une qualité d'image époustouflante

Flux se démarque par sa capacité à générer des images d'un réalisme saisissant. Les détails, les textures, et les jeux de lumière sont rendus avec une précision qui défie l'œil humain. Cette qualité exceptionnelle ouvre de nouvelles perspectives pour les créateurs de contenu, les designers, et les artistes numériques.

Une maîtrise inégalée du texte

L'un des points forts de Flux réside dans son aptitude à intégrer du texte de manière naturelle et cohérente dans les images générées. Là où d'autres modèles peinent encore à produire des résultats convaincants, Flux excelle, offrant des possibilités créatives inédites pour la conception de logos, d'affiches, ou de supports marketing.

Une polyvalence remarquable

Flux ne se contente pas de générer des images statiques. Le modèle est capable de produire une variété de contenus visuels, allant des illustrations aux photographies en passant par des designs plus abstraits. Cette polyvalence en fait un outil de choix pour une large gamme de projets créatifs qui rivalisent largement avec son plus gros concurrent privé MidJourney.

En savoir plus

Dans ma dernière vidéo YouTube, je fais un tour d’horizon complet sur l’outil et comment utiliser les visuels générés pour en créer des vidéos avec l’outil Runway 👇

L'IA dans l'industrie et les services 🏭

Figure 02 : le robot copain chez BMW

Le robot humanoïde Figure 02, équipé de l'IA d'OpenAI, fait ses premiers pas dans une usine BMW. Il parle, il a des super capteurs, et il est là pour accompagner les humains en toute sécurité.

Google Meet va (enfin) prendre des notes tout seul

Google Meet va bientôt vous proposer de prendre des notes automatiquement grâce à l'IA Gemini. Cette fonctionnalité de Speech-to-text, très demandée, est un excellente moyen d’économiser de précieuses minutes (heures?) passées à rédiger des comptes rendus.

Audible joue les DJ de livres audio avec Maven

Audible teste Maven, une fonctionnalité de recherche IA qui comprend vos requêtes en langage naturel. Bien que limitée à une partie de la bibliothèque, cette fonctionnalité promet d'affiner la recherche de titres en répondant à des requêtes spécifiques, comme la recherche d'un roman de fiction inspirant avec une protagoniste féminine. Audible n'a pas précisé les modèles d'IA utilisés, mais indique que Maven s'appuie sur plusieurs modèles et sera continuellement amélioré.

JPMorgan Chase embauche un assistant IA

La banque JPMorgan Chase a un nouvel employé virtuel : un assistant IA développé avec OpenAI. Son job ? Aider à rédiger des emails et compiler des rapports. Après l’automobile, c’est au secteur de la finance de s’équiper.

Sonova rend les aides auditives plus intelligentes

Avec "Real", Sonova lance une aide auditive qui s'adapte toute seule à votre environnement sonore grâce à l'IA. Une meilleure qualité sonore et une expérience sur mesure pour accroître considérablement l'audition !

Avec cette nouvelle annoncée comme une surprise, le cours de l’action a instantanément pris 5%. Le produit est annoncé pour être lancé sur le marché dès cette année .

Du côté des agents et des robots 🤖

Agent Q : l'agent web qui se débrouille tout seul

Agent Q planifie, il s'auto-répare et il navigue sur le web seul.

Validé par des expériences réelles, Agent Q a démontré une amélioration spectaculaire des taux de réussite, passant de 18,6 % à 95,4 % dans des tâches, par exemple, de réservation en ligne. Cette percée sera bientôt disponible pour les développeurs et utilisateurs de MultiOn, promettant un avenir prometteur pour les agents intelligents autonomes.

Waymo étend son empire des taxis robots

Comme toutes les semaines, petit focus réglementation ! ⚖️

Les artistes attaquent l'IA générative en justice

Un procès collectif contre Stability, Runway et DeviantArt a été partiellement autorisé. Les artistes accusent ces entreprises d'avoir utilisé leurs œuvres sans permission pour entraîner leurs IA.

La FCC veut mettre une étiquette "IA" sur les appels vocaux

Le Colorado prépare ses écoles à l'ère de l'IA

Le Colorado a un plan pour intégrer l'IA dans ses écoles. Ce guide, élaboré avec la participation de plus de 100 enseignants, étudiants et experts, se concentre sur trois domaines principaux : l'enseignement et l'apprentissage, l'avancement de l'équité, et le développement de politiques pour une utilisation transparente et éthique de l'IA. Il met en avant l'importance de comprendre les concepts d'IA, tels que les "hallucinations" et les biais potentiels, et propose des moyens d'utiliser l'IA pour personnaliser l'apprentissage et réduire les tâches administratives. La feuille de route encourage également l'engagement des familles, en particulier celles des zones rurales, pour garantir un accès équitable à l'IA. Un programme pilote, Elevate AI, sera lancé dans huit districts pour affiner ces directives.

OpenAI s'inquiète des relations amoureuses avec les chatbots

OpenAI tire la sonnette d'alarme : certains utilisateurs développent des sentiments pour ChatGPT-4o. OpenAI met en garde contre le risque de réduction des interactions humaines et des impacts potentiels sur les relations sociales. De plus, GPT-4o pourrait involontairement imiter la voix des utilisateurs, posant des risques d'usurpation d'identité. Bien que des mesures aient été prises pour atténuer certains de ces risques, OpenAI n'a pas encore de solutions spécifiques pour l'attachement émotionnel, mais prévoit d'étudier davantage ce phénomène.

REJOIGNEZ-NOUS ! 👇

Notre dernière vidéo YouTube 🪩

Notre communauté 🤝

Pour approfondir vos connaissances et participer à des discussions passionnantes sur l'IA, nous vous invitons à rejoindre notre groupe SKOOL "L'Atelier de l'IA". Vous y trouverez des ressources gratuites, des templates YouTube, et pourrez engager des échanges enrichissants avec d'autres passionnés d'IA.

L’Atelier de l’IA

Pour rester connecté et recevoir des mises à jour régulières sur le monde de l'IA, n'hésitez pas à me suivre sur LinkedIn, j’y poste régulièrement du contenu !

Voilà pour cette semaine ! J’espère que le contenu vous aura plu, n’hésitez pas à nous laisser un petit mot.

À la semaine prochaine ! 🦾🧠