[ad_1]
La société d’intelligence artificielle (IA) d’Elon Musk, xAI, s’apprête à introduire une version de son modèle de langage Grok capable de traiter les visuels, comme l’a partagé la société cette semaine.
Dans un communiqué de presse partagé vendredi sur son site Web, xAI a annoncé Grok 1.5V, ou Grok 1.5 Vision, son premier modèle d’IA à traiter la vidéo parallèlement au traitement du texte. Cette nouvelle signifie que Grok peut désormais traiter des informations visuelles telles que des documents, des photos, des diagrammes et bien plus encore, tout en rendant le modèle compétitif par rapport à d’autres plates-formes multimodales.
“Présentation de Grok-1.5V, notre modèle multimodal de première génération”, écrit xAI dans le communiqué. « En plus de ses puissantes capacités de texte, Grok peut désormais traiter une grande variété d’informations visuelles, notamment des documents, des diagrammes, des graphiques, des captures d’écran et des photographies. Grok-1.5V sera bientôt disponible pour nos premiers testeurs et les utilisateurs Grok existants.
Bien qu’il n’ait pas encore été rendu public, xAI indique que Grok 1,5 V sera bientôt disponible pour les premiers testeurs et les utilisateurs Grok existants.
L’article comprend également des informations d’analyse comparative détaillées comparant Grok 1,5V à des concurrents multimodaux tels que ChatGPT-4V d’OpenAI, Claude 3 Sonnet et Claude 3 Opus d’Anthropic, ainsi que Gemini Pro 1.5, propriété de Google. De plus, la version présente sept exemples différents de la manière dont Grok 1.5V peut utiliser des informations visuelles, notamment l’utilisation d’images du monde réel ou la traduction de graphiques en code.
Vous pouvez voir le tableau d’analyse comparative Grok 1,5 V ci-dessous, ainsi que deux exemples de traitement visuel.
Le modèle multimodal arrive après que Musk ait déclaré plus tôt cette année que xAI se préparait à lancer Grok 1.5. Dans une interview accordée plus tôt cette semaine, Musk a également déclaré qu’il pensait que nous aurons une IA plus intelligente que n’importe quel humain d’ici la fin de 2025, tandis qu’il pense que la puissance de calcul de l’IA dépassera celle de tous les humains dans seulement cinq ans.
Le mois dernier, xAI a officiellement rendu les poids du modèle de base et l’architecture réseau de Grok open source, après les nombreuses critiques de Musk et même un procès de l’ancienne organisation à but non lucratif OpenAI pour avoir abandonné sa mission à but non lucratif et évité de rendre ses propres modèles GPT open source.
Lettres
– Grok (@grok) 17 mars 2024
À la suite d’informations publiées en janvier selon lesquelles xAI avait levé des capitaux, Musk a nié ces allégations, ajoutant que la société n’avait pas l’intention de lever des fonds pour le moment. Musk a lancé xAI en juillet dernier, et la société a ensuite lancé Grok comme premier produit en novembre.
Mise à jour à 17 h 02 MT : septième paragraphe modifié pour plus de clarté.
Quelles sont vos pensées? Faites-le-moi savoir à zach@teslarati.com, retrouvez-moi sur X à @zacharyviscontiou envoyez-nous vos conseils à tips@teslarati.com.
[ad_2]
Source link