Microsoft améliore son offre Azure AI

New York, New York, USA - January 27, 2016: People walk by the Microsoft Store on Fifth Avenue in Midtown Manhattan.
Table des matières

L’offre Azure AI de Microsoft s’améliore sur le plan des grands modèles de langage dédiés aux opérations informatiques (LLMOps). Durant sa dernière conférence Ignite, le géant américain a dévoilé des rajouts en lien avec Hugging Face. Il a aussi déployé dans Azure AI une nouvelle extension dédiée aux bases de données.

L’édition 2023 de la conférence Igntite de Microsoft s’est tenue les 16 et 17 novembre 2023. Elle a été l’occasion pour les visiteurs de découvrir en première mondiale des nouveautés sur les services d’intelligence artificielle (IA) d’Azure. Ils ont notamment assisté en direct à l’annonce d’un rajout sur Azure Database pour PostgreSQL. Ce service de base de données embarque dorénavant une extension Azure AI. Des appels de fonctions dans les requêtes SQL permettent grâce à elle de profiter de Azure AI Language et Azure OpenAI.

Cette mise à jour, comme les autres, montre à quel point les services IA d’Azure se soutiennent entre eux.

La recherche vectorielle débarque sur Azure AI Search

La firme de Redmond a aussi dévoilé des innovations dédiées aux machines virtuelles de série ND. Des instances fondées sur l’unité de traitement graphique AMD Instinct MI300X 192 Go y ont été introduites. Le géant américain a conservé le reste du socle ND :

  • InfiniBand 400 Gb/s ;
  • 16 slots DDR5 ,
  • Processeur Xeon Scalable 4e génération ;

Les instances H100 v5 sont en prévisualisation pour les modèles requérant moins de parallélisme et d’informations. Sont concernés les traitements automatiques du langage naturel n’impliquant pas la production de nouvelles données, la détection d’objets, etc. Ces instances se basent sur des EPYC de quatrième génération. Les spécifications basiques combinent :

  • Une bande passante de 40 Gb/s ;
  • Une carte graphique H100 94 Go ;
  • Un RAM de 320 Go ;
  • 40 processeurs virtuels.

Il est toutefois possible de choisir une machine avec le double de cette configuration. Ce qui pourrait être intéressant pour les consultants informatiques freelances réalisant des tâches très exigeantes. Pour remarque, ces professionnels peuvent devenir auto-entrepreneur pour profiter de nombreux avantages.

Azure AI Search embarque aussi désormais la recherche vectorielle. Elle allie bibliothèques clientes (Java, .NET, JavaScript, Python) et magasin de vecteurs, avec une touche de recherche sémantique, comprenant :

  • La mise en avant des extraits pertinents ;
  • Le classement des documents.

De nouveaux modèles de langage s’intègrent dans Azure AI

Azure AI Studio recevra également prochainement une composante appelée « Prompt flow ». Un élément qu’on trouve déjà sur l’offre Azure ML, adressée aux data scientists. Par ailleurs, le catalogue Open AI s’enrichit avec différents modèles du hub hugging Face :

  • 3 modèles de Facebook, dédiés à la segmentation d’images (SAM) ;
  • 4 modèles de Salesforce pour le traitement d’images (BLIP) ;
  • La variante large de Whisper v3 ;

Il se renforce aussi avec Nemotron-3 8B, Code Llama et les modèles Phi 2,7B et 1,3 B. Azure AI Studio devrait aussi recevoir des « modèles en tant que service ». Microsoft prévoit en gros de déployer une API d’inférence avec une tarification pay-as-you-go. Elle permettra de tirer parti des modèles en question sans devoir réserver de machine virtuelle. L’initiative s’appliquera également au finetuning. Le premier concerné portera sur la gamme Llama 2, suivi de :

  • Mistral AI premium ;
  • G42 Jais ;
  • Cohere Command.

Microsoft a aussi annoncé une composante « analyse de texte » issue d’Azure AI Speech dans Azure AI Studio. Elle renforcera les transcriptions comme la détection de données sensibles, les résumés, l’extraction de points-clés, etc. C’est une option intéressante pour ceux ou celles qui voudraient devenir auto-entrepreneur, et qui aurait besoin d’aide dans les rédactions y afférentes (statuts, CGV, CGU, etc.).

Cet article vous a-t-il été utile ?

Note moyenne 0 / 5. Votants: 0

Plus d'actualités

Google accélère le rythme avec Android 16

Google accélère le développement d’Android 16 et prévoit sa sortie pour le premier semestre 2025. Cette nouvelle version devrait offrir une expérience utilisateur améliorée avec des notifications plus riches, une gestion multitâche facilitée et une meilleure personnalisation. Le mois d’octobre

Lire la suite »