
Google a publié Gemini 2.5 Flash-Lite avec contexte de 1 million de tokens
Google a présenté le modèle Gemini 2.5 Flash-Lite. Et il devient une vraie percée dans le rapport qualité-prix, ouvrant de nouveaux horizons d’accessibilité des technologies avancées.
Qu’est-ce qui rend ce modèle spécial ? Premièrement, c’est la version la plus rapide et la plus économique de la gamme Gemini 2.5. En même temps, il conserve toutes les capacités clés des solutions phares. Paramètres flexibles du mode de raisonnement avec différents budgets computationnels et recherche internet intégrée. Ainsi qu’interpréteur de code pour l’exécution de programmes et couverture contextuelle impressionnante de 1.000.000 de tokens.
Les tests montrent un progrès significatif comparé à la version Flash-Lite précédente. Le modèle démontre aussi des améliorations notables dans la programmation et les calculs mathématiques. Bien sûr, en termes absolus il est légèrement inférieur au Flash pleine taille. Mais il fournit de multiples économies de ressources même avec le mode de raisonnement activé.
Les ingénieurs de Google sont particulièrement fiers de la faible latence de réponse. Le nouveau modèle fonctionne plus rapidement que ses prédécesseurs lors du traitement d’un large éventail de requêtes. Cela le rend idéal pour les tâches à haute charge et sensibles à la latence.