A AWS e a AI21 Labs anunciaram a disponibilidade da nova e poderosa família de grandes modelos de linguagem (LLMs) Jamba 1.5 da AI21 Labs no Amazon Bedrock. Esses modelos representam um avanço significativo nas capacidades de linguagem de contexto longo, oferecendo velocidade, eficiência e desempenho em uma ampla gama de aplicações.

O Jamba 1.5 utiliza uma arquitetura híbrida exclusiva que combina a arquitetura de modelo Transformer com a tecnologia de modelo de espaço de estado estruturado (SSM). Essa abordagem inovadora permite que os modelos Jamba 1.5 lidem com janelas de contexto longo de até 256 mil tokens, mantendo as características de alto desempenho dos modelos Transformer tradicionais.

Alguns dos principais pontos fortes dos modelos Jamba 1.5 incluem:

* Manipulação de contexto longo: com um comprimento de contexto de 256 mil tokens, os modelos Jamba 1.5 podem melhorar a qualidade de aplicações empresariais, como resumo e análise de documentos longos, bem como fluxos de trabalho de agentes e RAG.

* Multilíngue: suporte para inglês, espanhol, francês, português, italiano, holandês, alemão, árabe e hebraico.

* Fácil de usar para desenvolvedores: suporte nativo para saída JSON estruturada, chamada de função e capacidade de digerir objetos de documentos.

* Velocidade e eficiência: a AI21 mediu o desempenho dos modelos Jamba 1.5 e compartilhou que os modelos demonstram inferência até 2,5 vezes mais rápida em contextos longos do que outros modelos de tamanhos comparáveis.

Os modelos Jamba 1.5 são perfeitos para casos de uso como análise de documentos emparelhados, análise de conformidade e resposta a perguntas para documentos longos. Eles podem comparar facilmente informações de várias fontes, verificar se as passagens atendem a diretrizes específicas e lidar com documentos muito longos ou complexos.

A família de modelos Jamba 1.5 da AI21 Labs está geralmente disponível hoje no Amazon Bedrock na Região Leste dos EUA (Norte da Virgínia) da AWS.

Acredito que esses modelos representam um passo significativo no campo do processamento de linguagem. A capacidade de lidar com contextos longos abre uma ampla gama de novas possibilidades para desenvolvedores e empresas. Estou animado para ver quais aplicações inovadoras serão desenvolvidas usando esses modelos.