Pequenos Modelos de Linguagem (SLM): a tendência que está a esvaziar o domínio dos gigantes da IA

Pequenos Modelos de Linguagem (SLM): a tendência que está a esvaziar o domínio dos gigantes da IA

O mercado começa a olhar para fora dos modelos gigantes

Durante muito tempo, a corrida pelos modelos de linguagem foi medida em parâmetros: quanto maior, melhor. Essa narrativa está a mudar de forma rápida. Os chamados SLM (Small Language Models), modelos com poucos milhares de milhões de parâmetros, estão a ganhar espaço junto de empresas, programadores e até fabricantes de telemóveis. A tendência é clara: nem todos precisam de um modelo de fronteira para resolver problemas reais.

Porque é que os SLM estão a crescer

Há três fatores a empurrar este movimento. O primeiro é o custo. Treinar e correr modelos massivos exige infraestrutura cara, com GPUs de topo e faturas energéticas elevadas. O segundo é a latência: um modelo mais pequeno responde mais depressa, sobretudo quando corre localmente no dispositivo. O terceiro é a privacidade, um tema cada vez mais sensível na Europa, onde o AI Act começou a aplicar-se de forma faseada e obriga as empresas a repensar onde processam os dados dos utilizadores.

Phi, Gemma, Mistral e Llama: os protagonistas discretos

A Microsoft tem apostado forte na família Phi, com versões otimizadas para tarefas específicas que rivalizam com modelos várias vezes maiores. A Google lançou novas iterações do Gemma, pensadas para correrem em hardware modesto. A francesa Mistral mantém uma linha de modelos abertos que tem conquistado a comunidade europeia, e a Meta continua a refinar versões compactas do Llama. O denominador comum é a eficiência: fazer mais com menos.

O telemóvel como nova fronteira

Outro sinal de que os SLM são uma tendência estrutural está no hardware de consumo. Os mais recentes processadores da Qualcomm, MediaTek e Apple incluem NPUs dedicadas a inferência de IA no próprio dispositivo. Isto permite que assistentes, tradução em tempo real e resumos de texto funcionem sem ligação à nuvem. Para o utilizador português, isto significa funcionalidades de IA que não dependem da qualidade da rede móvel e que não enviam dados pessoais para servidores externos.

O impacto no tecido empresarial

Para PMEs e equipas internas, os SLM abrem uma porta que estava fechada. Em vez de pagar por API a um fornecedor externo, é possível correr um modelo afinado para um caso de uso específico — apoio ao cliente, análise de contratos, classificação de emails — num servidor próprio ou até numa máquina local. Ferramentas como o Ollama e o LM Studio tornaram este processo acessível mesmo a quem não tem equipas de machine learning dedicadas.

O que falta resolver

Apesar do entusiasmo, os SLM ainda têm limitações claras. Em tarefas de raciocínio complexo, escrita criativa longa ou conhecimento muito específico, os modelos grandes continuam à frente. A tendência que se desenha não é a substituição, mas a coexistência: modelos pequenos para o trabalho do dia a dia, modelos grandes para tarefas críticas. As próprias plataformas estão a adotar este modelo híbrido, com encaminhamento automático consoante a complexidade do pedido.

Uma mudança silenciosa, mas profunda

A narrativa pública continua dominada pelos modelos de fronteira e pelos investimentos avultados em centros de dados. Mas a engenharia real, a que está a chegar aos produtos que usamos, vai noutra direção. O futuro próximo da IA generativa não passa só por mais potência: passa por modelos mais pequenos, mais rápidos e mais próximos do utilizador. Para o mercado português, com empresas que valorizam soberania de dados e custos controlados, esta é provavelmente a tendência mais relevante a acompanhar.

Google News

Siga o NetThings no Google News

Fique a par de todas as novidades tecnológicas em tempo real.

⭐ SEGUIR NO GOOGLE NEWS

Acompanhe-nos também em:

-->