


A xAI de Elon Musk volta a surpreender o mundo da tecnologia e da Inteligência Artificial.
Após os lançamentos do OpenAI o3, DeepSeek R1, a xAI acaba de lançar a solução Grok-3, mais sofisticada ainda que as anteriores concorrentes.
Os habituais benchmarks utilizados para comparar as diversas soluções, colocam o Grok-3 no topo das taxas de precisão. Estes benchmarks são:
- GPQA (domínio da ciência) – um conjunto de 448 questões colocadas por peritos em biologia, física e química. O Grok-3 atinge 75% em comparação com os 65% e 50% dos seus concorrentes.
- AIME’24 (American Invitational Mathematics Examination) – neste caso, da matemática, o Grok-3 atinge os 52%, face aos 40% e menos das soluções concorrentes.
- LCB (coding) – 57%, face a 41% e menos dos concorrentes
A Chatbot Arena – plataforma competitiva online destinada a avaliar modelos de LLM (Large Language Models) e comparar o desempenho global dos vários modelos – coloca também o Grok-3 esta última solução da xAI no topo da performance relativa.
Com o ritmo desta evolução dos modelos de Inteligência Artificial, certamente que cada vez se está mais perto do que chamaríamos uma meta, o atingir a Inteligência Geral Artificial (AGI) – que significará que a IA se poderá comparar globalmente à Inteligência Humana - até ao final da presente década.
(Imagens da xAI)
Carlos Manuel de Oliveira
18 Fevereiro 2025
Adicionar comentário
Comentários