A corrida pela liderança até à AGI continua

Publicado em 18 de fevereiro de 2025 às 16:47

A xAI de Elon Musk volta a surpreender o mundo da tecnologia e da Inteligência Artificial.

Após os lançamentos do OpenAI o3, DeepSeek R1, a xAI acaba de lançar a solução Grok-3, mais sofisticada ainda que as anteriores concorrentes.

 

Os habituais benchmarks utilizados para comparar as diversas soluções, colocam o Grok-3 no topo das taxas de precisão. Estes benchmarks são:

 

- GPQA (domínio da ciência) – um conjunto de 448 questões colocadas por peritos em biologia, física e química. O Grok-3 atinge 75% em comparação com os 65% e 50% dos seus concorrentes.

 

- AIME’24 (American Invitational Mathematics Examination) – neste caso, da matemática, o Grok-3 atinge os 52%, face aos 40% e menos das soluções concorrentes.

 

- LCB (coding) – 57%, face a 41% e menos dos concorrentes

 

A Chatbot Arena – plataforma competitiva online destinada a avaliar modelos de LLM (Large Language Models) e comparar o desempenho global dos vários modelos – coloca também o Grok-3 esta última solução da xAI no topo da performance relativa.

Com o ritmo desta evolução dos modelos de Inteligência Artificial, certamente que cada vez se está mais perto do que chamaríamos uma meta, o atingir a Inteligência Geral Artificial (AGI) – que significará que a IA se poderá comparar globalmente à Inteligência Humana - até ao final da presente década.

 

(Imagens da xAI)

Carlos Manuel de Oliveira

18 Fevereiro 2025

Adicionar comentário

Comentários

Ainda não há comentários.