Categories: Technology

Apple Intelligence se sai melhor que outros LLMs em benchmarks

Aproveitando a introdução da Inteligência da Applea Maçã aproveitou para divulgar mais detalhes sobre seus dois modelos de IA generativa: o de linguagem no dispositivo (no dispositivo) e um maior, baseado no servidor com o Computação em nuvem privada.

Antes de mais nada, é importante frisar os quatro princípios da empresa na Apple Intelligence, sendo eles:

  • A criação de ferramentas para que os usuários alcancem seus objetivos;
  • A construção de produtos que evitam a perpetuação de estereótipos e visões sistêmicas em ferramentas e modelos de IA;
  • Um cuidado para evitar que as ferramentas não sejam mal utilizadas ou levem a possíveis danos;
  • Uma proteção à privacidade dos usuários — usando o processamento no próprio dispositivo e a infraestrutura do Private Cloud Compute.

Em um documento extensoa empresa descreve que o modelo que roda no dispositivo possui cerca de 3 bilhões de intervalosenquanto que o modelo de linguagem grande (LLM, na sigla em inglês) está hospedado em servidores da própria empresa, alimentados pela Apple Silicon.

O interessante é que a Maçã faz o treinamento usando dados licenciados, o que inclui informações selecionadas para aprimorar os recursos mais específicos e de dados disponíveis publicamente, coletados pelo rastreador da web AppleBot. Mesmo assim, ela frisa que os editores da web se quiserem poderão desabilitar o uso de seu conteúdo pela Apple Intelligence.

Como a Apple leva privacidade a sérioela deixa bem claro que nunca usa dados pessoais privados dos usuários, bem como interações feitas por eles — de forma que alguns filtros são aplicados a fim de que as informações mais pessoais sejam totalmente removidas.

Outro dado interessante apresentado no documento é que o tamanho do vocabulário no modelo de linguagem no dispositivo é de 49.000, enquanto que o modelo de servidor usa um tamanho de vocabulário de 100.000, incluindo a linguagem adicional e os fichas técnicos.

Com as otimizações feitas e usando um iPhone 15 Pro como exemplo, foi possível atingir uma latência de cerca de 0,6 milissegundo por símbolo de incitar e uma taxa de geração de 30 fichas por segundo.

Para testar os modelos, a Apple usou a referência Instruction-Following Eval (IFEval) para fazer uma comparação nas suas capacidades de entrega de instruções com modelos de tamanho de hardware.

Como você pode observar, os resultados sugerem que o modelo no dispositivo e no servidor da Maçã segue instruções descritas de uma maneira melhor do que os modelos de código aberto e comerciais.

Em outro gráfico, uma comparação foi feita de maneira a avaliar a capacidade de escrita dos modelos da Apple em benchmarks internas de resumo e composição, consistindo em uma variedade de instruções de escrita.

Mais detalhes sobre os modelos de IA generativa da Apple podem ser conferidos nessa página.

através da MSPowerUser

admin

Share
Published by
admin

Recent Posts

Cracker obteve acesso a milhões de números de usuários do app Authy

A Twilioempresa responsável pelo aplicativo de autenticação Autor, confirmado recentemente que uma vulnerabilidade em seus…

7 mins ago

Amamentação Homelander-Firecracker, Tek Knight Sex Dungeon

ALERTA DE SPOILER: Esta história contém spoilers do episódio 6 de “Os meninos” Temporada 4,…

16 mins ago

Amazon obtém vitória e Anatel recorre de decisão – Tecnoblog

Lojistas usam Amazon para oferecer celulares contrabandeados, segundo CNCP (Ilustração: Vitor Pádua/Tecnoblog) Saiba mais sobre…

19 mins ago

iPad Pro com M5? Vazamento revela possíveis especificações dos próximos tablets da Apple

A Maçã parece já estar trabalhando no lançamento de novos tablets após o lançamento do…

31 mins ago

O Poco F6 é bom? Saiba se o intermediário da Xiaomi vale a pena em 2024

O Poco F6 é bom? Saiba se o intermediário da Xiaomi vale a pena em…

43 mins ago

Robô aspirador VR3M da Samsung permite controle inteligente pelo aplicativo SmartThings

Lançamento da Samsung conta com função 2 em 1, que aspira e passa pano, além…

54 mins ago