Categories: Technology

HeatWave GenAI a nova LLMs da Oracle

Oracle anuncia LLMs no banco de dados e armazenamento vetorial instantâneo com o HeatWave GenAI

A Oracle anunciou a disponibilidade geral do HeatWave GenAI, que inclui os primeiros modelos de linguagem de grande escala (LLMs) no banco de dados do setor, um armazenamento vetorial dinâmico no banco de dados, processamento vetorial em expansão e a capacidade de ter conversas contextuais em linguagem natural informadas por conteúdo não estruturado.

Esses novos recursos permitem que os clientes tragam o poder da IA ​​generativa para seus dados corporativos sem precisar de experiência em IA ou de terem que mover dados para um banco de dados vetorial separado. O HeatWave GenAI já está disponível em todas as regiões do Oracle Cloud, na região dedicada do Oracle Cloud Infrastructure (OCI) e em nuvens sem custo extra para os clientes do HeatWave.

Os clientes podem criar aplicativos de IA generativos sem ter experiência em IA, movimentação de dados ou custo adicional

Com o HeatWave GenAI, os desenvolvedores podem criar um repositório vetorial para conteúdo corporativo com um comando SQL único, usando modelos de incorporação internos. Os usuários também podem realizar pesquisas em uma única etapa utilizando LLMs internos ou externos. Os dados não saem do banco de dados e, devido à escala e desempenho do HeatWave, não há necessidade de provisionar GPUs. Como resultado, os desenvolvedores podem reduzir a complexidade do aplicativo, aumentar o desempenho, melhorar a segurança dos dados e reduzir os custos.

“O impressionante ritmo de inovação do HeatWave continua com a adição do HeatWave GenAI aos recursos integrados existentes do HeatWave: HeatWave Lakehouse, HeatWave Autopilot, HeatWave AutoML e HeatWave MySQL”, comenta Edward Screven, arquiteto-chefe corporativo da Oracle. “Os engenheiros de IA integrados e automatizados de hoje permitem que os desenvolvedores criem aplicativos de IA generativos avançados mais rapidamente, sem exigir experiência em IA ou mover dados. Os usuários agora têm uma maneira intuitiva de interagir com seus dados corporativos e obter rapidamente as respostas necessárias para seus negócios”.

“O HeatWave GenAI torna extremamente fácil tirar proveito da IA ​​generativa”, completa Vijay Sundhar, CEO da SmarterD, plataforma de gerenciamento de segurança cibernética. “O suporte para LLMs no banco de dados e criação de vetores no banco de dados leva a uma redução significativa na complexidade do aplicativo, latência de inferência e, acima de tudo, nenhum custo adicional para usar os LLMs ou criar as incorporações. Esta é realmente a democratização da IA ​​generativa e notável que resultará na construção de aplicativos ainda melhores e em ganhos significativos de produtividade para nossos clientes”.

Os novos recursos de IA generativa flexíveis e integrados incluem: Os LLMs no banco de dados simplificam o desenvolvimento de aplicativos de IA generativa a um custo mais baixo. Os clientes podem se beneficiar de IA generativa sem a complexidade da seleção e integração de LLM externo e sem se preocupar com a disponibilidade de LLMs em data centers de vários provedores de nuvem.

Geração de dados e conteúdo

Os LLMs no banco de dados permitem que os clientes pesquisem dados, gerem ou resumam conteúdos e executem a geração aumentada de recuperação (RAG) com o HeatWave Vector Store. Além disso, eles podem combinar IA generativa com outros recursos HeatWave integrados, como o AutoML, para criar aplicativos mais completos. O HeatWave GenAI também está integrado ao serviço OCI Generative AI para acessar modelos pré-treinados dos principais provedores de LLM.

O Automated In-database Vector Store permite que os clientes utilizem IA generativa com seus documentos de negócios sem mover dados para um banco de dados vetorial separado e sem experiência em IA. Todas as etapas para criar um repositório vetorial e incorporações gráficas são automatizadas e executadas dentro do banco de dados, incluindo localizar documentos no armazenamento, analisá-los, gerar incorporações de forma altamente paralela e otimizada e inseri-los no armazenamento vetorial, tornando o HeatWave Vector Store eficiente e fácil de usar.

O processamento vetorial de dados fornece resultados de pesquisa semântica muito rápidos sem qualquer perda de precisão. O HeatWave suporta um novo tipo de dados VECTOR nativo e uma implementação otimizada da função, permitindo que os clientes realizem consultas com SQL padrão. A representação híbrida na memória e a arquitetura scale-out do HeatWave permitem que o processamento vetorial seja executado em largura de banda próxima à memória. Como resultado, os clientes têm suas perguntas respondidas rapidamente. Os usuários também podem combinar a pesquisa semântica com outros operadores SQL para, por exemplo, unir várias tabelas com documentos diferentes e executar pesquisas de similaridade em todos os documentos.

O HeatWave Chat é um plug-in de código visual para MySQL Shell que fornece uma interface gráfica para o HeatWave GenAI e permite que os desenvolvedores façam perguntas em linguagem natural ou linguagem de consulta estruturada (SQL). O Lakehouse Navigator integrado permite que os usuários selecionem arquivos do armazenamento de objetos e criem um repositório vetorial. Os usuários podem pesquisar em todo o banco de dados ou restringir a pesquisa a uma pasta. O HeatWave Chat mantém o contexto com o histórico de perguntas feitas, citações dos documentos de origem e o prompt para o LLM. Isso facilita uma conversa contextual e permite que os usuários verifiquem a fonte das respostas geradas pelo LLM. Esse contexto é mantido no HeatWave e está disponível para qualquer aplicativo que use o HeatWave.

Criação de Vector Store e benchmarks de processamento vetorial

Criar um repositório vetorial para documentos nos formatos PDF, PPT, Word e HTML é até 23 vezes mais rápido com o HeatWave GenAI e com 1/4 do custo de uso da base de conhecimento comparada ao Amazon Bedrock.
Como demonstrado por um benchmark e usando uma variedade de consultas de pesquisa de similaridade em tabelas que variam de 1,6 GB a 300 GB de tamanho, o HeatWave GenAI é 30 vezes mais rápido que o Snowflake e custa 25% menos; 15 vezes mais rápido que o Databricks e custa 85% menos; e 18 vezes mais rápido que o Google BigQuery e custa 60% menos.
Um outro benchmark revela que os índices gráficos no Amazon Aurora PostgreSQL com pgvector podem ter um alto grau de imprecisão e produzir resultados incorretos. Em contraste, o processamento de pesquisa de similaridade do HeatWave sempre fornece resultados precisos, tem tempo de resposta previsível, é executado em velocidade próxima à memória e é até 10 a 80 vezes mais rápido do que o Aurora usando o mesmo número de núcleos.
“Estamos participando em continuar nossa forte colaboração com a Oracle para fornecer o poder e a produtividade da IA ​​com o HeatWave GenAI para cargas de trabalho e conjuntos de dados corporativos críticos”, ressalta Dan McNamara, vice-presidente sênior e gerente geral da Unidade de Negócios de Servidores da AMD, fabricante de processadores e placas de vídeo. “O trabalho conjunto de engenharia realizado pela AMD e pela Oracle está permitindo que os desenvolvedores projetem soluções inovadoras de IA corporativa, aproveitando o HeatWave GenAI alimentado pela densidade do núcleo e pelo excelente desempenho de preço dos processadores AMD EPYC”.

Comentários adicionais de clientes e analistas sobre o HeatWave GenAI

“Usamos o HeatWave AutoML no banco de dados para fazer recomendações aos nossos clientes”, comenta Safarath Shafi, CEO da EatEasy, plataforma que oferece refeições saudáveis, entregue diretamente ao consumidor. “O suporte do HeatWave para LLMs no banco de dados e armazenamento vetorial no banco de dados é diferenciado, e a capacidade de integrar IA generativa com AutoML fornece mais diferenciação para o HeatWave na indústria, permitindo-nos oferecer novos tipos de recursos aos nossos clientes. A sinergia com o AutoML também melhora o desempenho e a qualidade dos resultados do LLM”.

“Os LLMs no banco de dados HeatWave, o armazenamento vetorial no banco de dados, o processamento vetorial na memória scale-out e o HeatWave Chat são recursos muito diferenciados da Oracle que democratizam a IA generativa e a tornam simples, segura e barata de usar”, destaca Eric Aguilar, fundador da Aiwifi, fornecedora de soluções de internet sem fio e de alta performance. “Usar o HeatWave e o AutoML para nossas necessidades corporativas já transformarão nossos negócios de várias maneiras, e a introdução dessa inovação da Oracle estimulará o crescimento de uma nova classe de aplicativos”.

“A inovação de engenharia do HeatWave continua a entregar a visão de um banco de dados universal em nuvem”, observa Holger Mueller, vice-presidente e analista principal da Constellation Research, empresa de pesquisa e consultoria focada em transformação digital. “A mais recente é a IA generativa feita no ‘estilo HeatWave’ – que inclui a integração de um armazenamento vetorial instantâneo no banco de dados e LLMs no banco de dados diretamente no núcleo do HeatWave. Isso permite que os desenvolvedores criem classes de aplicativos à medida que combinam elementos HeatWave.

Por exemplo, eles podem combinar o HeatWave AutoML e o HeatWave GenAI em um aplicativo de detecção de fraude que não apenas detecta transações suspeitas, mas também fornece uma explicação compreensível. Isso tudo é executado no banco de dados, portanto, não há necessidade de mover dados para bancos de dados comerciais externos, mantendo os dados mais seguros”.

Onda de calor

O HeatWave é o único serviço de nuvem que fornece IA generativa automatizada e integrada com machine learning em uma oferta única para transações e análises em lagoa de dados (Data Lake). Componente central da estratégia de nuvem distribuída da Oracle, o HeatWave está disponível nativamente no OCI e Amazon Web Services, no Microsoft Azure por meio do Oracle Interconnect for Azure, e nos data centers dos clientes com OCI Dedicated Region e Oracle Alloy.

Recursos adicionais
  1. Assista ao anúncio de Edward Screenen sobre novos aprimoramentos GenAI para HeatWave
  2. Leia o blog do HeatWave com informações técnicas
  3. Leia o que os analistas do setor estão dizendo sobre o HeatWave

Sobre a Oracle

A Oracle oferece conjuntos de aplicativos integrados, além de uma estrutura segura e abrangente na Oracle Cloud. Para obter mais informações sobre a Oracle (NYSE: ORCL), acesse www.oracle.com.Marcas registradas

Marcsas

Oracle, Java, MySQL e NetSuite são marcas registradas da Oracle Corporation. A NetSuite foi a primeira empresa de Nuvem, inaugurando a nova era da computação em Nuvem.

admin

Share
Published by
admin

Recent Posts

Como usar fontes diferentes no WhatsApp? Saiba usar letras personalizadas no aplicativo – Tecnoblog

Saiba como escrever mensagens com fontes personalizadas no WhatsApp (Imagem: Vitor Pádua/Tecnoblog) Saiba mais sobre…

3 mins ago

Quase 80 mil veículos elétricos leves foram vendidos no Brasil apenas no primeiro semestre

Parece que o amor do brasileiro pelos veículos elétricos tem crescido cada vez mais com…

14 mins ago

😱 USE O CUPOM | Galaxy Watch 6 Classic com 4G atinge menor preço

😱 USE O CUPOM | Galaxy Watch 6 Classic com 4G atinge menor preço -…

27 mins ago

Team Solid decola rumo à Arábia Saudita

Esports World Cup 2024: Team Solid decola rumo à Arábia Saudita O Team Solid está…

38 mins ago

Hacker teve acesso a mensagens internas sobre tecnologias da OpenAI – Tecnoblog

Funcionários da OpenAI têm ações de grupos estrangeiros (Imagem: Vitor Pádua / Tecnoblog) Saiba mais…

49 mins ago

HomePod alerta sobre incêndio em residência iniciado por um… cachorro

Como deu para notar pelo título desta matéria, traga-lhes uma daquelas histórias no mínimo inusitadas:…

1 hour ago