A pedra angular do sucesso da IA e da GenAI: dados robustos | NTT DATA

qua, 08 janeiro 2025

A pedra angular do sucesso da IA e da GenAI: dados robustos

Uma plataforma de dados robusta, nos dias de hoje, não é apenas um pré-requisito técnico — é a pedra angular de iniciativas de IA responsáveis, eficazes e inovadoras.

Hoje vivemos num mundo hiper conectado e impulsionado pela tecnologia. O potencial transformador da inteligência artificial (IA) e da IA generativa (Gen AI) é inegável. Desde revolucionar a saúde e as finanças até remodelar as indústrias criativas, estas tecnologias prometem inovação inovadora. No entanto, o seu sucesso depende de uma base crítica, mas muitas vezes pouco enfatizada: os dados. Sem dados precisos, diversificados e bem governados, até mesmo os sistemas de IA mais avançados irão vacilar. Uma plataforma de dados robusta não é apenas um pré-requisito técnico — é a pedra angular de iniciativas de IA responsáveis, eficazes e inovadoras.

Assim sendo, qual a importância dos dados na IA e na geração de IA?

Na sua essência, a IA aprende com os dados. Seja prevendo tendências, reconhecendo imagens ou gerando texto semelhante ao humano, os algoritmos que impulsionam os sistemas de IA dependem inteiramente da qualidade, quantidade e diversidade dos dados em que são treinados. A expressão "garbage in, garbage out", a qual me recordo ouvir desde as primeiras aulas na licenciatura em Informática e Gestão do ISCTE (há mais de 20 anos), encapsula a importância crítica da integridade dos dados. Dados de baixa qualidade levam a previsões imprecisas, resultados pouco ou nada (con)fiáveis, resultando em tomada de decisões comprometidas.

A IA generativa, que se concentra na criação de novos conteúdos, seja texto, imagens ou até música, aumenta ainda mais as apostas. Estes modelos exigem conjuntos de dados massivos e que refletem as complexidades do mundo real. Por exemplo, um modelo treinado exclusivamente em dados de uma única perspetiva demográfica ou cultural produzirá resultados que carecem de universalidade, limitando sua eficácia e potencialmente propagando vieses prejudiciais.

Tem-se ouvido muito que os resultados não são o que se esperava, mas impoem-se as questões: E como estão os dados? Têm a qualidade, a classificação, a “metadata” esperada (e detalhada o suficiente), que permita um “bom” resultado?

Um “bom” resultado implica uma plataforma de dados robusta.

O papel de uma plataforma de dados robusta

Uma plataforma de dados robusta fornece a infraestrutura para gerir, processar e governar dados de forma eficaz. Além do simples armazenamento, permite recursos avançados, como integração de dados, análise em tempo real e escalabilidade. As iniciativas de IA exigem plataformas de dados seguras, flexíveis e projetadas para uso colaborativo em diversas equipas, com perfis distintos e necessidades distintas.

As principais áreas a considerar numa plataforma de dados robusta incluem (não exaustivo): 

  1. Qualidade de Dados & Governance: Garantir que os dados são precisos, consistentes e livres de anomalias é fundamental. Os mecanismos de governance ajudam a manter a conformidade com os requisitos regulatórios e os padrões éticos.
  2. Deteção & Mitigação de Bias (vieses/preconceitos): Os vieses/preconceitos nos modelos de IA decorrem de dados de treino tendenciosos. Uma plataforma de dados robusta pode identificar e mitigar esses vieses, oferecendo ferramentas para uma auditoria de dados e mecanismos para equilibrar conjuntos de dados sub-representados.
  3. Escalabilidade: Os modelos de IA geralmente exigem petabytes de dados. Plataformas de dados escaláveis podem acomodar o crescimento exponencial de dados e, ao mesmo tempo, garantir o desempenho ideal.
  4. Colaboração & Acessibilidade: Ao democratizar o acesso aos dados e permitir uma colaboração constante, estas plataformas capacitam equipas multifuncionais para extrair insights e inovar coletivamente.

O segundo desafio indicado é um dos que mais me preocupa, pois o impacto na sociedade é significativo. 

Evitar Preconceitos: Uma Necessidade Moral e Estratégica

O preconceito na IA é um dos desafios mais significativos enfrentados pelas organizações atualmente. Sistemas de IA enviesados podem perpetuar estereótipos, reforçar desigualdades e minar a confiança. Exemplos como algoritmos de recrutamento tendenciosos ou sistemas de reconhecimento facial que identificam incorretamente certos grupos demográficos não são meros problemas técnicos, mas sim questões sociais. 

Para abordar este problema, as organizações devem priorizar a recolha de dados diversificados e inclusivos. Uma plataforma de dados robusta facilita este processo ao permitir auditorias abrangentes e assegurar que os conjuntos de dados refletem múltiplas perspetivas. Para além das soluções técnicas, é essencial fomentar uma cultura ética no uso de dados e na tomada de decisões. 

Não querendo alongar-me muito mais, há um eixo que na minha opinião não é abordado o suficiente, e que deve estar no “Top of Mind” de qualquer organização:

A Necessidade de Literacia em Dados e em IA

Mesmo com a melhor tecnologia, o elemento humano permanece indispensável. Uma plataforma de dados robusta só é tão eficaz quanto as pessoas que a utilizam. Para que as iniciativas de IA e IA generativa tenham sucesso, as organizações devem cultivar duas literacias críticas

  1. Literacia em Dados: A capacidade de compreender, interpretar e trabalhar com dados deve ser uma competência fundamental em todos os níveis organizacionais. Desde executivos até colaboradores na linha de frente, a literacia em dados possibilita uma tomada de decisões informada e fomenta uma cultura de inovação.
  2. Literacia em IA e IA Generativa: À medida que estas tecnologias se tornam parte integrante das operações empresariais, compreender as suas capacidades, limitações e considerações éticas torna-se imprescindível. Líderes e equipas precisam de compreender como os modelos de IA funcionam, a importância dos dados de treino e os riscos do uso indevido.

Programas de formação, workshops e colaborações interdisciplinares são passos práticos para integrar estas competências no DNA de uma organização. Ao capacitar os colaboradores com estas competências, as organizações podem maximizar o equilíbrio entre equipas técnicas e decisores, garantindo que as iniciativas de IA são tanto eficazes quanto éticas. 

Conclusão

A jornada da IA e da IA generativa não implica apenas evoluir nos algoritmos ou expandir o poder computacional — trata-se de dominar os dados. Uma plataforma de dados robusta serve como a espinha dorsal deste esforço, permitindo que as organizações aproveitem o verdadeiro potencial destas tecnologias transformadoras enquanto mitigam riscos. Priorizando a qualidade dos dados, abordando preconceitos e promovendo uma cultura de literacia em dados e IA, as organizações podem assegurar que as suas iniciativas de IA ntêm sucesso, mas que estão também alinhadas com objetivos éticos e sociais mais amplos. 

À medida que a IA continua a moldar o futuro, aqueles que investem em fundações de dados sólidas hoje liderarão as inovações de amanhã.