EUROPE - BRAZIL COLLABORATION OF BIG DATA SCIENTIFIC RESEARCH THROUGH CLOUD-CENTRIC APPLICATIONS

Press [ esc ] or close+

Search form

Serviços de Processamento de Dados Massivos

Serviços de processamento de dados massivos (Big Data) têm enfrentado desafios críticos sob a perspectiva do gerenciamento de dados, devido ao forte impacto do volume, velocidade, variedade e veracidade dos dados nas aplicações. A variedade de dados é caracterizada por uma rica diversidade de fontes de dados, em termos de tipos, formas e tamanhos, que tornam a análise de dados um grande desafio. O grande volume de dados e a velocidade de processamento exigem soluções capazes de lidar com eficiência e escalabilidade (por exemplo, na ordem de tera/petabyte).

A veracidade dos dados é exigida para solucionar a incerteza nos dados, por meio de soluções capazes de identificar e sanar problemas de qualidade de dados. Hoje em dia, várias classes de sistemas de dados massivos estão surgindo, tornando difícil que uma solução se adeque a todos os sistemas pertencentes a esse nicho específico. O nível de integração de diferentes sistemas de dados massivos também é muito baixo, criando uma forte barreira para lidar com cenários de dados massivos, em que vários aspectos devem ser enfrentados ao mesmo tempo. A maioria das soluções de dados massivos tem suporte nativo fraco com relação à segurança, privacidade e QoS, por não considerar a segurança e a privacidade desde o processo de coleta dos dados, até a gestão de armazenamento, e para a aplicação de operações de análise de dados de acordo com políticas específicas.

O projeto EUBRA-BIGSEA irá fornecer uma plataforma integrada, elástica, dinâmica e em nuvem para o processamento de dados massivos, como o intuito de resolver problemas de descoberta do conhecimento, abordando volume de dados, variedade, velocidade e questões de veracidade, bem como so desafios de privacidade, segurança e QoS.

  • O projeto vai integrar as tecnologias de dados massivos para o suporte a:
  • Análise rápida de dados sobre fluxos contínuos.
  • Mineração de dados e aprendizagem de máquina.
  • Análises de dados massivos baseadas em OLAP.

 

A plataforma integrada, aqui proposta, permitirá ao usuário especificar as aplicações que combinam diferentes tipos de dados e elementos de processamento, e instanciá-los em um ambiente de nuvem. A qualidade de serviço, em termos de desempenho, segurança e privacidade será considerada ao longo de todas as fases do desenvolvimento das aplicações de análise de dados e integração de extensões de segurança, com o intuito de assegurar garantias ao longo de todas as tarefas de movimentação e processamento de dados.