10 coisas que você deve ou n?o fazer com Big Data

Por que confiar em nós
Conclus?o

Big data é um domínio novo e emergente para a maioria das empresas. Fazer com que funcione exige um ajuste cuidadoso e o uso das melhores práticas.

O Big Data é usado e aplicado em vários domínios de negócios à medida que a análise de dados, a inteligência artificial e o aprendizado de máquina continuam a se tornar parte do mainstream.

A análise de Big Data pode extrair o valor real dessa riqueza de dados, que podem ser estruturados, n?o estruturados ou semiestruturados.

O surgimento da mídia social deu origem a muitas novas oportunidades de coletar dados sobre o comportamento do cliente. Aqui est?o alguns exemplos:

  • Os dados de fluxo de cliques s?o provenientes de intera??es no site, como cliques do mouse e rolagem da página da Web.
  • Sites de negócios sociais s?o comunidades on-line de clientes que est?o dispostos a compartilhar informa??es sobre seu comportamento de compra.
  • Os sensores fornecem dados sobre os ambientes físicos dos clientes, como temperatura, umidade e padr?es de tráfego.

Os insights obtidos com a análise de dados podem ajudar as organiza??es em seu processo de tomada de decis?es.

Contudo, o benefício real do big data só é alcan?ado se ele for gerenciado de maneira adequada. 7

As organiza??es podem evitar se perder no espa?o do Big Data, garantindo que identifiquem o ponto de partida com casos de uso simples e o implementem para verificar o resultado rapidamente.

O primeiro passo antes de iniciar qualquer iniciativa de Big Data é o planejamento adequado.

A organiza??o deve conhecer claramente o objetivo do projeto.

Ela também deve identificar o valor que deseja extrair e como isso afetará as decis?es de negócios. Deve-se escolher a área mais promissora para come?ar.

Neste artigo, exploraremos algumas das vantagens e desvantagens das iniciativas de Big Data.

1. Conhecer o objetivo e o ponto de partida

A finalidade da coleta de dados e a identifica??o do ponto de partida s?o fundamentais para o sucesso de qualquer projeto de Big Data.

Para come?ar, o objetivo deve ser identificar os casos de uso mais promissores para a empresa. Isso ajudará a organiza??o a identificar os componentes para esses casos de uso.

Depois disso, deve ser feito um planejamento adequado para aplicar as técnicas de Big Data a esses casos de uso e extrair insights valiosos para o crescimento dos negócios.

A prioridade de execu??o deve depender de fatores como:

  • Custo de implementa??o.
  • Impacto previsto nos negócios.
  • Dura??o do tempo necessário para o lan?amento.
  • Velocidade de implementa??o.

As organiza??es devem sempre come?ar com um aplicativo simples e fácil de implementar como um projeto piloto.

(Leia também: Por que você deve trocar sua ferramenta de gerenciamento de projetos por um sistema operacional de trabalho).

2. Avaliar adequadamente as licen?as de dados

Os dados s?o o combustível para qualquer projeto de Big Data e análise.

Portanto, é muito importante proteger seus dados contra o uso indevido.

Os termos e condi??es de licenciamento adequados devem estar em vigor antes de conceder acesso aos dados a qualquer fornecedor ou usuário terceirizado.

A licen?a de dados deve mencionar claramente os seguintes pontos básicos.

Haverá muitos outros parametros críticos também no contrato de licen?a.

  • Quem usará os dados?
  • Quais dados estar?o acessíveis?
  • Como os dados ser?o usados?

Se houver alguma falha no licenciamento, a perda de dados e o uso indevido resultantes ter?o um impacto negativo inegável nos negócios.

3. Permitir a democratiza??o dos dados

A democratiza??o dos dados pode ser definida como um processo contínuo, no qual todos em uma organiza??o podem acessar os dados.

As pessoas em uma organiza??o devem se sentir à vontade para trabalhar com os dados e expressar suas opini?es com confian?a.

A democratiza??o dos dados ajuda as organiza??es a se tornarem mais ágeis e a tomarem decis?es de negócios baseadas em dados.

Isso pode ser alcan?ado com o estabelecimento de um processo adequado.

Primeiro, os dados devem estar acessíveis a todas as camadas, independentemente da estrutura organizacional.

Em segundo lugar, uma única fonte de verdade (conhecida como “a Fonte Dourada”) deve ser estabelecida após a valida??o dos dados.

Terceiro, todos devem ter permiss?o para verificar os dados e dar suas opini?es.

Quarto, as novas ideias podem ser testadas assumindo riscos calculados. Se a nova ideia for bem-sucedida, a organiza??o poderá seguir em frente; caso contrário, poderá ser considerada uma li??o aprendida.

4. Criar uma cultura de colabora??o

No jogo do Big Data, a colabora??o mútua entre diferentes departamentos e grupos em uma organiza??o é muito importante.

Uma iniciativa de Big Data só pode ser bem-sucedida quando uma cultura organizacional adequada é construída em todas as camadas, independentemente de suas fun??es e responsabilidades.

A gerência de uma organiza??o deve ter uma vis?o clara do futuro e deve incentivar novas ideias.

Todos os funcionários e seus departamentos devem ter permiss?o para encontrar oportunidades e criar provas de conceitos para validá-las.

N?o deve haver nenhuma política para culpar e parar o jogo. é sempre um processo de aprendizado, que deve ser aceito igualmente tanto para o sucesso quanto para o fracasso.

5. Avaliar a infraestrutura de Big Data

A parte da infraestrutura de qualquer projeto de Big Data é igualmente importante.

O volume de dados é medido em petabytes, que s?o processados para extrair insights.

Por isso, tanto a infraestrutura de armazenamento quanto a de processamento precisam ser avaliadas adequadamente.

Os data centers s?o usados para fins de armazenamento e, portanto, devem ser avaliados em termos de componentes de custo, gerenciamento, backup, confiabilidade, seguran?a, escalabilidade e muitos outros fatores.

(Leia também: 6 principais riscos da nuvem pública).

Da mesma forma, o processamento de big data e a infraestrutura tecnológica relacionada devem ser verificados cuidadosamente antes de finalizar o negócio.

Os servi?os em nuvem geralmente s?o muito flexíveis em termos de uso e custo.

Entre os fornecedores de nuvem estabelecidos est?o empresas de peso como AWS, Azure e GCP, mas também há muitas outras no mercado.

6. N?o se perca no mar de dados

Uma boa governan?a de dados é muito importante para o sucesso dos projetos de Big Data.

Uma estratégia adequada de coleta de dados deve ser planejada antes da implementa??o.

Em geral, há uma tendência comum de coletar todos os dados legados de uma empresa.

Porém, todos esses dados podem n?o ser adequados para os cenários comerciais atuais.

Portanto, é importante identificar primeiro os casos de uso dos negócios e determinar onde os dados ser?o aplicados.

Quando a estratégia de dados estiver bem definida e diretamente conectada ao aplicativo de negócios de destino, a próxima etapa da implementa??o poderá ser planejada.

Depois disso, novos dados podem ser aumentados para melhorar o modelo e sua eficiência.

7. N?o se esque?a do código-fonte aberto

A utilidade da tecnologia que você está considerando deve ser avaliada com base no tamanho do projeto e no or?amento da organiza??o.

Muitas plataformas de código aberto est?o disponíveis gratuitamente para a execu??o de projetos-piloto.

Organiza??es de pequeno e médio porte podem explorar essas solu??es de código aberto para iniciar sua jornada de Big Data.

Portanto, o foco da organiza??o deve ser o resultado e o ROI.

O Hadoop é uma estrutura de software de código aberto que usa o HDFS (Sistema de Arquivos Distribuídos do Hadoop) e o MapReduce para analisar big data em clusters de hardware de commodity, ou seja, em um ambiente de computa??o distribuída.

(Leia: Como posso usar o Hadoop para analisar Big Data?)

O movimento de Big Data amadureceu até o ponto em que o Hadoop se tornou o padr?o de fato para o processamento de Big Data.

O MapReduce é um modelo de programa??o para distribuir dados e processá-los em paralelo em um cluster de computadores usando modelos de programa??o simples.

Ele foi desenvolvido pelo Google para processar com eficiência grandes quantidades de dados em grandes clusters de computadores.

8. N?o comece sem um planejamento adequado

é uma tendência muito perigosa iniciar todos os seus projetos de Big Data de uma só vez.

Essa abordagem provavelmente levará apenas a um sucesso parcial ou ao fracasso total.

As organiza??es devem se planejar adequadamente antes de iniciar suas iniciativas de Big Data, em vez de apostar tudo ou dar um salto de fé.

é sempre recomendável come?ar com um aplicativo simples, pequeno e mensurável.

Quando o piloto for bem-sucedido, ele poderá ser implementado em aplicativos de grande escala.

é fundamental dedicar tempo para desenvolver um plano e selecionar cuidadosamente o projeto piloto.

9. N?o negligencie a seguran?a

A seguran?a dos dados é outro aspecto importante dos projetos de Big Data.

Em qualquer cenário de Big Data, petabytes de dados s?o extraídos de diferentes sistemas de origem e, em seguida, s?o processados. Os dados processados s?o a entrada para o modelo analítico.

O resultado da análise é o insight valioso para os negócios.

Uma vez que os dados brutos tenham sido refinados e informa??es significativas tenham sido extraídas desses dados brutos, a confidencialidade, a integridade e a disponibilidade (CIA) dessas informa??es tornam-se essenciais.

Quando os dados contêm informa??es comerciais críticas, eles se tornam valiosos para a organiza??o.

Portanto, esses dados devem ser protegidos contra amea?as externas.

A seguran?a dos dados deve ser planejada como parte do ciclo de vida da implementa??o do Big Data.

(Leia também: Seguran?a na nuvem: 5 riscos cibernéticos comuns).

10. N?o se concentre em unidades de negócios isoladas

No complexo cenário de negócios atual, concentrar-se em uma única unidade de negócios n?o vai ajudar.

As organiza??es devem ter uma vis?o de alto nível do negócio como um todo e pensar em termos de perspectiva global.

A melhor abordagem deve ser dar pequenos passos de cada vez e manter uma vis?o global.

O foco deve ser holístico em termos de unidades de negócios. Isso terá um impacto positivo e um melhor ROI.

Conclus?o

N?o existe um caminho específico para o sucesso da implementa??o do Big Data.

No entanto, é uma combina??o de planejamento, estratégia, abordagem e vários outros fatores que levam ao sucesso.

Cada organiza??o tem uma meta específica a ser alcan?ada, portanto, a estratégia deve ser planejada de acordo, o projeto piloto deve ser escolhido com cuidado e as informa??es resultantes devem ser protegidas e tratadas adequadamente.

Kaushik Pal
Technology Specialist
Kaushik Pal
Especialista em Tecnologia

Kaushik é arquiteto técnico e consultor de software com mais de 23 anos de experiência em análise, desenvolvimento, arquitetura, design, teste e treinamento de software. Ele tem interesse em novas tecnologias e áreas de inova??o. Ele se concentra em arquitetura web, tecnologias web, Java/J2EE, software de código aberto, WebRTC, big data e tecnologias semanticas. Ele demonstrou experiência em análise de requisitos, projeto e implementa??o de arquitetura, casos de uso técnico e desenvolvimento de software. Sua experiência abrangeu vários setores, como seguros, bancos, companhias aéreas, transporte marítimo, gerenciamento de documentos e desenvolvimento de produtos, etc. Ele trabalhou em uma ampla gama…

',a='';if(l){t=t.replace('data-lazy-','');t=t.replace('loading="lazy"','');t=t.replace(/