Mineração de Dados: Tarefas, Conceitos e Aplicações

 

Imagem sobre dados

Nas últimas décadas as organizações estão dando cada vez mais importância aos dados, devido as vantagens competitivas que podem proporcionar para quem conseguir extrair informações desses dados.

Para o matemático e cientista de dados Clive Hobert Humby “os dados são o novo petróleo”, essa declaração reflete a realidade de como os dados tem se tornado o ouro para empresas de todos os seguimentos.

As empresas também passaram a investir mais em TI (Tecnologia da Informação), foi constatado pelo relatório anual do uso de TI feito pela FGV (Fundação Getúlio Vargas), que grandes e médias empresas estão alocando 8,7% do faturamento líquido em investimentos em TI.

É notável também o uso de mineração de dados (data mining) e sua importância para as organizações, pois tem ajudado a encontrar padrões que agregam valor nas estratégias de negócios de empresas de diversos setores (TOTVS, 2022).

O que é Mineração de Dados?

A mineração de dados surgiu da necessidade de análise automatizada de dados, haja vista que as bases de dados se tornaram gigantescas e os métodos convencionais de análises de dados não eram mais viáveis.

Data mining está fortemente relacionado ao processo de descoberta de conhecimentos em bases de dados – KDD (Knowledge Discovery in Data Bases) sendo uma das etapas do processo KDD, a mineração de dados recorre a aplicação de técnicas e algoritmos específicos a fim de descobrir padrões úteis em bancos de dados (Fayyad, Piatetsky e Smyth, 1996).

Outra definição de mineração de dados por Hand, Mannila e Smyth (2001) é que data mining é a análise de grandes bases de dados com o propósito de encontrar relacionamento entre esses dados, informações úteis e compreensíveis para o proprietário dos dados.

Principais Tarefas da Mineração de Dados

Através da mineração de dados é possível realizar determinadas tarefas que são de grande importância para obtenção de conhecimento em bases de dados, a seguir é listado as principais tarefas de data mining (Camilo e Silva, 2009).

Descrição: Essa tarefa pretende mostrar padrões encontrados nos dados bem como as tendências, a descrição pode apresentar uma interpretação possível dos padrões extraídos mediante a aplicação dos algoritmos e técnicas de mineração de dados.

Classificação: Analisa um registro e identifica relacionamentos com outras classes, um exemplo disso é quando um serviço de streaming de filmes e séries faz uma sugestão de qual filme é mais indicado para o seu perfil com base no seu histórico.

Predição: A tarefa de predição consiste em analisar dados propostos e prever uma situação futura com base nos padrões apresentados, podemos usar como exemplo a tendência de preço de um determinado produto com base em dados anteriores.

Agrupamento (Clustering): Consiste em analisar e separar dados com valores semelhantes agrupando-os, sendo útil para obter padrões do tipo: “lotes de um determinado produto apresentaram problemas depois de 3 meses de uso”, geralmente essa tarefa é usada em conjunto com outras tarefas.

Associação: Essa tarefa é muito valiosa para o comércio e varejo, tendo obtido ótimos resultados, ela consiste em identificar relacionamentos entre dados do tipo: “Maioria dos clientes que compraram queijo também levaram pão”.

Empresas que Utilizam Mineração de Dados

Muitas organizações perceberam que o investimento em tecnologias poderia fazer a diferença no sucesso dos negócios, desde então a mineração de dados tem sido aplicada em diversos segmentos.

Netflix: Constantemente citada como exemplo de sucesso no uso de ciência de dados, a Netflix investiu alto para otimizar seus algoritmos de indicação de filmes e séries, fornecendo sugestões personalizadas aos seus usuários com base nas suas atividades dentro da plataforma (FREITAS, 2018).

TOTVS: Empresa líder no fornecimento de sistemas de gestão no Brasil (FGV, 2022) também investe e fornece serviços de mineração de dados para seus clientes, proporcionando extração de padrões que podem auxiliar na tomada de decisões nos negócios (TOTVS, 2022).

Facebook: Usa a ciência de dados para aprimorar a sugestão de amizades dentro da plataforma, conseguindo indicar amizades que possivelmente vão se dar bem com você. Isso é possível devido ao uso de algoritmos de mineração de dados que analisam seus contatos, cookies e o que você escreve, para então chegar nas informações necessárias para fazer a sugestão.

Tinder: A rede social também usa algoritmos de data mining para classificar usuários com maior probabilidade de Match, selecionando variáveis como interesses comuns, localidade e atividade dentro da rede (LEMOS, 2020).

Exemplos de Aplicações da Mineração de Dados

Varejo: Essa é uma das áreas onde a mineração de dados tem contribuído para o crescimento, pois dados sobre vendas, produtos e clientes quando submetidos a técnicas de data mining, apresentam informações que podem ser usadas para otimizar campanhas, marketing e promover ofertas direcionadas a um determinado perfil de cliente.

Educação: Nessa área a data mining pode ser útil para prever o progresso dos alunos, perceber quem está com maiores dificuldades em determinado assunto e sugerir planos de ensino adequados para o perfil de uma determinada classe.

Saúde: Existem diversos trabalhos na literatura apontando resultados do uso de mineração de dados na área da saúde, um exemplo disso é trabalho de Quevedo (2015) onde foi feito a aplicação da data mining para descobrir perfis de risco de câncer.

Considerações Finais

A descoberta de conhecimentos em bases de dados tem sido amplamente utilizada em médias e grandes empresas devido ao alto potencial competitivo que a extração de conhecimento útil pode trazer. É possível notar que as grandes organizações de hoje, foram as que mais investiram em ciência de dados no passado.

Referências

CAMILO, Oliveira; SILVA, Carlos. Mineração de dados: conceitos, tarefas, métodos e ferramentas.  2009.

FGV. Panorama do Uso de TI no Brasil. Disponível em <https://eaesp.fgv.br/sites/eaesp.fgv.br/files/u68/fgvcia_pesti_-_panorama_2022.docx> Acesso em 23 de Novembro de 2022.

FAYYAD, Usama; PIATETSKY, Gregory; SMYTH, Padharaic. From data mining to knowledge discovery in databases. 1996.

FREITAS, M. L. Netflix e o uso de ciência de dados para alcançar o sucesso. Disponível em < https://pt.linkedin.com/pulse/netflix-e-o-uso-da-ci%C3%AAncia-de-dados-para-alcan%C3%A7ar-lucas> Acesso em 23 de Novembro de 2022.

HAND, D.; MANNILA, H.; SMYTH, P. Principles of Data Mining. MIT Press, 2001.

LEMOS, Sandra. A Ciência de Dados no mercado: 7 casos de sucesso. Disponível em < https://insightlab.ufc.br/a-ciencia-de-dados-no-mercado-7-casos-de-sucesso> Acesso em 23 de Novembro de 2022.

QUEVEDO, V. M. Aplicação do Data Mining na Descoberta de Perfis de Risco de Câncer. 2015.

TOTVS. Mineração de Dados: O que é, importância e ferramentas. Disponível em < https://www.totvs.com/blog/negocios/mineracao-de-dados/> Acesso 23 de Novembro de 2022.

Recentes: