Por onde começar no seu TCC

Começar o TCC costuma ser mais difícil do que parece, não por falta de capacidade, mas porque muita gente tenta começar pelo assunto, pela técnica ou por uma ideia “legal”, e só depois percebe que faltou o principal: um problema claro, um recorte viável e um resultado que dá para medir e defender. Neste post, eu vou te mostrar um caminho simples para sair do tema solto e chegar em um projeto bem fechado, usando um checklist prático (PICOC), além de indicar o que vale evitar para não travar no meio do caminho e onde encontrar bases de dados públicas para dar tração no seu trabalho.

Por que muitos TCCs começam errado?

Os erros mais comuns aparecem quando o projeto:

  • começa pelo assunto e não pelo problema,
  • fica com recorte amplo demais,
  • escolhe método antes de ter dados,
  • não define o que vai medir e entregar nos resultados,
  • foca mais na técnica do que no resultado,
  • escolhe tema por modinha, e não pela viabilidade,
  • não tem afinidade com o método ou com o tipo de dado que vai usar.

Se você se identificou com um ou mais pontos, respira. Dá para corrigir rápido com um bom enquadramento.

O método PICOC para fechar o tema


PICOC é um checklist prático para transformar “assunto” em “tema defensável”. A regra é simples: se faltar uma resposta, o tema ainda está solto.
  • P (Population): quem é o público ou unidade de análise?
  • I (Intervention): qual fator, condição ou variável principal você quer avaliar?
  • C (Comparison): com quem ou contra o quê você vai comparar?
  • O (Outcome): qual resultado você vai medir, explicar, prever ou segmentar?
  • C (Context): em qual contexto, local, recorte e período isso vale

P: População (quem você está estudando)

Defina com clareza:

  • o que é sua unidade de análise (pessoa, empresa, anúncio, pedido, mês, loja)
  • critérios de inclusão e exclusão (perfil, senioridade, setor, região, porte)

Exemplos de população:

  • profissionais de dados no Brasil (pesquisa State of Data)
  • anúncios de vinil em uma plataforma
  • anúncios de veículos à venda no estado de SP
  • tickets de suporte de uma empresa
  • vendas mensais de um portfólio de produtos

I: Intervenção (o fator principal)

Aqui entra o “porquê” por trás do resultado. Para não virar lista infinita:

  • escolha 2 a 5 fatores principais
  • teste a regra: “isso vira variável?”

Se não vira variável, ainda é assunto, não tema.

Exemplos de fatores:

  • modelo de trabalho e flexibilidade (remoto/híbrido/presencial)
  • condição do item e reputação do vendedor
  • intensidade de relacionamento (recência, frequência, ticket médio)
  • tipo de demanda e nível de serviço (categoria, tempo de resposta)
  • promoções e sazonalidade (campanhas, preço médio, calendário)

C: Comparação (grupo A vs grupo B)

Comparação define como você vai mostrar diferença com tabelas, gráficos e testes:

  • categorias (A vs B)
  • faixas (quartis, ranges)
  • antes vs depois
  • segmentos e clusters

Exemplos:

  • remoto vs presencial
  • novo vs usado
  • vendedores top vs demais
  • antes vs depois de uma mudança de processo
  • meses com promoção vs sem promoção

O: Outcome (resultado mensurável)

Sem resultado claro, não existe TCC. O outcome precisa ser operacionalizado, por exemplo:

  • métrica numérica (preço, tempo, volume, erro)
  • rótulo/categoria (churn sim/não, intenção sim/não)
  • escala (nota, satisfação, rating)

Exemplos:

  • intenção de turnover e fatores associados
  • preço final e variação por grupo
  • probabilidade de recompra ou LTV estimado
  • resolução no primeiro contato e tempo para resolver
  • erro de previsão em forecast (MAE/MAPE)

C: Contexto (onde e quando)

Contexto delimita escopo e limitações:

  • fonte do dado
  • janela temporal
  • recorte geográfico ou operacional

Exemplos:

  • pesquisa online no Brasil, profissionais de dados
  • plataforma X, últimos 6 meses, moeda/país definidos
  • histórico mensal 24 a 36 meses com calendário promocional

Evite esses temas (para não sofrer depois)

Se você quer terminar o TCC sem virar refém do “vou conseguir depois”, evite:

  • temas sem dados disponíveis (acesso incerto)
  • temas com dados sensíveis e risco de LGPD (saúde, RH, dados identificáveis, localização precisa, conversas privadas sem base legal e anonimização)
  • temas filosóficos demais (sem variável-alvo, sem métrica, sem evidência)
  • setor financeiro sem acesso e autorização (sigilo alto)
  • coleta pesada demais (scraping gigante, rotulagem manual enorme, entrevistas demais)
  • dados que somem ou mudam rápido (APIs instáveis, sites que bloqueiam)
  • base pequena demais para provar o que você quer
  • muitas frentes ao mesmo tempo (cluster + previsão + NLP + dashboard tudo junto)
  • tema “da moda” só por hype (LLM, deep learning, visão computacional)

O que tende a dar certo

Se você quer um caminho seguro:

  • dados acessíveis desde o 1º dia (públicos, internos anonimizados ou acesso garantido)
  • problema específico e mensurável
  • escopo bem recortado (1 setor, 1 plataforma, 1 período)
  • comparação viável
  • resultados apresentáveis por tabelas e gráficos
  • reprodutibilidade (pipeline documentado)
  • relevância prática (gera valor, mesmo simples)
  • baixo risco de LGPD (agregado ou anônimo)
  • 1 objetivo principal bem feito

Onde encontrar dados públicos

Dados abertos do Brasil (governo, estatística e indicadores)

Dados mundiais (economia e desenvolvimento)

Geodados / mapas

Ciência e pesquisa (datasets de artigos)

Repositórios de datasets

Download do material