🏛️ Concursos Públicos e Carreiras do Setor Público 🎁 Gratuito Privado Publicado

1 ° Simulado PROVA SEFAZ CE - Conhecimento Específico (TI)

SIM-0063
145 questões 0,0 0 alunos ~30 min
W
Criado por william
Simulado Privado

Solicite acesso ao autor para poder jogar.

Login para solicitar Curtir (1)

Sobre este simulado

O simulado deve abranger o ciclo de vida completo de projetos de dados, desde a metodologia até a infraestrutura de processamento, focando nos seguintes pilares:

  1. Metodologias e Governança:
  • CRISP-DM: O simulado deve cobrar o entendimento do modelo como um processo intrínsecamente iterativo e cíclico, e não linear. É fundamental abordar os ciclos de retrocesso, como a necessidade de redefinir o negócio após o entendimento dos dados ou a volta à preparação de dados durante a modelagem.
  • MLOps: Foco no Model Registry como o "cartório" da Ciência de Dados, essencial para combater a degradação dos modelos (Data e Concept Drift). As questões devem distinguir claramente as fases de Staging, Production e Archived.
  1. Fundamentos de Estatística e Machine Learning:
  • Taxonomia de Variáveis: O foco deve ser nas Escalas de Stevens, explorando a diferença entre variáveis qualitativas (nominais e ordinais) e quantitativas (discretas e contínuas). Deve-se incluir "pegadinhas" sobre o viés numérico (como classificar CPF ou CEP como qualitativo nominal).
  • Aprendizado Supervisionado: Diferenciação clara entre Regressão (estimar grandezas contínuas) e Classificação (categorizar classes discretas). Atenção especial à Regressão Logística, que, apesar do nome, é um algoritmo de classificação.
  • EDA (Análise Exploratória): Ênfase na visualização (Histogramas, Boxplots e Scatter Plots) como ferramenta de diagnóstico preliminar, que não deve ser confundida com a "cirurgia" de limpeza de dados.
  1. Engenharia e Arquitetura de Dados:
  • Arquitetura Medalhão: Exploração das camadas Bronze (histórico imutável e fiel à fonte), Silver (fonte única da verdade limpa e tipada) e Gold (dados agregados para consumo de BI).
  • Data Lakehouse: Cobrar o conceito de unificação que traz transações ACID para o armazenamento barato de um Data Lake, utilizando formatos como Delta Lake, Iceberg ou Hudi.
  • PySpark: Foco na arquitetura Driver (Maestro) versus Executors (Operários) e no risco de erros de Out of Memory (OOM) ao utilizar comandos como collect() ou toPandas() sem a devida redução de dados via limit().
  1. Extração Analítica e SQL:
  • SQL Avançado: As questões devem testar a ordem lógica de execução (FROM -> WHERE -> GROUP BY -> HAVING -> SELECT) em oposição à ordem de escrita. Um ponto crucial é a distinção entre o filtro de linhas individuais (WHERE) e o filtro de grupos agregados (HAVING).
  • Operações OLAP: Navegação no hipercubo de dados através de operações de Drill-down, Roll-up, Slice, Dice e Pivot, focando na diferença entre navegação hierárquica e restrição de visão.

Diretrizes de Estilo para as Questões (Estilo FCC)

  • Técnica de Distração: Utilize a "Troca de Conceitos" (ex: atribuir características de Evaluation ao Deployment) ou a "Extrapolação" (ex: afirmar que o Spark processa tudo no Driver em qualquer hipótese).
  • Contextualização: Sempre que possível, utilize situações hipotéticas curtas, como um gestor que precisa de um relatório específico ou um engenheiro enfrentando um erro de memória.
  • Fidelidade Acadêmica: O gabarito deve se basear na Realidade Teórica das fontes, combatendo a lógica baseada apenas no senso comum do candidato.

Este simulado visa não apenas testar o conhecimento de termos técnicos, mas a capacidade do candidato de discernir processos passivos (diagnóstico/entendimento) de processos ativos (preparação/limpeza) no fluxo de dados.

Conteúdo do Simulado

43 questões sobre Ciência de Dados.

20 questões sobre Engenharia de Dados.

15 questões sobre Estatística Descritiva.

15 questões sobre Arquitetura de Dados.

15 questões sobre Banco de Dados - SQL.

15 questões sobre Inteligência de Negócio (BI).

15 questões sobre Inteligência Artificial e MLOps.

7 questões sobre Big Data e Processamento Distribuído.

Avaliações 0

Nenhuma avaliação ainda. Seja o primeiro a avaliar!

📊 Visão Geral
145Questões
~72min est.
8Disciplinas
0,0Avaliação
Seja o primeiro a fazer!
👤 Criador
W
william
Ver Perfil