ML and AI modeling
Esta é a nossa primeira conversa técnica. Vamos discutir a sua experiência e alguns conceitos de ciência de dados, machine learning e AI. O objetivo é entender seu raciocínio e sua visão. Se a gente se der bem aqui, você avança para as próximas etapas!
-
📚 Como se preparar – ML and AI modeling:
- Relembre os principais projetos anteriores e revise suas experiências passadas em ML/DS/AI: Conte-nos de forma sucinta sobre seus projetos mais importantes.
- Fundamentos técnicos: Prepare-se para perguntas sobre algoritmos e conceitos de Machine Learning e AI que você usou em seus projetos. Explique a intuição por trás das técnicas que você aplicou.
Exemplo: Você já trabalhou com gradient boosting? Se sim, sabe me explicar intuitivamente como funcionam os modelos de boosting e suas diferenças para os modelos de bagging?
- Abordagem em casos de negócio: Nesta etapa, você resolverá um caso real focado na sua capacidade de estruturar problemas e propor soluções. Adote uma abordagem interativa: comece estabelecendo um MVP que contemple o projeto de ponta a ponta e, gradualmente, adicione camadas de complexidade e o tratamento de corner cases. Lembre-se de que o objetivo não é encontrar uma “resposta certa”, mas sim demonstrar a clareza do seu raciocínio lógico e a maturidade da sua metodologia de decisão.
-
📌 Checklist – ML and AI modeling:
Quer garantir que não esqueceu de nada? Use essa checklist para guiar sua abordagem:
[ ] Entendo as principais metodologias e conceitos de ML e entendo as técnicas e métodos que apliquei em meus projetos. Estando preparado para perguntas técnicas sobre ML, DS e AI.
[ ] Tenho projeto(s) relevante(s) de Data Science, AI ou Machine Learning pronto(s) para discutir. E consigo explicar claramente minhas experiências passadas nessas disciplinas.
[ ] Sei explicar a intuição por trás das técnicas que apliquei em meus projetos.
[ ] Consigo demonstrar minhas habilidades de raciocínio em um caso de negócio.
[ ] Sei como estruturar um problema e pensar em diferentes soluções. -
📑Materiais de apoio – ML and AI modeling:
- The Hundred-Page Language Models Book – Andriy Burkov
- The Hundred-Page ML Book – Andriy Burkov
- Intro to ML – Kaggle
- Intermediate ML – Kaggie
- AI Engineering: Building Applications with Foundation Models – Chip Huyen
- Build a Large Language Model (From Scratch) – Sebastian Raschka
- Transformers: The Definitive Guide – Nicole Koenigstein
DS Case
Nesta etapa, faremos perguntas técnicas abertas e convidamos você a modelar um problema baseado em casos reais que você encontrará no QuintoAndar, e a aprofundar-se em tópicos relevantes de Machine Learning.
-
💙 O que esperamos
- Conhecimento em técnicas de modelagem (Classificação, Regressão, Métricas de avaliação, monitoramento, aplicação de ML para cases reais, feature engineering, Agentic AI evals, Prompt engineering, Deep Learning…)
- Raciocínio estratégico;
- Orientação para resultados de negócio;
- Bom storytelling.
-
📚 Como se preparar – DS Case
1. Domínio técnico e fundamentos
O que esperamos: Valorizamos quem compreende a mecânica por trás das ferramentas. Ao propor uma solução, não se limite a apenas citar um modelo ou algoritmo; demonstre profundidade detalhando o funcionamento dos métodos ou métricas escolhidos.
- Exemplo: Em vez de apenas nomear um algoritmo (“usarei o Modelo X”), explique por que a função de perda (loss function) dele é adequada para a distribuição dos seus dados ou como a métrica de avaliação escolhida se conecta diretamente ao sucesso do negócio.
2. Foco na solução (abordagem agnóstica)
O que esperamos: O objetivo principal é resolver o problema de forma eficaz e sustentável. O método é uma ferramenta para alcançar o resultado; queremos ver sua capacidade de escolher a abordagem que melhor equilibra performance e viabilidade.
- Exemplo: Ao enfrentar um problema de ordenação ou recomendação, o foco deve ser em como você constrói uma solução robusta. Mais importante do que usar a arquitetura mais complexa é garantir que a estratégia resolva a dor do usuário e que você saiba como medir esse impacto.
3. Comunicação e raciocínio colaborativo
O que esperamos: Queremos conhecer seu processo de pensamento em tempo real. Enxergue o entrevistador como um parceiro de projeto, promovendo uma troca constante de ideias e validação de premissas.
- Exemplo: Durante a resolução, compartilhe seus trade-offs de forma transparente: “Estou optando por esta estrutura inicial para validar a hipótese principal, mas em um cenário de escala, poderíamos seguir pelo caminho Y. Faz sentido essa priorização para você?”.
4. Entrega incremental (resolva, depois otimize)
O que esperamos: Demonstre pragmatismo. Comece estabelecendo uma solução sólida e funcional que resolva o cerne do problema (o “end-to-end”) para, só então, discutir e implementar refinamentos técnicos.
- Exemplo: Se o desafio envolve modelagem, estruture primeiro um pipeline completo com um modelo base confiável. Uma vez que o fluxo lógico estiver validado, demonstre como você evoluiria para técnicas mais sofisticadas (como contrastive learning ou arquiteturas específicas) para ganhar performance extra.
-
📌 Tópicos para Entrevista Técnica – DS Case
- Definição do problema de modelagem, incluindo a formulação do objetivo e seus impactos técnicos e de negócio
- Desenvolvimento de modelos de Machine Learning, cobrindo decisões de modelagem e treinamento
- Uso e preparação de dados, com foco em variáveis e informações utilizadas pelo modelo
- Avaliação de modelos, considerando critérios técnicos e experimentação
- Interpretação dos resultados, entendimento do comportamento do modelo
- Aplicação do modelo em ambiente produtivo, incluindo integração com sistemas e acompanhamento de resultados
-
📑Materiais de apoio – DS Case
Coding and SQL
Nesta entrevista, você precisará usar algoritmos e SQL para resolver um ou mais problemas de programação em um contexto de Machine Learning. Este é o momento de mostrar suas habilidades de codificação na prática!
-
📚 Materiais de apoio:
- Super Study Guide: Algorithms & Data Structures – Afshine Amidi & Shervine Amidi.
-
📚 Como se preparar – Coding & SQL
O objetivo é avaliar sua capacidade de aplicar lógica e programação para construir a base de um projeto de dados.
Linguagens de Programação:
- Sinta-se à vontade com pelo menos uma linguagem de programação de sua escolha. É importante conhecer Orientação a Objetos (Object-Oriented Design) e saber como testar seu código. Para ciência de dados e ML no QuintoAndar usamos o Python.
- Saiba criar métodos e funções para aplicar modelos de ML em políticas ou formatar as saídas de modelos de ML, ou chamadas de LLMs para resolver algum problema de negócio
Estruturas de Dados:
- Familiarize-se com arrays (listas), listas ligadas (linked lists), pilhas (stacks), filas (queues), sets, mapas (maps/dicionários), árvores e grafos.
Complexidade:
- Demonstre que você consegue raciocinar sobre a complexidade de tempo e espaço de um algoritmo e como melhorá-la. É bom conhecer o básico da notação Big-O.
Criação de Dataset:
- Consiga consultar dados usando as melhores práticas para construir um conjunto de dados de treinamento (training dataset). Consiga montar transformações para criar features ou agregações de dados.
✅ Boas práticas e correção
- Correção: Você usará um IDE online com recursos básicos. Aproveite o code completion e o syntax highlighting para testar seu código.