Skip to content

📝 Relatório de Contribuição – Sprint 2

Disciplina: Gestão de Configuração e Evolução de Software Equipe: EH-FAKE Comunidade/Projeto de Software Livre: EH-FAKE / Check-up Período da Sprint: 25/09/2025 à 08/10/2025


1. Objetivos da Sprint

  • [ ] Incluir novos portais de notícias no pipeline (scrapers/plays)
  • [ ] Corrigir scrapers quebrados e melhorar robustez de seletores
  • [ ] Validar resultados localmente e revisar dados coletados
  • [ ] Manter a documentação interna atualizada

2. Entregas Coletivas

Entrega Status (Concluído/Parcial/Pendente) Link/Referência Observações
Criação/Evolução de portais (Agora no Vale; Jornal de Brasília; Brasil de Fato; Cada Minuto; Congresso em Foco) Concluído PR#55, PR#53, Issue#50, PR#39, PR#40, Issue#51
Correção do scraper “Estadão” Concluído Issue#42
Melhoria no Front-end Concluído PR#46
Ajustes de CI e organização (fork do time) Concluído PR#16
Atualizações na documentação interna Concluído docs internos

3. Contribuições Individuais

Integrante Contribuições principais Links (PRs, Issues, Docs)
Alana Implementação do portal “Agora no Vale”; Criação do relatório da sprint 2 PR#55, PR#62
Ana Catarina
Carlos Melhoria do Crawler/Scraper RBS; correção de configuração de ambiente (Playwright/Docker) PR#38, PR#49
Daniel Implementação do portal “Cada Minuto”; Resolução de permissões/Playwright/Docker; Commit 30/09, Commit 07/10
Eduardo Conclusão do portal “Jornal de Brasília”; PR#53, Issue#50
Felipe Implementação do portal “Brasil de Fato”; Testes e adequação de CI PR#39
Gabriel Correção do scraper “Estadão” Issue#42
Luana
Luciano Correção do bug “Access Denied” do scraper; Apoio na solução do bug de browsers do Playwright PR#56, PR#49
Mateus Levy Implementação do portal Poder360; Commit
Pedro Ferreira
Pedro Silva Resolução de problemas na build od scraper; Documento de Política de Segurança PR#44, Issue#45
Vinicius Melhorias no Front-end PR#46
Yago Implementação do portal "Congresso em Foco" Issue#51

4. Dificuldades Coletivas

  • Variação de estrutura HTML e seletores frágeis em alguns portais.
  • Páginas com paywall (Estadão) exigindo abordagens específicas e múltiplos seletores.
  • Alocação de tempo para testes manuais e validação dos resultados.

5. Aprendizados Coletivos

  • Pipeline fim a fim (crawling → scraping/plays → armazenamento) mais consolidada entre o time.
  • Seletores mais robustos e estratégias de fallback melhoram a resiliência a mudanças em portais.
  • Importância de validações manuais e revisão cruzada via PR para garantir qualidade de dados e documentação.

6. Próximos Passos

  • [ ] Acompanhar feedbacks e merges pendentes (e.g., PRs #53, #55 e correlatos).
  • [ ] Iniciar novos portais priorizados e ampliar cobertura.
  • [ ] Investigar automações/monitoramento para detectar quebras de scrapers.