Skip to content

Diário de Bordo – Luana Medeiros

Disciplina: Gerência de Configuração e Evolução de Software

Equipe: WebScrapping

Comunidade/Projeto de Software Livre: Check-up


Sprint 0 – 02/09/2025 - 10/09/2025

Resumo da Sprint

Nesta sprint, o foco esteve no reconhecimento inicial do projeto, por meio da leitura da documentação e análise dos repositórios no GitHub. Foram realizadas atividades de configuração do ambiente, estudo das políticas de governança, comunicação e engenharia de software, além da contribuição para a documentação da equipe. O objetivo principal foi estabelecer uma base de conhecimento sólida sobre os projetos e seu funcionamento, de forma a preparar terreno para contribuições mais efetivas nas próximas etapas da disciplina.

Atividades Realizadas

Data Atividade Tipo (Código/Doc/Discussão/Outro) Link/Referência Status
06/09 Leitura da Documentação do projeto Base Estudo/Ambientação Docs Concluído
06/09 Leitura do README.md do Projeto Base Estudo/Ambientação README Concluído
08/09 Clonagem do Fork do Repositório Configuração Repositório Concluído
08/09 - 09/09 Configuração do Ambiente Local Configuração Repositório Concluído
09/09 Execução de comandos de scrapping para teste Configuração Repositório Concluído
10/09 Criação do Diário de Bordo Doc Documento Concluído

Maiores Avanços

  • Aprendi a rodar a aplicação e configurar o ambiente.
  • Entendi a arquitetura dos projetos Check-up e EhFake.
  • Conheci as regras de contribuição.
  • Compreendi as formas de contribuição na disciplina.

Maiores Dificuldades

  • Entender a arquitetura e os objetivos do projeto.
  • Dificuldade em se situar e compreender a forma de contribuição.
  • Pouco tempo para absorver a complexidade e as regras do projeto.

Aprendizados

  • Uso básico de GitHub Issues.
  • Fluxo de contribuição do projeto.

Plano Pessoal para a Próxima Sprint

  • [ ] Contribuir com pelo menos 1 PR.
  • [ ] Participar da revisão de código de um colega.

Sprint 1 – 15/09 a 24/09

Resumo da Sprint

O principal objetivo desta sprint foi desenvolver os scrapers dos portais Brasil de Fato e Agência Pública, garantindo a coleta consistente de notícias e integrando as implementações ao fluxo do projeto, por meio da abertura de PRs no repositório principal.

Atividades Realizadas

Data Atividade Tipo (Código/Doc/Discussão/Outro) Link/Referência Status
18/09/2025 Estudo e mapeamento dos portais para implementação dos scrapers Estudo Concluído
24/09/2025 Início da codificação local dos scrapers dos portais Brasil de Fato e Agência Pública Código Concluído
24/09/2025 Abertura dos PRs em rascunho com a implementação inicial dos scrapers Código PR#39
PR#40
Concluído
24/09/2025 Elaboração e submissão do relatório da Sprint 1 Doc PR#41 Concluído

Maiores Avanços

  • Melhor compreensão do padrão de normalização de notícias no projeto.
  • Scrapers para os portais Brasil de Fato e Agência Pública concluídos em versão inicial (draft).
  • PRs abertos para revisão da equipe e mantenedores.

Maiores Dificuldades

  • Garantir consistência nos campos de saída (título, descrição, conteúdo e tags).
  • Organização da carga horária entre desenvolvimento e testes.

Aprendizados

  • Padrões do projeto para padronização dos dados e estruturação dos scrapers.
  • Técnicas para criar seletores mais resilientes a mudanças no HTML dos portais.

Plano Pessoal para a Próxima Sprint

  • [ ] Acompanhar e aplicar os feedbacks dos PRs (#39 e #40) até o merge.
  • [ ] Avaliar e iniciar a contribuição em um novo portal.

Sprint 2 – 25/09/2025 - 08/10/2025

Resumo da Sprint

A sprint foi focada em desenvolver a melhoria de de um crawl/scraper, além de ajustar um erro de configuração do playwright.

Atividades Realizadas

Data Atividade Tipo Link/Referência Status
08/10 Correção dos arquivos de configuração de ambiente Código - Concluído
08/10 Revisão de PRs de documentos internos Documentação - Concluído

Maiores Avanços

  • Correção da configuração de ambiente

Maiores Dificuldades

  • Configuração do dockerfile

Aprendizados

  • Aprendizado sobre configuração de ambiente Docker
  • WebScrapping

Plano Pessoal para a Próxima Sprint

  • [ ] Melhorar conhecimento em testes.
  • [ ] Criar um webscrapping para um jornal não listado

Sprint 3 – 08/10/2025 - 22/10/2025

Resumo da Sprint

A sprint foi focada em desenvolver testes para avaliar a integração e funcionamento dos scrapers.

Atividades Realizadas

Data Atividade Tipo Link/Referência Status
15/10 Desenvolvimento de comando make para execução dos testes Código - Em andamento
20/10 Desenvolvimento de testes para analisar a coleta de informações dos scrapers Código - Em andamento

Maiores Avanços

  • Testes automatizados para validar coleta de scrapers
  • Comando simples para executar todos os testes

Maiores Dificuldades

  • Criação dos testes de análise das páginas reais

Aprendizados

  • Testes de integração e testes unitários
  • WebScrapping

Plano Pessoal para a Próxima Sprint

  • [ ] Melhorar conhecimento em testes.
  • [ ] Concluir criação dos testes para os scrapers