Skip to content

Diário de Bordo – Pedro Henrique Martins Silva

Disciplina: Gerência de Configuração e Evolução de Software Equipe: WebScrapping Comunidade/Projeto de Software Livre: Check-up


Sprint 0 – 02/09/2025 - 10/09/2025

Resumo da Sprint

Na sprint 0 foram definidas duas frentes para contribuição, fork do projeto principal, recebimento de jornais que precisarão de atenção e configuração do ambiente. Primeiros dias perdi tempo para começar a entender po projeto pois o link que a professora deixou no github do curso era um link errado.

Atividades Realizadas

Data Atividade Tipo (Código/Doc/Discussão/Outro) Link/Referência Status
04/09 Leitura da Documentação do projeto errado Estudo/Ambientação Repositório Concluído
08/09 Leitura do README.md do Projeto Base Estudo/Ambientação README Concluído
08/09 Configuração do Ambiente Local Configuração Concluído
10/09 Clonagem do Fork do Repositório Configuração Repositório Concluído
10/09 Execução de comandos de scrapping para teste Configuração Repositório Concluído
10/09 Documentação do Diário de Bordo Doc Documento Concluído

Maiores Avanços

  • Me ambientei com o que o projeto se propõe
  • Configurei ambiente sem problemas

Maiores Dificuldades

  • Comunicação com o grupo
  • scrapping inicial

Aprendizados

  • Fluxo de execução do projeto

Plano Pessoal para a Próxima Sprint

  • [x] Analisar o fluxo de GCES do projeto e se possível
  • [x] Abrir minha primeira issue
  • [x] Resolver problema do scraper na minnha máquina

Sprint 1 – 15/09 – 24/09

Resumo da Sprint

Nesta sprint eu analisei o fluxo de o fluxo de GCES do projeto, resolvi o problema do scraper na minha máquina e abri minha primeira issue dentro do projeto.

Atividades Realizadas

Data Atividade Tipo Link/Referência Status
19/09 Análise do fluxo de GCES Estudo/Ambientação Link Concluído
20/09 Resolver problema do scraper Código Link Concluído
23/09 Abertura de issue Doc Issue#22 Concluído
23/09 Documentação do Diário de Bordo Doc Concluído

Maiores Avanços

  • Primeira Issue aberta

  • Maior entendimento do fluxo de GCES do projeto

Maiores Dificuldades

  • Dificuldade para trobleshooting do scraper

Aprendizados

  • Funcionamento completo do scraper

Plano Pessoal para a Próxima Sprint

  • [ ] Entender o fluxo de implementação do fluxo de scrap de um novo jornal.

  • [ ] Abrir uma issue para melhora do fluxo de GCES do projeto.

  • [x] Abrir meu primeiro PR.


Sprint 2 – 29/09 – 08/10

Resumo da Sprint

Nesta sprint abri meu primeiro PR para o projeto principal

Atividades Realizadas

Data Atividade Tipo Link/Referência Status
27/09 PR sobre resolução de problemas na build do scraper Doc PR#44 Concluído
01/10 Abrir issue sobre documentação de segurança no projeto Doc Issue#45 Concluído

Maiores Avanços

  • Primeiro PR aberto

  • Entendimento do fluxo de GCES do projeto

Maiores Dificuldades

  • Tempo disponível

Aprendizados

  • Fazer PR de um fork para o projeto principal

Plano Pessoal para a Próxima Sprint

  • [x] Entender o fluxo de implementação do fluxo de scrap de um novo jornal.

  • [x] Iniciar a implementação do scrap de um novo jornal.

Sprint 3 – 13/10 – 28/10

Resumo da Sprint

Nesta sprint foi realizada a minha primeira grande contrinuição para o projeto, onde adicionei o meu primeiro scraper de um portal

Atividades Realizadas

Data Atividade Tipo Link/Referência Status
20/10 Estudo sobre a implementação de um novo scraper no projeto Estudo Referência Concluído
25/10 Estudo sobre a implementação atualizada de um novo portal Estudo Referência Concluído
28/10 Criação de issue para implementação do portal Polêmica Paraíba Doc Issue#87 Concluído
28/10 Implementação inicial do portal Polêmica Paraíba Código Concluído
03/12 PR com as alterações concluídas e bugs corrigidos Doc PR#89 Concluído

Maiores Avanços

  • Entendimento do fluxo de spider e play do projeto

  • Primeira grande contruinuição ao projeto

  • Implementação do scraper do portal Polêmica Paraíba

Maiores Dificuldades

  • Erros de dependências locais

Aprendizados

  • Apredi o que é um scraper de forma teórica e como implementá-lo

Plano Pessoal para a Próxima Sprint

  • [x] Implementar o scrap de um novo jornal.

Sprint 4 – 23/10 – 19/11

Resumo da Sprint

Nesta sprint foi realizada a implementação de mais um scraper para o projeto

Atividades Realizadas

Data Atividade Tipo Link/Referência Status
29/10 Estudo sobre o funcionamento das notícias no site Estudo Referência Concluído
19/11 Criação de issue para implementação do jornal Carta Capital Doc Issue#89 Concluído
28/10 Implementação do jornal Carta Capital Código Concluído
03/12 PR com as alterações concluídas Doc PR#90 Concluído

Maiores Avanços

  • Entendimento maior sobre spider e play do projeto

Maiores Dificuldades

  • Disposição de tempo

Aprendizados

  • Apredi uma melhor forma de analisar a estrutura do HTML do projeto para facilitar na implementação