Diário de Bordo – Pedro Henrique Martins Silva¶
Disciplina: Gerência de Configuração e Evolução de Software Equipe: WebScrapping Comunidade/Projeto de Software Livre: Check-up
Sprint 0 – 02/09/2025 - 10/09/2025¶
Resumo da Sprint¶
Na sprint 0 foram definidas duas frentes para contribuição, fork do projeto principal, recebimento de jornais que precisarão de atenção e configuração do ambiente. Primeiros dias perdi tempo para começar a entender po projeto pois o link que a professora deixou no github do curso era um link errado.
Atividades Realizadas¶
| Data | Atividade | Tipo (Código/Doc/Discussão/Outro) | Link/Referência | Status |
|---|---|---|---|---|
| 04/09 | Leitura da Documentação do projeto errado | Estudo/Ambientação | Repositório | Concluído |
| 08/09 | Leitura do README.md do Projeto Base |
Estudo/Ambientação | README | Concluído |
| 08/09 | Configuração do Ambiente Local | Configuração | Concluído | |
| 10/09 | Clonagem do Fork do Repositório | Configuração | Repositório | Concluído |
| 10/09 | Execução de comandos de scrapping para teste | Configuração | Repositório | Concluído |
| 10/09 | Documentação do Diário de Bordo | Doc | Documento | Concluído |
Maiores Avanços¶
- Me ambientei com o que o projeto se propõe
- Configurei ambiente sem problemas
Maiores Dificuldades¶
- Comunicação com o grupo
- scrapping inicial
Aprendizados¶
- Fluxo de execução do projeto
Plano Pessoal para a Próxima Sprint¶
- [x] Analisar o fluxo de GCES do projeto e se possível
- [x] Abrir minha primeira issue
- [x] Resolver problema do scraper na minnha máquina
Sprint 1 – 15/09 – 24/09¶
Resumo da Sprint¶
Nesta sprint eu analisei o fluxo de o fluxo de GCES do projeto, resolvi o problema do scraper na minha máquina e abri minha primeira issue dentro do projeto.
Atividades Realizadas¶
| Data | Atividade | Tipo | Link/Referência | Status |
|---|---|---|---|---|
| 19/09 | Análise do fluxo de GCES | Estudo/Ambientação | Link | Concluído |
| 20/09 | Resolver problema do scraper | Código | Link | Concluído |
| 23/09 | Abertura de issue | Doc | Issue#22 | Concluído |
| 23/09 | Documentação do Diário de Bordo | Doc | Concluído |
Maiores Avanços¶
-
Primeira Issue aberta
-
Maior entendimento do fluxo de GCES do projeto
Maiores Dificuldades¶
- Dificuldade para trobleshooting do scraper
Aprendizados¶
- Funcionamento completo do scraper
Plano Pessoal para a Próxima Sprint¶
-
[ ] Entender o fluxo de implementação do fluxo de scrap de um novo jornal.
-
[ ] Abrir uma issue para melhora do fluxo de GCES do projeto.
-
[x] Abrir meu primeiro PR.
Sprint 2 – 29/09 – 08/10¶
Resumo da Sprint¶
Nesta sprint abri meu primeiro PR para o projeto principal
Atividades Realizadas¶
| Data | Atividade | Tipo | Link/Referência | Status |
|---|---|---|---|---|
| 27/09 | PR sobre resolução de problemas na build do scraper | Doc | PR#44 | Concluído |
| 01/10 | Abrir issue sobre documentação de segurança no projeto | Doc | Issue#45 | Concluído |
Maiores Avanços¶
-
Primeiro PR aberto
-
Entendimento do fluxo de GCES do projeto
Maiores Dificuldades¶
- Tempo disponível
Aprendizados¶
- Fazer PR de um fork para o projeto principal
Plano Pessoal para a Próxima Sprint¶
-
[x] Entender o fluxo de implementação do fluxo de scrap de um novo jornal.
-
[x] Iniciar a implementação do scrap de um novo jornal.
Sprint 3 – 13/10 – 28/10¶
Resumo da Sprint¶
Nesta sprint foi realizada a minha primeira grande contrinuição para o projeto, onde adicionei o meu primeiro scraper de um portal
Atividades Realizadas¶
| Data | Atividade | Tipo | Link/Referência | Status |
|---|---|---|---|---|
| 20/10 | Estudo sobre a implementação de um novo scraper no projeto | Estudo | Referência | Concluído |
| 25/10 | Estudo sobre a implementação atualizada de um novo portal | Estudo | Referência | Concluído |
| 28/10 | Criação de issue para implementação do portal Polêmica Paraíba | Doc | Issue#87 | Concluído |
| 28/10 | Implementação inicial do portal Polêmica Paraíba | Código | Concluído | |
| 03/12 | PR com as alterações concluídas e bugs corrigidos | Doc | PR#89 | Concluído |
Maiores Avanços¶
-
Entendimento do fluxo de spider e play do projeto
-
Primeira grande contruinuição ao projeto
-
Implementação do scraper do portal Polêmica Paraíba
Maiores Dificuldades¶
- Erros de dependências locais
Aprendizados¶
- Apredi o que é um scraper de forma teórica e como implementá-lo
Plano Pessoal para a Próxima Sprint¶
- [x] Implementar o scrap de um novo jornal.
Sprint 4 – 23/10 – 19/11¶
Resumo da Sprint¶
Nesta sprint foi realizada a implementação de mais um scraper para o projeto
Atividades Realizadas¶
| Data | Atividade | Tipo | Link/Referência | Status |
|---|---|---|---|---|
| 29/10 | Estudo sobre o funcionamento das notícias no site | Estudo | Referência | Concluído |
| 19/11 | Criação de issue para implementação do jornal Carta Capital | Doc | Issue#89 | Concluído |
| 28/10 | Implementação do jornal Carta Capital | Código | Concluído | |
| 03/12 | PR com as alterações concluídas | Doc | PR#90 | Concluído |
Maiores Avanços¶
- Entendimento maior sobre spider e play do projeto
Maiores Dificuldades¶
- Disposição de tempo
Aprendizados¶
- Apredi uma melhor forma de analisar a estrutura do HTML do projeto para facilitar na implementação