Pixiv Encyclopedia Viewer History Extractor

"web_ui"

Uma ferramenta de extração para Pixiv Encyclopedia Viewer Count History

README em japonês

A versão em japonês está aqui: README.ja.md.

Extraia dados diários do histórico de visualizações de um artigo da Pixiv Encyclopedia (pixiv百科事典).

O histórico de visualizações da Pixiv Encyclopedia é um bom dataset de séries temporais do mundo real.

Ele costuma mostrar:

Você pode usar o CSV extraído como sample data para:

⚠️ Tool não oficial
Este project não é afiliado à Pixiv nem endorsed por ela.
Siga Pixiv’s Terms of Use e robots.txt ao usar este script.

Fetch diretamente da Pixiv Encyclopedia por article title (e.g., "ブルーアーカイブ")
Ou leitura a partir de um local HTML file
Output de JSON Lines para stdout
(um {"date": "...","count": ...} por linha)
CSV export opcional via --csv output.csv

python3 -m venv env
source env/bin/activate
pip install -r requirements.txt

python src/extract_viewer_history.py "ブルーアーカイブ"

Isso irá:

{"date": "2025-07-01", "count": 9454605}
{"date": "2025-07-02", "count": 9331510}
{"date": "2025-07-03", "count": 8884117}
...

Você pode redirecionar isso para um file:

python src/extract_viewer_history.py "ブルーアーカイブ" > ブルーアーカイブ.jsonl

Use a option --csv para escrever um CSV file enquanto ainda imprime JSON em stdout:

python src/extract_viewer_history.py "ブルーアーカイブ" --csv ブルーアーカイブ.csv

Exemplo de CSV content:

date,count
2025-07-01,9454605
2025-07-02,9331510
2025-07-03,8884117
...

Se você já salvou o article HTML:

python src/extract_viewer_history.py ブルーアーカイブ.html
python src/extract_viewer_history.py ブルーアーカイブ.html --csv ブルーアーカイブ.csv

O script detectará que ブルーアーカイブ.html é um file e fará parse dele em vez de fazer fetch da web.

pip install -r requirements.test.txt
pytest

deactivate

Nenhum rate limiting foi implementado; por favor:
- Use com responsabilidade
- Evite enviar muitas requests em um curto período
Este é um utility script simples, destinado principalmente a personal analysis ou research.