gitextract_wor7olkb/ ├── .cursor/ │ └── rules/ │ └── weclone-rules.mdc ├── .github/ │ ├── issue-labeler.yml │ ├── weclone-release-event.json │ └── workflows/ │ ├── issue-labeler.yml │ └── tg_release_notification.yml ├── .gitignore ├── .pre-commit-config.yaml ├── LICENSE ├── README.md ├── README_zh.md ├── dataset/ │ ├── eval/ │ │ ├── test_data-en.json │ │ ├── test_data-privacy.json │ │ └── test_data-zh.json │ ├── media/ │ │ └── images/ │ │ └── .gitkeep │ ├── res_csv/ │ │ └── sft/ │ │ └── dataset_info.json │ └── telegram/ │ └── .gitkeep ├── ds_config.json ├── examples/ │ ├── mllm.template.jsonc │ └── tg.template.jsonc ├── pyproject.toml ├── settings.template.jsonc ├── tests/ │ ├── __init__.py │ ├── configs/ │ │ ├── Qwen2.5-VL.jsonc │ │ └── qwen2.5.jsonc │ ├── test_PII.py │ ├── test_full_pipe.py │ └── tests_data/ │ ├── test_PII/ │ │ └── test_0_730.csv │ ├── test_model_data.json │ └── test_person/ │ └── test_0_730.csv └── weclone/ ├── __init__.py ├── cli.py ├── core/ │ ├── PII/ │ │ ├── __init__.py │ │ └── pii_detector.py │ └── inference/ │ ├── offline_infer.py │ └── online_infer.py ├── data/ │ ├── __init__.py │ ├── chat_parsers/ │ │ └── telegram_parser.py │ ├── clean/ │ │ ├── __init__.py │ │ └── strategies.py │ ├── models.py │ ├── qa_generator.py │ ├── strategies.py │ └── utils.py ├── eval/ │ ├── __init__.py │ ├── cli_demo.py │ ├── eval_model.py │ ├── test_model.py │ └── web_demo.py ├── prompts/ │ ├── __init__.py │ └── clean_data.py ├── server/ │ ├── __init__.py │ └── api_service.py ├── train/ │ ├── __init__.py │ ├── export_model.py │ └── train_sft.py └── utils/ ├── __init__.py ├── config.py ├── config_models.py ├── i18n.py ├── length_cdf.py ├── log.py ├── retry.py └── tools.py