gitextract_tr1bhkp3/ ├── LICENSE ├── README.md ├── generate_documents.py ├── mldoc-indices/ │ ├── chinese.dev │ ├── chinese.test │ ├── chinese.train.1000 │ ├── chinese.train.10000 │ ├── chinese.train.2000 │ ├── chinese.train.5000 │ ├── english.dev │ ├── english.test │ ├── english.train.1000 │ ├── english.train.10000 │ ├── english.train.2000 │ ├── english.train.5000 │ ├── french.dev │ ├── french.test │ ├── french.train.1000 │ ├── french.train.10000 │ ├── french.train.2000 │ ├── french.train.5000 │ ├── german.dev │ ├── german.test │ ├── german.train.1000 │ ├── german.train.10000 │ ├── german.train.2000 │ ├── german.train.5000 │ ├── italian.dev │ ├── italian.test │ ├── italian.train.1000 │ ├── italian.train.10000 │ ├── italian.train.2000 │ ├── italian.train.5000 │ ├── japanese.dev │ ├── japanese.test │ ├── japanese.train.1000 │ ├── japanese.train.10000 │ ├── japanese.train.2000 │ ├── japanese.train.5000 │ ├── russian.dev │ ├── russian.test │ ├── russian.train.1000 │ ├── russian.train.10000 │ ├── russian.train.2000 │ ├── russian.train.5000 │ ├── spanish-latam.dev │ ├── spanish-latam.test │ ├── spanish-latam.train.1000 │ ├── spanish-latam.train.10000 │ ├── spanish-latam.train.2000 │ ├── spanish-latam.train.5000 │ ├── spanish.dev │ ├── spanish.test │ ├── spanish.train.1000 │ ├── spanish.train.10000 │ ├── spanish.train.2000 │ └── spanish.train.5000 └── sampling_rcv2.py