# Ce qui reste à faire 1. transformer en json, xml, csv propres: fait 2. rajouter le hanzi traditionel: fait 3. couper en leçons (fait sur le portable boulot): fait 4. Extraire le vocabulaire et le traiter en json, xml, csv 5. normaliser le pinyin et le hanzi (pinyin syllabique, et hanzi normalisé sans espaces: fait