Mon travail sur les données du site https://resources.allsetlearning.com/chinese/grammar/.

Eric Streit e02fde2490 reset du dépôt 2 years ago
Anki e02fde2490 reset du dépôt 2 years ago
Couvertures e02fde2490 reset du dépôt 2 years ago
Epub e02fde2490 reset du dépôt 2 years ago
Liste-mots-formatés e02fde2490 reset du dépôt 2 years ago
MD e02fde2490 reset du dépôt 2 years ago
Programmes e02fde2490 reset du dépôt 2 years ago
.gitignore e02fde2490 reset du dépôt 2 years ago
README.md e02fde2490 reset du dépôt 2 years ago

README.md

Grammar Wiki

Progression:

  • Grammar A1: (vocabulary list, phrases list, audio and Anki packages) 100%
  • Grammar A2: (vocabulary list, phrases list, audio and Anki packages) 100% (epub needs some formatting: basic formatting done: 100%, total: 90%
  • Grammar B1: wip
  • Grammar B2: wip

cover

Vous trouverez là mes travaux sur les données du site Grammar Wiki.

J'ai récupéré les données pour refaire mes propres ebooks au format epub, et créer des listes de travail.

Ces listes sont au format .CSV; j'ai ajouté les textes en écriture traditionnelle.

À partir de ces listes, j'ai récupéré le vocabulaire utilisé dans les phrases et associé les sons correspondants. pour cela, j'ai utilisé les sources audio du site Shtooka. J'ai une copie de ces données sur mon site Yojik.

Les sons manquants ont été générés gràce à "text to speech" de Google Tm (avec un script).

J'ai généré également la prononciation des phrases car il n'ay vavait pas d'audio correspondante.

Vous trouverez donc tout le matériel utilisé, les fichiers .cvs, l'audio, les programmes javascript pour compléter ces fichiers ainsi que les scripts permettant de récupérer les sons audio à partir des api de Google Tm.

Les données sont disponibles sous plusieurs formats: .csv, json et xml ainsi que texte dans certians cas (les sons à produire, par exemple.)

Les programmes de traitement on été écrits en javascript/nodejs.

Des paquets Anki ont été créés pour le niveau A1 et A2, pour les phrases et le vocabulaire extrait des phrases grâce à une extension Anki (et retravaillé ensuite.)